asp.ent、C# 如何用正则表达式 把一段字符串形式的静态html的table表里的每个td里的值取出来,并插入数组

就是有一段字符串,string s="<table><tr><td>1</td><td>2</td>...</tr>...</table>"(放到html里就是,总共N行9列的表格)。我现在需要用正则表达式,逐个把字符串里的每个<td></td>之间的值取出来,对应插入一个N行9列的数组里。
数组的行数 和 字符里 <tr>的 数量一致

System.Collections.Generic.List<System.Collections.Generic.List<string>> sum = new System.Collections.Generic.List<System.Collections.Generic.List<string>>();
string str = "<table><tr><td>1</td><td>2</td></tr><tr><td>3</td><td>4</td></tr></table>";
var s1 = System.Text.RegularExpressions.Regex.Matches(str, @"<tr>(.+?)</tr>");
foreach (System.Text.RegularExpressions.Match m1 in s1)
{
var s2 = System.Text.RegularExpressions.Regex.Matches(m1.Groups[1].Value, @"<td>(.+?)</td>");
var lst = new System.Collections.Generic.List<string>();
foreach (System.Text.RegularExpressions.Match m2 in s2)
{
lst.Add(m2.Groups[1].Value);
}
sum.Add(lst);
}追问

哥们儿,非常感谢!关于正则这块,本人白痴。能不能再修改下,某些之间还夹杂着标签的,如果遇到有的就取里面的内容

温馨提示:答案为网友推荐,仅供参考
第1个回答  2012-07-22
看了楼上的仁兄,不为一种办法。
我也给个解决方法,用Xml.

string s="<table><tr><td>1</td><td>2</td>...</tr>...</table>";
XmlDocument xmlDoc = new XmlDocument();
xmlDoc.LoadXml(s);
var sum = xmlDoc.SelectNodes("//td").Cast<XmlNode>().Select(p=>p.innerText).ToArray();本回答被网友采纳