如何通过C#正则表达式抓取表格标签中的所有HTML代码?

代码如上图,且网页中只有一个这种表格,请问如何通过正则表达式将其筛选出来?

第1个回答  2012-09-28
你是要抓取什么
抓取<td>xxx</td>里面xx部分还是什么
如果是的话
正则匹配

首先获取到这个table的内容
c#正则 "<tbody>.*?</tbody>"
然后用"</td>(.*?)</td>"匹配上个正则匹配到的内容
最后遍历获取的<td>
用字符串函数去掉<td>和</td>就是中间的内容了追问

和之间所有的代码

追答

匹配和的话 用 ".*?"就行了
然后得到的字符串包括这些也在里面

本回答被网友采纳
第2个回答  2012-09-29
你要获取table里的html么 不包括tr tbody这样的标签吧追问

tbody中的所有HTML代码,包括tr td等

追答

(?.*)
获取组 value的值就行了

本回答被提问者采纳
相似回答