如何通过C#正则表达式抓取表格标签中的所有HTML代码？

代码如上图，且网页中只有一个这种表格，请问如何通过正则表达式将其筛选出来？

第1个回答 2012-09-28

你是要抓取什么
抓取<td>xxx</td>里面xx部分还是什么
如果是的话
正则匹配

首先获取到这个table的内容
c#正则 "<tbody>.*?</tbody>"
然后用"</td>(.*?)</td>"匹配上个正则匹配到的内容
最后遍历获取的<td>
用字符串函数去掉<td>和</td>就是中间的内容了追问

和之间所有的代码

追答

匹配和的话用 ".*?"就行了
然后得到的字符串包括这些也在里面

本回答被网友采纳

第2个回答 2012-09-29

你要获取table里的html么不包括tr tbody这样的标签吧追问

tbody中的所有HTML代码，包括tr td等

追答

(?.*)
获取组 value的值就行了

本回答被提问者采纳

相似回答

求一条c# 正则表达式,来获取HTML标签的内容答：按格式来.. 匹配位于 <div> <p> 或者 </p> </div> 或者 </p> <p> 或者 <div> </div> 之间的不包含尖括号符号的内容.不过这样匹配的文本不在同一个match里, 但是是确实可行的.(?<=<div>)[^><]*(?=</div>)|(?<=<div>)[^><]*(?=<p>)|(?<=</p>)[^><]*(?=</d...

C# 正则表达式提取嵌套的html代码答：Regex rg = new Regex(@"<(?<HtmlTag>[\w]+)[^>]*\s[iI][dD]=(?<quot>('|""))idname(\k<quot>)[^>]*>((?<Nested><\k<HtmlTag>[^>]*>)|</\k<HtmlTag>>(?<-Nested>)|.*?)*</\k<HtmlTag>>"，RegexOptions.IgnoreCase);测试通过。idname换成你的id ...

C#使用正则表达式读取HTML指定内容答：Regex.Match(wangye, @"<div class=""t_777"">(.+?)<").Groups[1].Value;

c# 通过正则表达式提取html里的内容答：pattern = @"<h2>(?<title>.*?)</h2>.*(\r\n.*)*<a\shref=""(?<url>.*?)""";var match = System.Text.RegularExpressions.Regex.Match(html, pattern);if (match.Success){ var title = match.Groups["title"].Value; var url = match.Groups["url"].Value;} ...

c#中怎么使用正则表达式匹配多个html标签内容答：string str = "<td>鹏哥Csdn免积分下载器</td>\r\n<td>V1.0</td>\r\n<td>2014-10-23</td>\r\n</tr>\r\n<td>QQ靓号申请助手</td>\r\n<td>V1.0</td>\r\n<td>2014-10-23</td>";List<string> list = new List<string>();foreach (Match m in Regex.Matches(str, ...

...个正则表达式来提取下面的HTML当中的 textarea标签当中的所有...答：<textarea[^>]*>([^<]+)</textarea> 取第一个分组的内容，就是你想要的

大家正在搜

获取xml标签值的正则表达式在标签中写正则表达式正则表达式匹配标签正则表达式怎么用 regex正则表达式正则表达式详解正则表达式点正则表达式排除正则表达式api