python中提取网页特定内容4的正则表达式如何写

<td>
Microsoft Windows 8 null<br/>
Microsoft Windows Server 2012 null<br/>
</td>
<td>
计算机科学 <br/>
<br/>
写作文档<br/>
</td>
<td><span style="font-weight: bold;color: #014ABB;" >ID：</span>111111</td>
网页源码中有很多这种结构的代码我只想提取如 Microsoft Windows 8 null 计算机科学等
不想要<td></td>中有<span>...</span>中的任何内容
我写的正则是r'<td>\s*(.*|[\u4e00-\u9fa5]*)\s*</td>') 请教各位大神这个正则该如何修改

举报该问题

第1个回答 2014-01-13

python有个进门解析html的包BeautifulSoup，用它要比用正则方便很多

第2个回答 2014-01-13

<td>(?!<span)\s*(.*?)<\/td>追问

span问题解决了，但中只要有的都没有提取出来这是为什么今天上午改了好久都没有弄出来求大神解答下

追答

你说的是你的正则还是我的正则？刚才忘告诉你，我的正则需要用单行模式，也就是使用修饰符s。

追问

(?! 那这个正则是不是需要开启多行模式才能选出中的（计算机科学写作文档）内容，能否帮忙修改下。3q...

追答

多行模式和单行模式不是对应关系，名字像是历史原因。你修改的这个正则在我这打开单行模式以后就可以达到要求了。你是不是没有匹配全部啊？
打开单行模式类似下面
re.findall('^From', 'Reciting \nFrom Memory', re.S)

追问

不太懂能否帮忙修改下。
r1=re.compile(r'(?!')
m=re.findall(r1,s)

追答

r1=re.compile(r'(?!',re.S)
但是好像中文有编码问题，我不会了

本回答被提问者采纳

相似回答

python正则表达式提取文本答：python正则表达式提取文本有两种方法：方法一：eight_date = re.compile(r正则式)str1 = re.search(eight_date, 文本内容).group(0)方法二：str1 = re.search(r正则式,文本内容).group(0)

python正则表达式提取网页信息答：(?<=\).*(?=()|(\s))

如何用Python提取网页标签中的文本信息?答：一、使用内置的正则表达式 Python代码 import reregex1 = r"]+?>(.+?)"regex2 = r"/span>([\s\S]+?)<"html = ("\n""1、以下哪条不是VRRP双主可能的原因\n""")result_a = re.search(regex1, html).group(1)result_span = re.search(regex2, html).group(1)print(result_a...

Python 正则表达式如何提取指定的内容?答：s = '颜色分类：红色尺码：M 主要颜色：橘色尺寸：S 颜色分类：黄色尺码：L'text = 'asdasdasasd 红色M 46546546'c = re.findall('：(\w+?) .*?：([A-Z])', s)for x in c:if text.find(''.join(x)) > -1:print(x)...

如何抓取网页上的数据(如何使用Python进行网页数据抓取)答：beautifulsoup是一个用于解析HTML和XML文档的Python库，可以方便地从网页中提取所需的数据。下面是一个使用beautifulsoup库解析网页内容的示例代码：```python frombs4importBeautifulSoup soup=BeautifulSoup(html,"html.parser")title=soup.title.text print(title)```在这个示例中，我们首先导入了BeautifulSoup...

正则提取中间的内容?答：Dialogue: 开头，后面跟着任意字符，然后以一个逗号结尾的部分。它会提取括号中的内容，即【Default9】。例如，在使用 Python 的 re 模块时，可以这样使用这个正则表达式：运行上面的代码，会输出：请注意，这里的正则表达式并不能匹配所有情况，如果你想要更精确地匹配，可能需要修改正则表达式。

大家正在搜

python提取字符串指定内容提取函数名python正则 excel正则表达式提取正则表达式提取字符串后判断 python提取特定字符串 java正则表达式详解 python提取字符串正则表达式生成正则表达式提取字符串

python怎么根据正则表达式提取指定的内容

python怎么根据正则表达式提取指定的内容

python怎么根据正则表达式提取指定的内容

Python 正则表达式如何提取指定的内容？

Python中如何用正则表达式获取指定内容

python正则表达式,如何选取网页中一部分字符

python 如何提取特定字符中间的内容

python 正则表达式如何截取字符串中间的内容