如何用用正则表达式提取html代码中的table的一些东西,详见下面

我想把下面这张图片中的
“作者” 和“芷蓝花若” 提取打印出来。
请问正则表达式怎么写呢?
不好意思,忘了上图

用正则表达式提取html代码中的table的内容的程序:
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class L {
public static void main(String[] args) {

String s="<font size=\"-1\" color=\"green\">\"作者:\"<a href=\"http://my.tianya.cn/name/芷蓝花若\" target=\"_blank\" _userinfo=\"31029210,芷蓝花若\" class=\"lnkchanged\">芷蓝花若</a>";
String regex="\\>(.+?)\\<";
Pattern p=Pattern.compile(regex);
Matcher m=p.matcher(s);
while(m.find()){
System.out.println(m.group(1));
}
}
}
运行结果:
"作者:"
芷蓝花若
正则表达式:
\\>(.+?)\\<
温馨提示:答案为网友推荐,仅供参考
第1个回答  2012-07-22
html结构跟 数据没有分开。这么提取感觉没有意义。
相似回答