用正则表达式提取html代码中的table的内容的程序:
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class L {
public static void main(String[] args) {
String s="<font size=\"-1\" color=\"green\">\"作者:\"<a href=\"
http://my.tianya.cn/name/芷蓝花若\" target=\"_blank\" _userinfo=\"31029210,芷蓝花若\" class=\"lnkchanged\">芷蓝花若</a>";
String regex="\\>(.+?)\\<";
Pattern p=Pattern.compile(regex);
Matcher m=p.matcher(s);
while(m.find()){
System.out.println(m.group(1));
}
}
}
运行结果:
"作者:"
芷蓝花若
正则表达式:
\\>(.+?)\\<