使用java怎么读取html文件内容

如题所述

第1个回答 2017-11-06

java可以使用jsoup、htmlparser等工具进行html的读取和解析，以下是详细说明：

1、jsoup 是一款 Java 的HTML 解析器，可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API，可通过DOM，CSS以及类似于JQuery的操作方法来取出和操作数据。据说它是基于MIT协议发布的。
jsoup的主要功能如下：
从一个URL，文件或字符串中解析HTML；
使用DOM或CSS选择器来查找、取出数据；
可操作HTML元素、属性、文本；
示例代码：
Document doc = Jsoup.parse(input, "UTF-8", "http://www.dangdang.com");
Element content = doc.getElementById("content");
Elements links = content.getElementsByTag("a");
for (Element link : links) {
String linkHref = link.attr("href");
String linkText = link.text();
}本回答被提问者采纳

相似回答

java怎样读取html文件答：首先看roster.html:java代码：import java.io.BufferedReader;import java.io.File;import java.io.FileReader;import java.io.IOException;import jxl.Workbook;import jxl.write.Label;import jxl.write.WritableCellFormat;import jxl.write.WritableFont;import jxl.write.WritableSheet;import jxl.write.Writa...

java程序怎么读取html网页?答：一、使用java.net包下的URL类，可以将一个网页（链接）封装成一个URL对象。二、URL对象有一个openStream()方法，使用该方法可以获取该网页的输入流，我们可以通过读取输入流的方式获得网页的内容，并通过输出流写入HTML文件中。补充:步骤：1.通过URL对象的openStream()方法获得网页的字节输入流。2.为...

java获取html答：Java访问网络url，获取网页的html代码方式一：一是使用URL类的openStream()方法：openStream()方法与制定的URL建立连接并返回InputStream类的对象，以从这一连接中读取数据；openStream()方法只能读取网络资源。二是使用URL类的openConnection()方法：openConnection()方法会创建一个URLConnection类的对象，此...

如何使用java查看html文件的源代码答：使用JAVA程序读取HTML代码还是访问链接？如果是只读取HTML文件的话，可以直接用FileReader就可以了。如果是通过访问URL获取HTML代码的话可以使用HttpClient。

求JAVA读取html文件table里面的内容!答：//获取html转换成String String s; String AllContent=""; while((s=br.readLine())!=null) { AllContent=AllContent+s; } //使用后HTML Parser 控件 Parser myParser; NodeList nodeList = null; myParser =Parser.createParser(AllContent, "utf-8"); Node...

如何用Java正则表达式提取html中所有的文本和超链接,然后分别存入txt文件...答：您好，您这样：提取链接的标签文本和url地址将Html文件代码传入string参数s，代码如下：private void Reg_A_Href(string s){ string str = s;Regex re = new Regex(@"<a[^>]+href=\s*(?:'(?<href>[^']+)'|""(?<href>[^""]+)""|(?<href>[^>\s]+))\s*[^>]*>(?<text>...

大家正在搜

java读取html文件 java读取html内容替换 java读取文件内容代码 java调用html文件 java获取html内容 java读取html java代码打开html文件 java中的html如何获取 Java获取html