
之前介绍过jsoup是一款Java的html解析工具(https://www.py.cn/web/js/22613.html),本文小编就向大家带来解析一个HTML文档和解析一个HTML片段的方法。解析一个HTML文档可以从URL获取解析,解析一个HTML片段下载jar包:jsoup-1.11.3.jar。具体内容就在本文。
1、从URL获取解析
1 2 3 | connect(String url)方法创建一个新的 Connection,和get()取得和解析一个HTML文件。
Document doc = Jsoup.connect( "http://example.com/" ).get();
String title = doc.title();
|
如果从该URL获取HTML时发生错误,便会抛出 IOException,应适当处理。
2、下载jar包:jsoup-1.11.3.jar
1 2 3 4 5 6 7 8 9 10 11 12 | import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
public class BodyFragmentTest {
public static void main(String[] args) {
String html = "<div><p>这是一个文本。</p></div>" ;
Document doc = Jsoup.parseBodyFragment(html);
Element body = doc.body();
System.out.println(body);
}
}
|
输出
1 2 3 4 5 | <body>
<div>
<p>这是一个文本。</p>
</div>
</body>
|
第一种方法是解析一个HTML文档,而第二种方法是解析一个HTML文档,大家注意使用哦~