之前介绍过jsoup是一款Java的html解析工具(https://www.py.cn/web/js/22613.html),本文小编就向大家带来解析一个HTML文档和解析一个HTML片段的方法。解析一个HTML文档可以从URL获取解析,解析一个HTML片段下载jar包:jsoup-1.11.3.jar。具体内容就在本文。
1、从URL获取解析
connect(String url)方法创建一个新的 Connection,和get()取得和解析一个HTML文件。 Document doc = Jsoup.connect("http://example.com/").get(); String title = doc.title();
如果从该URL获取HTML时发生错误,便会抛出 IOException,应适当处理。
2、下载jar包:jsoup-1.11.3.jar
import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.nodes.Element; public class BodyFragmentTest { public static void main(String[] args) { String html = "<div><p>这是一个文本。</p></div>"; Document doc = Jsoup.parseBodyFragment(html); Element body = doc.body(); System.out.println(body); } }
输出
<body> <div> <p>这是一个文本。</p> </div> </body>
第一种方法是解析一个HTML文档,而第二种方法是解析一个HTML文档,大家注意使用哦~