• 技术文章 >Web开发 >JavaScript

    jsoup解析html

    宋雪维宋雪维2021-01-06 09:14:29原创2975

    之前介绍过jsoup是一款Java的html解析工具(https://www.py.cn/web/js/22613.html),本文小编就向大家带来解析一个HTML文档和解析一个HTML片段的方法。解析一个HTML文档可以从URL获取解析,解析一个HTML片段下载jar包:jsoup-1.11.3.jar。具体内容就在本文。

    1、从URL获取解析

    1

    2

    3

    connect(String url)方法创建一个新的 Connection,和get()取得和解析一个HTML文件。

    Document doc = Jsoup.connect("http://example.com/").get();

    String title = doc.title();

    如果从该URL获取HTML时发生错误,便会抛出 IOException,应适当处理。

    2、下载jar包:jsoup-1.11.3.jar

    1

    2

    3

    4

    5

    6

    7

    8

    9

    10

    11

    12

    import org.jsoup.Jsoup;

    import org.jsoup.nodes.Document;

    import org.jsoup.nodes.Element;

     public class BodyFragmentTest {

        public static void main(String[] args) {

    String html = "<div><p>这是一个文本。</p></div>";

    Document doc = Jsoup.parseBodyFragment(html);

    Element body = doc.body();

    System.out.println(body);

    }

      

    }

    输出

    1

    2

    3

    4

    5

    <body>

     <div>

      <p>这是一个文本。</p>

     </div>

    </body>

    第一种方法是解析一个HTML文档,而第二种方法是解析一个HTML文档,大家注意使用哦~

    专题推荐:jsoup解析html
    上一篇:js数组去重set 下一篇:js数组去重并升序

    相关文章推荐

    • Python中shodan模块是什么?• 如何使用Python的telnetlib模块?• python pexpect模块是什么?• python中的binascii模块是什么?• Python中PIL库有何用法?

    全部评论我要评论

    © 2021 Python学习网 苏ICP备2021003149号-1

  • 取消发布评论
  • 

    Python学习网