• 技术文章 >Web开发 >JavaScript

    jsoup解析html

    宋雪维宋雪维2021-01-06 09:14:29原创2694

    之前介绍过jsoup是一款Java的html解析工具(https://www.py.cn/web/js/22613.html),本文小编就向大家带来解析一个HTML文档和解析一个HTML片段的方法。解析一个HTML文档可以从URL获取解析,解析一个HTML片段下载jar包:jsoup-1.11.3.jar。具体内容就在本文。

    1、从URL获取解析

    connect(String url)方法创建一个新的 Connection,和get()取得和解析一个HTML文件。
    Document doc = Jsoup.connect("http://example.com/").get();
    String title = doc.title();

    如果从该URL获取HTML时发生错误,便会抛出 IOException,应适当处理。

    2、下载jar包:jsoup-1.11.3.jar

    import org.jsoup.Jsoup;
    import org.jsoup.nodes.Document;
    import org.jsoup.nodes.Element;
     public class BodyFragmentTest {
        public static void main(String[] args) {
    String html = "<div><p>这是一个文本。</p></div>";
    Document doc = Jsoup.parseBodyFragment(html);
    Element body = doc.body();
    System.out.println(body);
    }
     
    }

    输出

    <body>
     <div>
      <p>这是一个文本。</p>
     </div>
    </body>

    第一种方法是解析一个HTML文档,而第二种方法是解析一个HTML文档,大家注意使用哦~

    专题推荐:jsoup解析html
    上一篇:js数组去重set 下一篇:js数组去重并升序

    相关文章推荐

    • Python中shodan模块是什么?• 如何使用Python的telnetlib模块?• python pexpect模块是什么?• python中的binascii模块是什么?• Python中PIL库有何用法?

    全部评论我要评论

    © 2021 Python学习网 苏ICP备2021003149号-1

  • 取消发布评论
  • 

    Python学习网