• 技术文章 >常见问题 >Python常见问题

    python怎么解析网页数据

    silencementsilencement2019-10-16 10:39:47原创2513

    python网页解析器

    1、常见的python网页

    常见的python网页解析工具有:re正则匹配、python自带的html.parser模块、第三方库BeautifulSoup(重点学习)以及lxm库。

    2、常见网页解析器分类

    以上四种网页解析器,是两种不同类型的解析器:

    (1)模糊匹配

    re正则表达式即为字符串式的模糊匹配模式;

    (2)结构化解析

    BeatufiulSoup、html.parser与lxml为“结构化解析”模式,他们都以DOM树结构为标准,进行标签结构信息的提取。()(3)结构化解析

    我们在了解什么是结构化解析之前,需要先了解下什么是DOM树这个概念。

    DOM树解释:即文档对象模型(Document Object Model),其树形标签结构,而所谓结构化解析,就是网页解析器它会将下载的整个HTML文档当成一个Doucment对象,然后在利用其上下结构的标签形式,对这个对象进行上下级的标签进行遍历和信息提取操作。

    更多学习内容,请点击Python学习网

    专题推荐:解析器
    上一篇:python怎么链接数据库 下一篇:python需要分号吗

    相关文章推荐

    • Python3 XML解析

    全部评论我要评论

    © 2021 Python学习网 苏ICP备2021003149号-1

  • 取消发布评论
  • 

    Python学习网