技术文章 >Python技术 >Python爬虫

python怎么爬取js请求

silencement

silencement2020-02-14 18:05:28原创

网页的新闻在HTML源码中一条都找不到，全是由JS动态生成加载。

遇到这种情况，我们应该如何对网页进行爬取呢？有两种方法：

1、从网页响应中找到JS脚本返回的JSON数据；

2、使用Selenium对网页进行模拟访问

从网页响应中找到JS脚本返回的JSON数据

即使网页内容是由JS动态生成加载的，JS也需要对某个接口进行调用，并根据接口返回的JSON数据再进行加载和渲染。

所以我们可以找到JS调用的数据接口，从数据接口中找到网页中最后呈现的数据。

推荐学习《Python教程》。

专题推荐：爬虫

上一篇：scapy支持python3.6么下一篇：如何用Python爬取网页数据

相关文章推荐

相关课程推荐

全部评论我要评论

© 2021 Python学习网苏ICP备16018502号-40

取消发布评论

Python学习网