• 技术文章 >Python技术 >Python基础教程

    Python中怎样把html网页转换成pdf

    2021-04-15 10:33:41原创4533
    当我们看到一篇好文章时,难免会有想保存的想法,但是会存在作者删除了文章或者链接丢失的情况。所以今天小编教大家如何在Python中把html网页转换成pdf。

    Python里面有个模块是pdfkit,他可以帮咱们把一个html(也就是一个网页)变成一个pdf文件。

    pdfkit是Python对wkhtmltopdf这个把网页转成pdf工具的一个封装,所以咱们必须得先安装一个wkhtmltopdf,这个工具的下载网站是:https://wkhtmltopdf.org/downloads.html,根据自己的操作系统下载对应的版本即可。

    ps:这里要记住安装目录啊,下面要用到它,不要忘记它的安装目录~

    上面说到了pdfkit这个模块,这个是第三方模块,需要安装,使用pip安装即可。

    pip install pdfkit

    pdfkit它给咱们提供了很多功能,可以给它一个 url,他会自动获取 url 里面的内容,帮你保存好,也可以给他一个 html 文件,也可以保存,也可以给他一个字符串,也可以保存成 pdf。

    下面是代码:

    import pdfkit url='https://www.cnblogs.com/sriba/p/8043294.html'#一篇博客的url confg = pdfkit.configuration(wkhtmltopdf='C:\Python35\wkhtmltopdf.exe') #这里指定一下wkhtmltopdf的路径,这就是我为啥在前面让记住这个路径 pdfkit.from_url(url, 'jmeter_下载文件.pdf',configuration=confg) # from_url这个函数是从url里面获取内容 # 这有3个参数,第一个是url,第二个是文件名,第三个就是khtmltopdf的路径 #pdfkit.from_file('my.html', 'jmeter_下载文件2.pdf',configuration=confg) # from_file这个函数是从文件里面获取内容 # 这有3个参数,第一个是一个html文件,第二个是文生成的pdf的名字,第三个就是khtmltopdf的路径 html='''title
    content
    '''#这个html是我从一个页面上拷下来的一段,也可以 #pdfkit.from_string(html, 'jmeter_下载文件3.pdf',configuration=confg) # from_file这个函数是从一个字符串里面获取内容 # 这有3个参数,第一个是一个字符串,第二个是文生成的pdf的名字,第三个就是khtmltopdf的路径

    学会了的小伙伴以后再也不怕喜欢的文章被删除或链接丢失啦。更多Python学习推荐:PyThon学习网教学中心

    (推荐操作系统:windows7系统、Python 3.9.1,DELL G3电脑。)

    专题推荐:pdf html网页 python
    上一篇:python程序如何实现接口封装、请求、调用? 下一篇:了解搭建selenium安装以及配置环境

    相关文章推荐

    • 进阶PDF,就用Python(pdfminer.six和pdfplumber模块)• Python如何读取pdf中的图片• Python教程:pdfplumber提取pdf中的表格数据• 如何用Python把pdf转换成word

    全部评论我要评论

    © 2021 Python学习网 苏ICP备2021003149号-1

  • 取消发布评论
  • 

    Python学习网