• 技术文章 >Python技术 >Python基础教程

    python如何在word中读取表格内容

    小妮浅浅小妮浅浅2021-09-17 09:28:33原创13246

    word文件看起来很复杂,不方便结构化。事实上,word文档中大概有几种内容:paragraph(段落)、table(表格)、character(字符)。我现在要分析的word文档基本都是段落和表格。本文主要讲述从word中分析表格,并将表格信息结构化的方法。

    1、为了使用python解析word文件,可以使用包docx,首先需要在python中安装它。

    pip install python-docx

    2、安装后,就可以读取word文件。

    importdocx
    fn= r'D:\长恨歌.docx'doc=docx.Document(fn)#按段落读取全部数据
    for paragraph indoc.paragraphs:print(paragraph.text)#按表格读取全部数据
     
    for table indoc.tables:for row intable.rows:for cell inrow.cells:print(cell.text)
     
    table_num=len(doc.tables)#获取文档的表格个数
     
    print(table_num)
     
    table_0=doc.tables[0]#选取第一个表
     
    table_rows =len(table_0.rows)#获取第一个表的行数
     
    print(table_rows)
     
    tab=doc.tables[0].rows[0].cells[0]#获取第一张表第一行第一列数据
     
    print(tab.text)
     
    par= doc.paragraphs[2]#读取第三段数据
     
    print(par.text)

    以上就是python在word中读取表格内容的方法,希望对大家有所帮助。更多Python学习指路:python基础教程

    本文教程操作环境:windows7系统、Python 3.9.1,DELL G3电脑。

    专题推荐:python word 表格
    上一篇:python中nonlocal关键字是什么 下一篇:python web框架能够实现的功能

    相关文章推荐

    • Python如何搭建gRPC服务• Python lambda的速写用法• Python如何实现打字训练的程序• Python列表推导式如何使用• python中pyquery初始化的方法• python中pyquery的CSS选择器用法• python GUI编程有哪些模板• python拼音模块的特性• python中文生僻字的识别• python字符串常用技巧的总结• python settings路由配置的解决• python如何实现邮件的收发• python中nonlocal关键字是什么

    全部评论我要评论

    © 2021 Python学习网 苏ICP备2021003149号-1

  • 取消发布评论
  • 

    Python学习网