python怎么读取word文件_如何使用python的python-docx模块读取Word文档

python是个很有趣的语言,可以在cmd命令窗口运行,还有很多的功能强大的模块。这篇经验告诉你如何利用python的python-docx模块读取Word文档。

工具/原料

windows系统电脑一台

python软件

方法/步骤

1

第一,先安装python-docx模块。打开cmd命令窗口,输入pip install python-docx,就可通过管道安装python-docx模块。

python怎么读取word文件_如何使用python的python-docx模块读取Word文档_第1张图片

python怎么读取word文件_如何使用python的python-docx模块读取Word文档_第2张图片

python怎么读取word文件_如何使用python的python-docx模块读取Word文档_第3张图片

2

第二,进入cmd命令窗口,输入python,进入python交互环境

python怎么读取word文件_如何使用python的python-docx模块读取Word文档_第4张图片

3

第三,引入python-docx模块,此处要注意,虽然安装模块是python-docx模块,但要使用:“ import docx ”引入此模块。

引入os模块,通过os.getcwd()获取当前工作目录,并将一份001.docx文档放在该工作目录下。

python怎么读取word文件_如何使用python的python-docx模块读取Word文档_第5张图片

python怎么读取word文件_如何使用python的python-docx模块读取Word文档_第6张图片

4

第四,使用docx.document()函数打开word文档,并使用len()函数得出此文档的段落数量。

python怎么读取word文件_如何使用python的python-docx模块读取Word文档_第7张图片

5

第五,使用doc.paragraphs[i].text方法获取第一段和第二段的文字。

python怎么读取word文件_如何使用python的python-docx模块读取Word文档_第8张图片

6

第六,获取word文档的全部内容,这里使用了一个循环语句:

for i in range(337):

doc.paragraphs[i].text

其中,337是通过len(doc.paragraphs)得到。

python怎么读取word文件_如何使用python的python-docx模块读取Word文档_第9张图片

END

注意事项

空格数量要正确,否则程序不会编译运行。

经验内容仅供参考,如果您需解决具体问题(尤其法律、医学等领域),建议您详细咨询相关领域专业人士。

举报作者声明:本篇经验系本人依照真实经历原创,未经许可,谢绝转载。

展开阅读全部

你可能感兴趣的:(python怎么读取word文件_如何使用python的python-docx模块读取Word文档)