本文以word表格数据的批量提取为例,简单介绍了如何使用python将指定内容输出为excel,有兴趣的朋友可以试试:
01安装依赖包批量提取word内容并导出到excel涉及到word和excel操作,所以需要专门的第三方模块——python-docx和openpyxl,其中python-docx专用于读写word文档,openpyxl专用于读写excel表格。如果你安装了它,你可以直接输入命令"pip安装python-docxopenpyxl"在cmd窗口中:
02批量提取word文档内容依赖包安装完成后,就是批量提取word内容。这里以word文档中表格数据的批量提取为例。测试代码如下,非常简单。基本思路是先加载word文档,然后读取所有表格数据,最后用列表列表保存。当然也可以提取文字段落等内容,都是可以的。官方文件有详细说明:
从excel表中批量提取word数据完成后,提取的数据写入excel表中。测试代码如下。基本思路是先新建一个excel文件,然后将提取的表格数据依次写入相应的单元格,最后保存。这里,我在每个word表格之间留出了两行空白,以便于查看数据。当然,你也可以使用其他模块来操作excel,比如熊猫和xlwt,只要能实现相关功能即可:
至此,我们已经用python完成了word中指定内容的批量提取,并输出为excel。总的来说,整个过程很简单。首先提取word内容,然后写入exc
使用“提取”命令,选择线,然后选择图元线。