pdf文件转word文件——Python工具之pdf2docx库的安装+使用+问题解决

pdf文件转word文件——Python工具之pdf2docx库的安装+使用+问题解决安装第三方库的时候 记得注意 如果新建了虚拟环境 需要将库安装到你的虚拟环境下 否则会导致 import 导入报错 因为你的虚拟环境中没有你安装的库 你把库安装到默认环境中 例如 Anaconda 的 ba

大家好,欢迎来到IT知识分享网。

#创作灵感#

偶尔在网上看到一篇文章《太牛了!只需2行代码,轻松将PDF转换成Word!》,知道了pdf2docx这个库,于是试了一下实现效果,感觉还行,记录下来。上面文章写的有些杂乱错误,仅供参考。

安装第三方库的时候,记得注意,如果新建了虚拟环境,需要将库安装到你的虚拟环境下,否则会导致import导入报错,因为你的虚拟环境中没有你安装的库,你把库安装到默认环境中(例如Anaconda的base环境中),在新建的虚拟环境中,是无法使用的,除非解释器使用默认的解释器。

环境配置:我使用的是Anaconda安装的Python3.10,Pycharm作为编辑器,并使用Pycharm在Anaconda中新建了虚拟环境,如下图。

pdf文件转word文件——Python工具之pdf2docx库的安装+使用+问题解决

安装pdf2docx库:在上图中点击Anaconda图标,使用Conda软件包管理器进行安装,点击+号,在弹出的对话框中输入pdf2docx进行搜索,安装。

pdf文件转word文件——Python工具之pdf2docx库的安装+使用+问题解决

遇到报错:注意文件名不要和库名重复,否则会报错。例如我最开始把文件命名为pdf2docx.py,结果一直报错,ImportError: cannot import name ‘Converter’ from partially initialized module ‘pdf2docx’ (most likely due to a circular import) 。

pdf文件转word文件——Python工具之pdf2docx库的安装+使用+问题解决

pdf文件转word文件——Python工具之pdf2docx库的安装+使用+问题解决

修改错误:将文件名改为pdf2word,错误消失,并成功将pdf文的转换为docx文件。

实现代码:代码中start=0是pdf转换的起始页,end=123是结束页,如果不填这两项就是默认从第一页至最后一页。

from pdf2docx import Converter pdf_file = 'D:\pythonProject\pythonExploring\P0.pdf' docx_file = 'D:\pythonProject\pythonExploring\P0.docx' conv = Converter(pdf_file) conv.convert(docx_file, start=0, end=123) conv.close()

转换效果:对比了原pdf文件和转换后生成的docx文件内容,准确率很高。

pdf界面

pdf文件转word文件——Python工具之pdf2docx库的安装+使用+问题解决

word界面

pdf文件转word文件——Python工具之pdf2docx库的安装+使用+问题解决

参考文章:

用python把pdf文件转换为word文件 | pdf2docx 安装 + 快速使用_python pdf2docx-CSDN博客6行python代码使用pdf2docx模块Converter对象将pdf转换为docx文件_pdf2docx converter-CSDN博客

免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://haidsoft.com/132074.html

(0)
上一篇 2025-08-03 14:20
下一篇 2025-08-03 14:33

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注微信