首页教程正文内容

实操练习—批量处理：PDF文件转为word文件

教程

更新时间：2026-03-07 20:52:2728

admin管理员组
文章数量:1130349

用途：批量提取pdf中的文本信息

主要使用库：pdfplumber、os、docx

第一步：定义函数：输入PDF文件的文件路径，即可获取文本

# 导入PDF所在的文件路径，返回文本信息
import pdfplumber
 
def pdf2txt(pdf_path):
    txt = ''
    with pdfplumber.open(pdf_path) as pdf:
        for page in pdf.pages:
            txt = txt + page.extract_text()
    return txt

第二步：定义函数：获取文件夹中的文件路径，并保存在列表，需输入的是PDF所在文件夹

#获取文件夹中的文件位置
import os

def get_file_paths(folder):
    file_paths = []
    for root, dirs, files in os.walk(folder):
        for file in files:
            file_path = os.path.join(root, file)
            file_paths.append(file_path)
    return file_paths

第三步：填写保存PDF文件的文件夹路径，获取PDF文件路径

# 填写要提取文件路径的文件夹路径
folder_path = r"文件路径"
file_paths = get_file_paths(folder_path)
print(file_paths)

第四步：

# 导入docx库（主要）
from docx import Document
# 其他用于设置字体等信息所需

用途：批量提取pdf中的文本信息

主要使用库：pdfplumber、os、docx

第一步：定义函数：输入PDF文件的文件路径，即可获取文本

# 导入PDF所在的文件路径，返回文本信息
import pdfplumber
 
def pdf2txt(pdf_path):
    txt = ''
    with pdfplumber.open(pdf_path) as pdf:
        for page in pdf.pages:
            txt = txt + page.extract_text()
    return txt

第二步：定义函数：获取文件夹中的文件路径，并保存在列表，需输入的是PDF所在文件夹

#获取文件夹中的文件位置
import os

def get_file_paths(folder):
    file_paths = []
    for root, dirs, files in os.walk(folder):
        for file in files:
            file_path = os.path.join(root, file)
            file_paths.append(file_path)
    return file_paths

第三步：填写保存PDF文件的文件夹路径，获取PDF文件路径

# 填写要提取文件路径的文件夹路径
folder_path = r"文件路径"
file_paths = get_file_paths(folder_path)
print(file_paths)

第四步：

# 导入docx库（主要）
from docx import Document
# 其他用于设置字体等信息所需

本文标签：文件批量 pdf Word

版权声明：本文标题：实操练习—批量处理：PDF文件转为word文件内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://it.en369.cn/jiaocheng/1763670765a2953107.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

C:WindowsSystem32configsystemprofileAppDataLocalMicrosoftWindowsINetCacheIE下的文件太占空间

3月前

目录系统盘清理微软故意的,360是弱鸡！？ Everything是什么系统盘清理 C:WindowsSystem32configsystemprofileAppDataL

【免费下载】 CAD图纸批量合并工具：提升设计效率的利器

3月前

CAD图纸批量合并工具：提升设计效率的利器【下载地址】CAD图纸批量合并工具本资源文件提供了一个方便快捷的工具，用于将多张CAD图纸批量合并到一个CAD文件中。该工具特别适合处理有规律的单文件

CAD如何免费转换PDF格式

3月前

有的时候,我们需要将我们的CAD文件转出PDF格式的文件发给客户,以便客户打开查看，那么我们如何将CAD文件转换为PDF格式？今天和大家分享一种简单的操作方法，并且是免费试用

【亲测免费】 Aspose-CAD 19.5 去除水印资源文件

3月前

Aspose-CAD 19.5 去除水印资源文件【下载地址】Aspose-CAD19.5去除水印资源文件本仓库提供了一个资源文件，用于去除 Aspose-CAD 19.5 版本中的水印。众所周知&#xff0

【亲测免费】 AutoCAD二次开发资源文件下载

3月前

AutoCAD二次开发资源文件下载【下载地址】AutoCAD二次开发资源文件下载本仓库提供了一个关于AutoCAD二次开发的资源文件，主要内容包括使用C#语言构建DLL库，并结合WPF库进行开

怎样把手机便签里的东西批量导出来并发送给朋友

3月前

手机便签里的东西怎么导出呢？想把手机便签内容导出该如何操作！如果你想批量导出便签内容，并将导出内容发送给朋友，可以按照下列方法操作。手机自带的便签备忘

java大文件存储加密_Java IO--实现文件的加密解密

3月前

我们知道文件存储的方式在计算机当中是以字节的方式进行存储的，可以通过对文件字节的操作来实现文件的加密。下面的例子是通过读取文件的字节，然后使字节中的每一位取反(1变0，0变1)，再进行倒置，来实现加解密过程。 import java.io

如何加密PDF文档？

3月前

在工作中，我们经常会使用到PDF格式的文档，这里面大多都是自己辛苦整理出来的重要数据，自然需要更加重视，于是加密保护就是最简单且有效的方法&#x

java对文件进行md5加密,对文件进行 MD5 加密

3月前

*** 对文件进行 MD5 加密* * param file* 待加密的文件* * return 文件加密后的 MD5 值* throws IOException*public

Python实行任意文件的加密—解密

3月前

Python实行任意文件的加密—解密环境：系统：macOS SonomaIDE：PyCharm 2024 Professional Edition源代码如下&am

文件搜索神器-Everything下载安装及使用教程

3月前

文件搜索神器-Everything下载安装及使用教程1. 软件介绍2.下载与安装2.1 软件安装过程2.2 使用教程1. 软件介绍 Everything是一款Windows平台上的免费文件搜索工具，它具有以下主要特点

.deb文件怎么安装_Ubuntu下安装软件的几种方法

3月前

1，使用Ubuntu Software进行软件安装打开Ubuntu Software应用程序，查找要安装的软件并进行安装，方法与使用软件管家在Windows下安装软件的过程一

史上最详细yolov5环境配置搭建+配置所需文件

3月前

yolov5的配置过程总体来说还算简单，但是网上大部分博客都没有仔细介绍具体步骤，本文将从最细节的层面记录windows10系统下的yolov5环境配置的全过程，以及yolo

AI自动化办公：批量将Excel表格英文内容翻译为中文

3月前

有一个50列的表格，里面都是英文，要翻译成中文：在ChatGPT中输入提示词：你是一个开发AI大模型应用的Python编程专家，要完成以下任务的Python脚本：打开Excel文件："F:AI自媒体内容AI行业数据分

AI翻译英语PDF文档的3种方法

3月前

短的文章，直接丢进kimichat、ChatGPT里面很快就可以翻译完成，而且效果很佳。但是，很长的PDF文档整篇需要翻译，怎么办呢&#xff1

10个有效的翻译工具，帮你轻松搞定翻译PDF文件。

3月前

英语目前对我们来说仍然是一门很重要的语言，在日常生活中，如果我们需要频繁的接触到英语的话，除了要积极提升自己的英语翻译能力之外，借助一些高效的英语翻译工

基于python英文文件名批量翻译并重命名

3月前

下载了一些英文PDF文章，想把它们翻译一下文件名，并且以英文名_翻译中文重命名。调用百度翻译api，在百度翻译开放平台注册通用翻译API-标准版，是免

免费翻译pdf格式论文

3月前

进入谷歌翻译网址https:translate.google?slauto&tlzh-CN&opdocs 将需要全文翻译的pdf放进去选择英文到中文，然后点击翻译可以选择打开译文或者下载译

在excelwps中如何实现批量翻译

3月前

不知道看到本篇文章的小伙伴是否被表格翻译所困扰，当面对大量需要被翻译的文件内容，有着三头六臂的孙悟空也难以招架得住，那么有没有一个工具能让我们快速将大量文件进行翻译呢&

32位系统无法运行64位系统安装文件

3月前

[回复本文][原帖] 发信人: hsh(缩写 HisHer Serene Highness尊贵的殿下), 信区: Windows标题: 32位操作系统下安装64位windows7系统方法发信站: 饮水思源 (2010年03月30日

发表评论

全部评论 0

暂无评论

推荐文章

coolkaixiang 酷开箱COOLCASE 专业可直接取回CSGO饰品皮肤开箱网站

UBuntu 22.04.3 LTS 安装搜狗中文输入法

sql升级重启计算机失败win10,win10纯净版安装sql server 2008重启失败的解决办法

如何用其他工具下载百度云的文件

在win7 32位系统中安装配置Python的机器学习包scikit-learn

热门文章

Vuze的替代工具
3月前
JS如何在浏览器中屏蔽右键菜单
3月前
python怎么激活_Python窗口激活
3月前
deepin linux 卸载搜狗,在Deepin v20下搜狗输入法有依赖不足等问题，但有解决办法...
3月前
清理C盘（一直更新）
3月前
RK61(TypeC) 单光混光蓝牙双模说明书
3月前
还原精灵清除器一键卸载工具实战详解
3月前
探索AI人工智能和数据挖掘的协同效应
3月前
nuc8 黑苹果_NUC Hades Canyon (NUC8) 黑苹果（Hackintosh）安装指南
3月前
垃圾佬收的thinkpad T480
3月前

最新文章

友情链接：范文网|范文赏析|幼儿频道|外语|IT技术|FreeNAS中文网|usb迷|福州电脑网|