首页教程正文内容

pdfbox 将pdf转换为word

教程

更新时间：2026-04-02 08:40:4436

admin管理员组
文章数量:1130349

先添加依赖

<dependency>
    <groupId>org.apache.pdfbox</groupId>
    <artifactId>pdfbox</artifactId>
    <version>2.0.28</version>
</dependency>

private byte[] pdf2word(String filePath, byte[] in) throws IOException {
    String ext = FileUtil.getExt(filePath);
    if ("pdf".equals(ext)) {
        //将pdf加载到对象中去
        PDDocument doc = PDDocument.load(in);
        //得到pdf的页数
        int pagenumber = doc.getNumberOfPages();
        ByteArrayOutputStream baos = new ByteArrayOutputStream();
        Writer writer = new OutputStreamWriter(baos, StandardCharsets.UTF_8);
        PDFTextStripper stripper = new PDFTextStripper();
        stripper.setSortByPosition(true);//排序
        stripper.setStartPage(1);//设置转换的开始页
        stripper.setEndPage(pagenumber);//设置转换的结束页
        stripper.writeText(doc, writer);
        writer.close();
        return baos.toByteArray();
    }
    return null;
}

会丢失部分格式，但是整体还行，毕竟免费的要啥自行车

先添加依赖

<dependency>
    <groupId>org.apache.pdfbox</groupId>
    <artifactId>pdfbox</artifactId>
    <version>2.0.28</version>
</dependency>

private byte[] pdf2word(String filePath, byte[] in) throws IOException {
    String ext = FileUtil.getExt(filePath);
    if ("pdf".equals(ext)) {
        //将pdf加载到对象中去
        PDDocument doc = PDDocument.load(in);
        //得到pdf的页数
        int pagenumber = doc.getNumberOfPages();
        ByteArrayOutputStream baos = new ByteArrayOutputStream();
        Writer writer = new OutputStreamWriter(baos, StandardCharsets.UTF_8);
        PDFTextStripper stripper = new PDFTextStripper();
        stripper.setSortByPosition(true);//排序
        stripper.setStartPage(1);//设置转换的开始页
        stripper.setEndPage(pagenumber);//设置转换的结束页
        stripper.writeText(doc, writer);
        writer.close();
        return baos.toByteArray();
    }
    return null;
}

会丢失部分格式，但是整体还行，毕竟免费的要啥自行车

本文标签：转换为 PDFBox pdf Word

版权声明：本文标题：pdfbox 将pdf转换为word 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://it.en369.cn/jiaocheng/1763669408a2952992.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

PDF中公式转word

4月前

效果：实现pdf中公式免编辑 step1: 截图CtrlAltA，复制 step2: SimpleTex - Snip & Get 网页或客户端均可，无次数限制&am

python如何word转pdf

4月前

在Python中，将Word文档（.docx或.doc）转换为PDF可以通过多种库实现。以下是几种常见的方法及详细步骤：方法1：使

kkFileView二开之word转pdf接口

4月前

kkFileView二开之word转pdf接口 kkFileView二开系列文章： 1 kkFileView源码下载及编译 2 word转pdf接口 2.1 背景 2.2 接口开发 2.3 接口测试 2.3.1 word文件准备 2.3.2

Java实现 pdf转word

4月前

<dependency><groupId>com.github.lafa.pdfbox<groupId><artifactId>pdfbox

C# PDF转换EXCEL、WORD(附代码+插件)

4月前

using System;using System.Collections.Generic;using System.ComponentModel;using System.Data;using System.Drawing;us

SpringBoot下实现PDF转word(Maven项目)

4月前

目录前言一、简易版本（只可以将PDF转为文字）二、完整版本 1.引入库 2.编写工具类 3.编写controller类 4.vue前端实现下载 5.提示三、注意事项总结前言在日常工作学习中经常会遇到需要将

C#中pdf转word

4月前

话不多说直接上代码！！！！ 需要引用一些dll using System;using System.Collections.Generic;us

第五课：C++实现加密PDF文档解密

4月前

目录 1.功能概述 2.示例代码 3.PDF加密原理 3.1.PDF加密方法 3.1.1。加密电脑本地PDF文件 3.1.2.在其他电脑上使用PDF文件 3.1.3.批量加密PDF文件 1.功能概述请注意&#xf

为什么每次电脑设置了默认word打开，每次关机之后又出现wps打开，这个是什么原因？——可能和默认设置有关，可以关闭试试

4月前

为什么每次电脑设置了默认word打开，每次关机之后又出现wps打开，这个是什么原因？点击wps——右上角——设置设置中心——文件格式关联

PDF24 Creator绿色工具箱：本月最新免费PDF转换神器

4月前

下载链接https:pan.quarks7991ba4a8282在日常办公或学习中，PDF格式的文档处理需求无处不在。无论是合同合并、论文格式转换，还是扫描件文字提取&#xff0

怎么将文件转换成linux文件,如何将文件从LinuxUnix格式转换为Windows，反之亦然 | MOS86...

4月前

如果您已将文本文件从基于UNIX的系统直接传输到Windows系统，那么您知道Windows系统上打开文本文件时，通常无法正确显示。基于Windows的文本阅读器程序(如记事本)可能无法显示文本。

【免费下载】深度学习基础PDF下载

4月前

深度学习基础PDF下载【下载地址】深度学习基础PDF下载深度学习基础PDF下载项目地址: https:gitcodeOpen-source-documentation-tutorial34c85 资源介绍本仓

360极速浏览器不支持看PDF

4月前

360安全浏览器采用的是基于IE内核和Chrome内核的双核浏览器。360极速浏览器是源自Chromium开源项目的浏览器，不但完美融合了IE内核引擎，而且实现了双核引擎的无缝切换。因此在速度上&

CAD如何免费转换PDF格式

4月前

有的时候,我们需要将我们的CAD文件转出PDF格式的文件发给客户,以便客户打开查看，那么我们如何将CAD文件转换为PDF格式？今天和大家分享一种简单的操作方法，并且是免费试用

Java 中 Word 文档的加密与解密

4月前

在现代应用开发中，文件安全性是不可忽视的重要环节。Word 文档作为日常办公和数据传输中常见的格式，其内容的保密性尤为关键。为了保护敏感信息，对 Word 文档进行加密处理&

如何加密PDF文档？

4月前

在工作中，我们经常会使用到PDF格式的文档，这里面大多都是自己辛苦整理出来的重要数据，自然需要更加重视，于是加密保护就是最简单且有效的方法&#x

英文PDF怎么翻译成中文？两分钟让你学会翻译PDF

4月前

现在大部分的文件资料都是以PDF的格式保存的，这是因为PDF格式可以跨设备打开的时候，不会影响到内容的排版格式。在撰写论文的时候，我们常需要查阅各种文献资料&#xff

英文论文PDF全文翻译途径整理

4月前

英文论文PDF全文翻译途径英文论文PDF全文翻译1 有道翻译2 翻译狗3 DocTranslator结语英文论文PDF全文翻译近期的毕业设计需要阅读英文论文，一般格式都是PDF的，感觉看起来有

AI翻译英语PDF文档的3种方法

4月前

短的文章，直接丢进kimichat、ChatGPT里面很快就可以翻译完成，而且效果很佳。但是，很长的PDF文档整篇需要翻译，怎么办呢&#xff1

知云文献翻译打不开_英文PDF文献翻译神器-知云文献翻译

4月前

在经历了之前推荐的通天塔文献翻译网站次数使用完毕，冲会员才能继续使用；谷歌PDF翻译无法使用；谷歌文字翻译要自己手动删空格，还要受5000字符数&

发表评论

全部评论 0

暂无评论

推荐文章

Windows安全中心无法使用解决方法

Drone概念与答疑

HA专题--Pacemaker集群日常管理命令

【免费下载】 CAD2019中文版下载与安装教程

【免费下载】 ObjectARX Wizards for AutoCAD 各版本资源文件

热门文章

最新文章

友情链接：范文网|范文赏析|幼儿频道|外语|IT技术|FreeNAS中文网|usb迷|福州电脑网|