PDF 工具

PDF 转 Word 转换器——免费、私密,在浏览器中完成

把 PDF 中的文字提取成可编辑的 Word 文档——无需上传。

本工具完全在你的浏览器中运行。你的文件绝不上传——它们始终保留在你的设备上。

选择文件

或拖放文件

大多数“PDF 转 Word”转换器都要求你在看到结果之前先把文档上传到服务器。这个工具完全在你的浏览器内运行:PDF 在你的设备上被读取,其中的文字被提取出来,Word 文件在本地生成——任何内容都不会上传。

它专为基于文字的 PDF 而设计,也就是文字是真正可选中的那种。它能还原文字内容,让你在 Word 中继续编辑,但不会重现确切的页面版式、分栏或样式。扫描件或纯图片 PDF 不含可提取的文字,所以无法在这里使用(没有 OCR)。

工作原理

当你添加 PDF 时,文件会被直接载入你浏览器的内存——它绝不会被发送到服务器。工具使用 pdf.js(这正是为 Firefox 内置查看器提供支持的同一个开源 PDF 引擎)来读取每一页并提取其中的文字项。这些文字项携带着文档中实际存储的字符及其在页面上的位置。

提取出的文字随后被重新归并成行和段落,交给 docx 库,由它组装出一个 .docx 格式的标准 Word 文件。所有这些都在本地以 JavaScript 完成,所以转换在你自己的机器上结束,生成的文件作为下载文件提供给你。由于工作在客户端进行,关于你文档的任何信息——无论是文字还是文件名——都不会离开你的设备。

适用场景

当你手上有一份基于文字的 PDF,并希望把文字以可编辑的形式取回来时,就用它。好的例子包括:你收到的、需要修改的 PDF 合同或报告;你想引用并重新排版的论文或文章;你想做批注的课堂笔记或手册;又或是旧 PDF 里的样板文字,你宁愿重写也不想重新打字。

它对敏感资料尤其有用——法律草案、医疗信函、财务报表、人事文档——这些情况下把文件上传到陌生服务器并不是可选项。由于 PDF 在你的浏览器中处理,你可以转换机密文档,而它们绝不会被传输到任何地方。

当你需要原件逐像素的视觉复制品时,它就不是合适的工具。版式、分栏、表格、嵌入图片和确切字体都不会被重现;你得到的是干净、可编辑的段落文字,便于在此基础上工作。

小贴士

转换前先确认你的 PDF 是否基于文字:在查看器中打开它,试着用光标选中一句话。如果文字被高亮,提取就能成功;如果你只能在一张图片上拉出一个框,那这一页就是扫描图像,没有可还原的文字——这个工具不运行 OCR。

转换后,浏览一下提取文字的预览,确认文字内容已正确读出,然后预期在 Word 里做一些轻度整理。多栏 PDF 的各栏可能会交错,页眉、页脚或页码也可能内联出现,所以快速通读并重新排版是正常的。为获得最佳效果,请尽量从由文字处理软件导出或数字化生成的 PDF 开始,而不是打印后重新扫描的那种。

如何使用 PDF 转 Word

  1. 把 PDF 拖到上方的方框中,或点击浏览来添加。
  2. 点击“转换为 Word”——文字会在你的浏览器中被读取并重建成段落。
  3. 查看提取文字的预览,确认文字内容已正确读出。
  4. 下载可编辑的 .docx 文件,在 Word 或任意兼容编辑器中打开。

常见问题

我的 PDF 会上传到服务器吗?

不会。PDF 完全在你的浏览器中被读取和转换。文件绝不会离开你的设备,因此处理私密文件和机密文件很安全。

Word 文件会和我的 PDF 完全一样吗?

不会。这个工具把文字提取成可编辑的段落,而不是逐像素的复制。复杂的版式、分栏、表格、字体和图片都不会被重现——你得到的是干净、可编辑的文字,便于在此基础上工作。

为什么我的扫描 PDF 转出来是空的?

扫描 PDF 其实是一组没有底层文字的图片,所以没有任何可提取的内容。这个工具不执行 OCR,因此它只对包含真正可选中文字的 PDF 有效。

结果是什么格式?

一个标准的 .docx 文件,可以在 Microsoft Word、Google Docs、LibreOffice 及其他现代文字处理软件中打开。

我需要安装什么或注册吗?

不需要。它可在任意现代浏览器中运行,无需安装、无需账户、完全免费。

相关工具