PDF 转文本

将 PDF 中可选取的文本提取为纯文本或 Markdown。

你的 PDF 在浏览器本地解析以提取其文本,不会上传任何内容到服务器。

需要找出两份 PDF 之间的变化?试试比较 PDF。

关于 PDF 转文本

这款 PDF 转文本工具可从任意 PDF 提取可选文本,并以干净的纯文本或逐页 Markdown 返回给你。拖入一份合同、报告或研究论文,即可立即提取出可读内容,无需逐页复制粘贴。它专为需要从 PDF 文档提取文本以进行搜索、比对、索引或输入到其他流程的开发者、技术写作者、QA 工程师和分析师而设计。选择文本模式获得带页面分隔符的简单 .txt 导出,或选择 Markdown 模式为每一页添加标题以保持结构清晰。一切都使用页内 PDF 引擎在你的浏览器本地运行,因此即便是大型或机密文件也在本地处理,你的数据绝不会离开你的设备。用它来把 PDF 转换为文本、提取引文,或在几秒内为审阅准备内容。

功能特性

如何使用 PDF 转文本

  1. 把 PDF 拖到上传区,或点击以选择文件。
  2. 稍候片刻,文本会在你的浏览器中被提取。
  3. 使用模式切换在文本和 Markdown 之间切换。
  4. 复制提取的输出,或将其下载为 .txt 或 .md 文件。
  5. 点击「移除」清除文件并加载另一个 PDF。

示例

输入

invoice.pdf (2 页)

输出

发票 #1042
开票给:Acme 公司
合计:¥1,250.00

──────────

感谢您的惠顾。

以文本模式提取的两页 PDF,页面之间带有分隔符。

常见错误与故障排除

常见问题

PDF 转文本工具是什么?
PDF 转文本是一款浏览器内提取器,可读取 PDF 中的可选文本,并以纯文本或逐页 Markdown 返回,可随时复制或下载。
如何用 PDF 转文本从 PDF 提取文本?
把 PDF 拖入 PDF 转文本工具,它会立即提取可选文本。选择文本或 Markdown 模式,然后复制或下载结果。
文本模式和 Markdown 模式有什么区别?
文本模式给出带有页面分隔线的纯输出,而 Markdown 模式在每一页前添加一个 Page N 标题以保留结构。
PDF 转文本能读取扫描或纯图片 PDF 吗?
暂时不能。扫描 PDF 不含可选文本,因此需要 OCR;该功能已在规划中。
PDF 转文本会保留原始布局吗?
它会尽力重建行。简单文档能干净地呈现,但复杂的多栏布局可能无法完全保留。
使用 PDF 转文本时我的 PDF 会被上传到任何地方吗?
不会。PDF 在你的浏览器本地处理,不会上传任何内容到服务器,因此你的数据绝不会离开你的设备。

相关工具

全部 ArrayKit 工具