PDF からテキスト

PDFから選択可能なテキストをプレーンテキストまたはMarkdownとして抽出します。

PDFはブラウザ内のローカルで解析されてテキストが抽出され、サーバーには何もアップロードされません。

2つのPDFの変更点を見つけたいですか? PDFを比較をお試しください。

PDF からテキスト について

このPDFテキスト抽出ツールは、任意のPDFから選択可能なテキストを抽出し、きれいなプレーンテキストまたはページごとのMarkdownとして返します。契約書、レポート、研究論文をドロップすれば、1ページずつコピー&ペーストせずに、読みやすい内容を即座に取り出せます。検索・差分比較・インデックス化・他のパイプラインへの投入のためにPDFからテキストを抽出したい開発者、テクニカルライター、QAエンジニア、アナリスト向けに作られています。ページ区切り付きのシンプルな.txt書き出しにはテキストモード、各ページに見出しを付けて構造を明確に保つにはMarkdownモードを選べます。すべてページ内のPDFエンジンを使ってブラウザ内のローカルで動作するため、大きなファイルや機密ファイルでもローカルで処理され、データが端末から外に出ることはありません。PDFをテキストに変換したり、引用を取り出したり、数秒でレビュー用の内容を準備したりするのに使えます。

機能

PDF からテキスト の使い方

  1. アップロード領域にPDFをドロップするか、クリックしてファイルを選びます。
  2. ブラウザ内でテキストが抽出されるのを少し待ちます。
  3. モード切り替えでテキストとMarkdownを切り替えます。
  4. 抽出した出力をコピーするか、.txtまたは.mdファイルとしてダウンロードします。
  5. 「削除」をクリックしてファイルを消去し、別のPDFを読み込みます。

入力

invoice.pdf (2ページ)

出力

請求書 #1042
請求先: Acme Corp
合計: ¥1,250.00

──────────

お取引ありがとうございます。

2ページのPDFをテキストモードで抽出し、ページ間に区切りを入れた例。

よくあるエラーとトラブルシューティング

よくある質問

PDFをテキストにツールとは何ですか?
PDFから選択可能なテキストを読み取り、プレーンテキストまたはページごとのMarkdownとして返すブラウザ内の抽出ツールで、コピーまたはダウンロードできます。
PDFをテキストにでテキストを抽出するには?
PDFをテキストにツールにPDFをドロップすると、選択可能なテキストが即座に抽出されます。テキストかMarkdownモードを選び、結果をコピーまたはダウンロードします。
テキストモードとMarkdownモードの違いは?
テキストモードはページ間に区切りを入れたプレーン出力、Markdownモードは各ページの前にPage Nの見出しを付けて構造を保ちます。
PDFをテキストにはスキャンや画像のみのPDFを読めますか?
まだです。スキャンPDFには選択可能なテキストがないためOCRが必要で、その機能はロードマップに入っています。
PDFをテキストには元のレイアウトを保ちますか?
可能な限り行を再構成します。シンプルな文書はきれいに取り込めますが、複雑な多段組みレイアウトは完全には保たれない場合があります。
PDFをテキストに使うときPDFはアップロードされますか?
いいえ。PDFはブラウザ内のローカルで処理され、サーバーには何もアップロードされないため、データが端末から外に出ることはありません。

関連ツール

すべての ArrayKit ツール