単語数・文字数カウンター
テキストを貼り付けると、文字数・文の数・行数・バイトサイズ・おおよそのトークン数をリアルタイムで表示します。すべてブラウザー内で動作します。
テキストはブラウザー内でローカルに解析されてカウントが算出され、アップロードされることはありません。メモ・下書き・プロンプトはお使いのデバイスに留まります。
そのテキストを変換したいですか?ケース変換ツールをお試しください。
単語数・文字数カウンター について
この文字数・単語数カウンターは、入力やテキストの貼り付けを始めた瞬間からリアルタイムの統計を表示します。文字数カウンターおよび単語数カウンターとして、スペースを含む文字数・含まない文字数、単語数、文の数、段落数、行数、UTF-8バイトサイズ、おおよそのLLMトークン数、そして毎分約200語を基準にした推定読了時間を報告します。文字数は書記素単位で数えるため、絵文字や国旗は複数バイトにまたがっても1文字として数えられます。メタディスクリプションを縮める、ツイートやコミットメッセージに収める、モデルへ送る前にプロンプトを確認する、あるいは文章の分量を保つのに便利です。出現頻度の高い単語のリストも任意で表示できます。すべてはブラウザー内でローカルに計算されるため、貼り付けたテキストはお使いのデバイスに留まり、アップロードされることはありません。
機能
- 入力に合わせてスペースを含む文字数と含まない文字数をリアルタイム表示
- 単語数・文の数・段落数・行数を即座に更新
- ペイロードやストレージの上限を確認できるUTF-8バイトサイズ
- おおよその文字数 / 4 のヒューリスティックでLLMトークン数を概算(approxと表示)
- 毎分約200語を基準にした読了時間の目安
- 書記素単位のカウントで、絵文字や合成された字も1文字として計上
- ささいなストップワードを除いた、出現頻度上位の単語リスト(任意)
- 「統計をコピー」ボタンで全指標のプレーンテキスト要約をコピー
単語数・文字数カウンター の使い方
- テキストを「Text」ボックスに貼り付けるか入力します。
- 文字数・単語数・文の数・行数・バイト数・トークン数・読了時間のリアルタイム統計カードを確認します。
- 任意の上位単語リストを見て、どの語が最も繰り返されているか把握します。
- 「統計をコピー」をクリックして全指標のプレーンテキスト要約を取得します。
例
入力
The quick brown fox jumps over the lazy dog. 🦊
出力
Characters (with spaces): 46
Characters (no spaces): 37
Words: 9
Sentences: 1
Lines: 1
Size (UTF-8): 48 bytes
Tokens (approx): ~12
Reading time: 1 min
キツネの絵文字は1文字として数えられますが、UTF-8では4バイトを追加します。
よくあるエラーとトラブルシューティング
- 文字数が、入力した文字の数より多く見える。 — デフォルトのカウントにはスペース・句読点・改行が含まれます。文字と表示される記号だけを見たい場合は2番目のカード「Characters (no spaces)」を確認してください。
- 絵文字やアクセント付きの文字が、文字数よりバイトサイズを大きく変える。 — 文字は書記素単位で数えられますが、バイトはUTF-8です。1つの絵文字は1文字でも4バイトになります。これは想定どおりの挙動です。
- トークン数がモデルのトークナイザーと正確に一致しない。 — トークン数は概算(おおよそ文字数 / 4)でありapproxと表示されています。正確な数が必要な場合はモデル本来のトークナイザーを使ってください。
- ボックスが空でないのに単語数が0になる。 — スペース・タブ・空行だけの入力には単語がありません。表示される文字を入力すれば、カウントは即座に更新されます。
よくある質問
- 文字数のカウントにはスペースや改行が含まれますか?
- メインの「Characters」カードはスペース・句読点・改行を含むすべてを数えます。別の「Characters (no spaces)」カードはすべての空白を取り除くため、文字と表示される記号だけを確認できます。
- 絵文字やアクセント付きの文字はどう数えられますか?
- 利用可能な環境では Intl.Segmenter を使い書記素単位で数えるため、絵文字・国旗・結合アクセント付きの文字は複数のUTF-8バイトを取っても1文字として数えられます。
- おおよそのトークン数は何のためのものですか?
- テキストが使うLLMトークン数を素早く見積もるためのもので、おおよそ文字数 / 4 のヒューリスティックに基づきapproxと表示されます。モデルのコンテキスト上限内に収めるのに役立ちますが、モデル本来のトークナイザーの代わりにはなりません。
- 読了時間はどう計算されますか?
- 読了時間は単語数を毎分約200語で割り、切り上げます。空でないテキストは少なくとも1分と表示されます。文章を音読または黙読するのにかかる時間のおおよその目安です。
- バイトサイズは文字数とどう違いますか?
- バイトサイズはテキストのUTF-8での長さで、多くのAPIやデータベースが制限している値です。ASCII文字は1バイト、アクセント付きの文字は通常2バイト、ほとんどのCJK文字は3バイト、絵文字は4バイトなので、バイト数は文字数より多くなりがちです。
- カウントするとき、テキストはアップロードされますか?
- いいえ。この単語数カウンターは完全にブラウザー内で動作するため、貼り付けたテキストはお使いのデバイス上でローカルに処理され、サーバーへ送信されることはありません。
関連ツール
すべての ArrayKit ツール