AIテキストクリーナー
テキストを貼り付けると、AIモデルやコピー&ペーストで混入した不可視文字や書式のゴミを検出して削除します。すべてブラウザー内で動作します。
テキストはブラウザー内でローカルに検査・クリーンされ、アップロードされることはありませんが、機密性の高い内容をオンラインツールに貼り付けるのは避けてください。
Café のような文字化けが出ていますか? Mojibake Fixer をお試しください。
AIテキストクリーナー について
このAIテキストクリーナーは、目に見えない文字を含むテキストのための、シンプルなインスペクター兼サニタイザーです。言語モデルが生成した文章や、ドキュメント・PDF・Webページからコピーした内容を貼り付けると、紛れ込んだ隠れ書式文字をカウントして削除します。対象は、zero-width space やジョイナー、NNBSP や通常の non-breaking space、ソフトハイフン、双方向制御文字、不可視の数学演算子、絵文字の異体字セレクターなどです。任意のトグルで、丸引用符をまっすぐな引用符に直し、em ダッシュや en ダッシュを普通のハイフンに変換し、連続するスペースをまとめ、Unicode NFC 正規化を適用できます。種類別の削除サマリーに加え、処理前後の文字数と UTF-8 バイト数が表示され、クリーンな結果をコピーまたはダウンロードできます。すべての検査はブラウザー内で動作し、貼り付けたテキストはデバイスから外に出ることはありません。
機能
- zero-width space・ジョイナー・非ジョイナーを含む、あらゆる隠れ文字を種類別に検出してカウント
- non-breaking space と NNBSP、ソフトハイフン、バイトオーダーマーク(BOM)を削除
- テキストの並び替えやなりすましに悪用され得る双方向制御文字(LRM、RLM、LRO/RLO、アイソレート)を除去
- 不可視の数学演算子(U+2061–U+2064)と絵文字の異体字セレクター(U+FE00–U+FE0F)を除去
- 任意: 丸引用符をまっすぐな引用符に直し、em/en ダッシュを普通のハイフンに変換
- 任意: 連続スペースをまとめ、Unicode NFC 正規化を適用
- 種類別の削除サマリーと、処理前後の文字数・UTF-8 バイト数を表示
- クリーンなテキストをワンクリックでコピー、または cleaned.txt としてダウンロード
AIテキストクリーナー の使い方
- 左の入力ボックスにテキストを貼り付けるか入力します。
- バナーと種類別の削除リストを見て、どの隠れ文字が見つかったかを確認します。
- 引用符を直す、スペースをまとめるなど、必要な書式オプションを切り替えます。
- 処理前後の文字数とバイト数を確認し、何が変わったかをチェックします。
- クリーンなテキストをコピーするか、cleaned.txt としてダウンロードします。
例
入力
The model said “this is clean”—or is it?
出力
The model said "this is clean"-or is it?
zero-width space が削除され、引用符とダッシュのオプションをオンにすると、丸引用符はまっすぐになり em ダッシュはハイフンになります。
よくあるエラーとトラブルシューティング
- クリーン後のテキストが入力と見た目が同じなのに、カウントは変わっている。 — 削除された文字は画面上で不可視だったためです。種類別の削除リストと文字数の差分を見れば、正確に何が取り除かれたかがわかります。
- 単語間の non-breaking space が普通のスペースになった、または消えた。 — non-breaking space と NNBSP は隠れ文字として削除されます。そこに本物のスペースが必要な場合、スペースをまとめるオプションは単一スペースをそのまま残します。
- アクセント付きの文字が、見た目は同じなのに長さが変わった。 — これは Unicode NFC 正規化が、基底文字と結合文字を1つのコードポイントにまとめたためです。元の形を保ちたい場合は Normalize (NFC) オプションをオフにしてください。
- クリーン後に絵文字が色やスタイルを失った。 — テキスト表示や絵文字表示を強制する異体字セレクター(U+FE00–U+FE0F)が削除されます。特定のスタイルが必要な場合は、キーボードから絵文字を入れ直してください。
よくある質問
- zero-width space とは何ですか。
- zero-width space(U+200B)は、幅を持たない Unicode 文字です。目に見えない改行位置を作り、完全一致検索を狂わせ、画面上に何も表示されないのにバイト数を変えてしまうことがあります。このツールは、関連する zero-width joiner や non-breaking space とともにこれを削除します。
- AIが生成したテキストに隠れ文字が含まれるのはなぜですか。
- モデルは、non-breaking space・スマート引用符・ソフトハイフンなどの書式をすでに含む Web やドキュメントのテキストで学習しており、トークナイザーがそれらを再現することがあります。リッチエディター・PDF・チャットアプリからのコピー&ペーストでさらに増えます。その結果、見た目はきれいでも目に見えない文字を抱えたテキストになります。
- AIテキストクリーナーはどの文字を削除しますか。
- zero-width space・ジョイナー・非ジョイナー・word joiner、バイトオーダーマーク、non-breaking space と NNBSP、ソフトハイフン、双方向制御文字、不可視の数学演算子(U+2061–U+2064)、絵文字の異体字セレクター(U+FE00–U+FE0F)を削除します。引用符・ダッシュ・スペース・NFC の変更は任意のトグルです。
- 双方向制御文字とは何で、なぜ削除するのですか。
- right-to-left override のような双方向制御文字は、テキストの表示順を並び替えます。混在スクリプトの内容には正当なものですが、ファイル名やコードを偽装するのにも使われ得ます。このツールはそれらを検出して削除し、見えている内容と実際の文字が一致するようにします。
- このツールは目に見える単語を変えたり、文章を書き換えたりしますか。
- いいえ。これはインスペクター兼サニタイザーです。既定では、目に見えない文字だけを削除し、何を取り除いたかを報告します。あなたの言葉を言い換えたり、追加したり、書き直したりすることは決してなく、書式オプションはオンにしたときだけ動作します。
- 不可視文字をクリーンするとき、テキストはどこかにアップロードされますか。
- いいえ。検出とクリーンアップはすべてブラウザー内で動作し、貼り付けたテキストはデバイス上で処理され、サーバーに送信されることはありません。
関連ツール
すべての ArrayKit ツール