AI 文本清理器
粘贴文本,即可检测并移除 AI 模型和复制粘贴留下的不可见字符与排版残留。一切都在你的浏览器中运行。
你的文本在浏览器本地被检查和清理,绝不会被上传,但请避免把机密内容粘贴到任何在线工具中。
看到像 Café 这样的乱码重音字符?试试乱码修复工具。
关于 AI 文本清理器
这款 AI 文本清理器是一个简单的检查器与净化器,专门处理携带了你看不见的字符的文本。粘贴语言模型生成的任何内容,或你从文档、PDF、网页复制的内容,它就会统计并移除悄悄混入的隐藏格式字符:zero-width space 与连接符、窄的和普通的不换行空格、软连字符、bidi 控制符、不可见的数学运算符,以及 emoji 变体选择符。可选开关能把弯引号改直、把长短破折号变成普通连字符、合并连续空格,并应用 Unicode NFC 规范化。你会得到一份按类型分类的移除摘要,以及清理前后的字符数与 UTF-8 字节数,然后可复制或下载清理后的结果。整个检查都在你的浏览器中运行;你粘贴的文本不会离开你的设备。
功能特性
- 按类型检测并统计每一个隐藏字符,包括 zero-width space、连接符和非连接符
- 剥离不换行空格与窄不换行空格、软连字符以及字节顺序标记
- 移除可能重排或伪装文本的 bidi 控制符(LRM、RLM、LRO/RLO、隔离符)
- 清除不可见的数学运算符(U+2061–U+2064)和 emoji 变体选择符(U+FE00–U+FE0F)
- 可选:把弯引号改直,并将长短破折号转为普通连字符
- 可选:合并连续空格并应用 Unicode NFC 规范化
- 显示按类型分类的移除摘要,附带清理前后的字符数与 UTF-8 字节数
- 一键复制清理后的文本,或将其下载为 cleaned.txt
如何使用 AI 文本清理器
- 将你的文本粘贴或输入到左侧的输入框中。
- 阅读横幅和按类型分类的移除列表,查看发现了哪些隐藏字符。
- 按需切换任意排版选项,例如把引号改直或合并空格。
- 检查清理前后的字符数与字节数,确认改动的内容。
- 复制清理后的文本,或将其下载为 cleaned.txt。
示例
输入
The model said “this is clean”—or is it?
输出
The model said "this is clean"-or is it?
一个 zero-width space 被移除;开启引号和破折号选项后,弯引号变直,长破折号变成连字符。
常见错误与故障排除
- 清理后的文本看起来和输入一模一样,但计数却变了。 — 被移除的字符在屏幕上是不可见的。查看按类型分类的移除列表和字符数差值,即可看清究竟移除了什么。
- 单词之间的不换行空格变成了普通空格,或直接消失了。 — 不换行空格与窄不换行空格会作为隐藏字符被移除。如果你确实需要那里有一个真正的空格,合并空格选项会保留单个空格不变。
- 带重音的字母看起来一样,长度却变了。 — 那是 Unicode NFC 规范化把一个基础字母和一个组合记号合并成了单个码点。如果你想保留原始形式,请关闭规范化(NFC)选项。
- 清理后某个 emoji 失去了颜色或样式。 — 强制文本或 emoji 呈现方式的变体选择符(U+FE00–U+FE0F)被剥离了。如果你需要特定样式,请从键盘重新添加该 emoji。
常见问题
- 什么是 zero-width space?
- zero-width space(U+200B)是一个没有可见宽度的 Unicode 字符。它可以制造看不见的断词、干扰精确匹配搜索,即便屏幕上什么都没出现,也会改变字节数。本工具会将它连同相关的 zero-width 连接符和不换行空格一并移除。
- 为什么 AI 生成的文本有时会包含隐藏字符?
- 模型是在已经包含不换行空格、智能引号、软连字符等格式的网页和文档文本上训练的,分词器会将它们复现出来。从富文本编辑器、PDF 和聊天应用中复制粘贴又会添加更多。结果就是看起来干净、却携带了你看不见的字符的文本。
- AI 文本清理器会移除哪些字符?
- 它会移除 zero-width space、连接符、非连接符和词连接符、字节顺序标记、不换行空格与窄不换行空格、软连字符、bidi 控制符、不可见的数学运算符(U+2061–U+2064)以及 emoji 变体选择符(U+FE00–U+FE0F)。引号、破折号、空格和 NFC 的改动则是可选开关。
- 什么是 bidi 控制符,为什么要移除它们?
- 像从右向左覆盖符这样的 bidi 控制符会重排文本的显示方式。它们对混合书写方向的内容是合理的,但也可能被用来伪装文件名或代码,因此本工具会标记并剥离它们,让你看到的与底层字符保持一致。
- 这个工具会改动我可见的文字或重写文本吗?
- 不会。它是一个检查器与净化器:默认只删除你看不见的字符,并报告移除了什么。它绝不会改写、添加或重写你的文字,排版选项也只在你开启时才运行。
- 清理不可见字符时,我的文本会被上传到任何地方吗?
- 不会。检测与清理完全在你的浏览器中运行,因此你粘贴的文本在你的设备上处理,不会发送到服务器。
相关工具
- Mojibake 修复器 — 将 Café 或 don’t 这类乱码文本修复回干净字符。
- 字数统计 — 实时统计字符、单词、句子、字节和大致的 token 数。
- 大小写转换工具 — 在 camelCase、snake_case、kebab-case、PascalCase 等之间转换文本。
- Slug 生成器 — 将任意标题转换为整洁、URL 安全的 slug,可批量处理。
- 文本对比 — 逐行对比两段文本,查看新增和删除内容。
- HTML 转义 / 反转义 — 转义和反转义 HTML 特殊字符与实体。
全部 ArrayKit 工具