Очистка текста от ИИ

Вставьте текст, чтобы обнаружить и удалить невидимые символы и типографские артефакты, оставленные моделями ИИ и копированием-вставкой. Всё работает в вашем браузере.

Ваш текст инспектируется и очищается локально в вашем браузере и никогда не загружается, но избегайте вставки конфиденциального содержимого в любой онлайн-инструмент.

Видите искажённые символы вроде Café? Попробуйте Mojibake Fixer.

Об инструменте Очистка текста от ИИ

Эта Очистка текста от ИИ — простой инспектор и очиститель для текста, который несёт символы, которые вы не видите. Вставьте всё, что сгенерировала языковая модель, или содержимое, скопированное из документа, PDF или веб-страницы, и инструмент подсчитает и удалит скрытые форматирующие символы, которые проникают внутрь: zero-width space и соединители, узкие и обычные неразрывные пробелы (NNBSP), мягкие переносы, bidi-управляющие символы, невидимые математические операторы и селекторы вариаций эмодзи. Дополнительные переключатели выпрямляют фигурные кавычки, превращают длинное и короткое тире в обычный дефис, схлопывают серии пробелов и применяют Unicode-нормализацию NFC. Вы получаете сводку удалённого по типам плюс счётчики символов и байтов UTF-8 до и после, затем копируете или скачиваете очищенный результат. Вся проверка работает в вашем браузере, поэтому вставленный текст остаётся на вашем устройстве.

Возможности

Как использовать Очистка текста от ИИ

  1. Вставьте или введите ваш текст в поле ввода слева.
  2. Прочитайте баннер и список удалённого по типам, чтобы увидеть, какие скрытые символы были найдены.
  3. Включите любые типографские опции, которые вам нужны, например выпрямление кавычек или схлопывание пробелов.
  4. Проверьте счётчики символов и байтов до и после, чтобы подтвердить, что изменилось.
  5. Скопируйте очищенный текст или скачайте его как cleaned.txt.

Пример

Ввод

The​ model said “this is clean”—or is it?

Результат

The model said "this is clean"-or is it?

Zero-width space удаляется; при включённых опциях кавычек и тире фигурные кавычки становятся прямыми, а длинное тире превращается в дефис.

Частые ошибки и устранение неполадок

Часто задаваемые вопросы

Что такое zero-width space?
Zero-width space (U+200B) — это Unicode-символ без видимой ширины. Он может создавать невидимые разрывы слов, сбивать точный поиск и менять счётчики байтов, хотя ничего не появляется на экране. Этот инструмент удаляет его вместе со связанными zero-width-соединителями и неразрывными пробелами.
Почему сгенерированный ИИ текст иногда содержит скрытые символы?
Модели обучаются на веб- и документном тексте, который уже включает неразрывные пробелы, типографские кавычки, мягкие переносы и другое форматирование, а токенизаторы могут их воспроизводить. Копирование-вставка из редакторов с форматированием, PDF и чат-приложений добавляет больше. В результате текст выглядит чистым, но несёт символы, которые вы не видите.
Какие символы удаляет Очистка текста от ИИ?
Она удаляет zero-width space, соединитель, несоединитель и word joiner, метку порядка байтов (BOM), неразрывные и узкие неразрывные пробелы (NNBSP), мягкие переносы, bidi-управляющие символы, невидимые математические операторы (U+2061–U+2064) и селекторы вариаций эмодзи (U+FE00–U+FE0F). Изменения кавычек, тире, пробелов и NFC — это дополнительные переключатели.
Что такое bidi-управляющие символы и зачем их удалять?
Bidi-управляющие символы вроде right-to-left override переупорядочивают то, как отображается текст. Они законны для смешанного письма, но могут использоваться и для маскировки имён файлов или кода, поэтому этот инструмент помечает и удаляет их, чтобы то, что вы видите, совпадало с базовыми символами.
Меняет ли этот инструмент мои видимые слова или переписывает текст?
Нет. Это инспектор и очиститель: по умолчанию он только удаляет символы, которые вы не видите, и сообщает, что убрал. Он никогда не перефразирует, не добавляет и не переписывает ваши слова, а типографские опции работают только когда вы их включаете.
Загружается ли мой текст куда-либо при очистке невидимых символов?
Нет. Обнаружение и очистка работают полностью в вашем браузере, поэтому вставленный текст обрабатывается на вашем устройстве и не отправляется на сервер.

Связанные инструменты

Все инструменты ArrayKit