Главная Блог Как проверить сайт на англицизмы
Инструкция

Как проверить сайт на англицизмы: пошаговая инструкция

· 12 мин чтения

С 1 марта 2025 года в России действует закон 168-ФЗ, обязывающий использовать русский язык во всех публичных коммуникациях. Штрафы за англицизмы на сайтах могут достигать 500 000 ₽. В этой статье — пошаговая инструкция, как проверить сайт на англицизмы быстро и без ошибок.

1. Зачем проверять сайт на англицизмы

Федеральный закон 168-ФЗ «О внесении изменений в Федеральный закон „О государственном языке Российской Федерации"» вступил в силу поэтапно: основные нормы — с 1 марта 2025 года, а положения о проверках и штрафах — с 1 января 2026 года. Это значит, что прямо сейчас за использование иностранных слов на сайте, в рекламе и в публичных документах уже могут оштрафовать.

Закон касается всех, кто публикует информацию, адресованную неограниченному кругу лиц на территории РФ. Это интернет-магазины, сайты компаний, маркетплейсы, рекламные площадки, государственные и муниципальные порталы, СМИ. Если ваш сайт содержит англицизмы — слова, заимствованные из английского языка и не включённые в нормативные словари, — вы рискуете получить штраф.

Размеры штрафов по 168-ФЗ

  • Для граждан: от 2 000 до 4 000 ₽
  • Для должностных лиц: от 5 000 до 20 000 ₽
  • Для юридических лиц: от 100 000 до 500 000 ₽

Подробнее — в статье «Штрафы за англицизмы в 2026 году».

При этом штрафы накладываются за каждый случай нарушения. Если на сайте 50 страниц и на каждой по несколько англицизмов — это потенциально десятки отдельных нарушений. Именно поэтому проверка сайта 168-ФЗ стала критически важной задачей для любого бизнеса с онлайн-присутствием.

2. Что именно нужно проверять

Поиск англицизмов на сайте — это не просто проверка главной страницы. Закон распространяется на любую публичную информацию. Вот полный перечень элементов, которые необходимо проверить:

Текстовый контент

  • • Заголовки и подзаголовки (h1–h6)
  • • Тексты страниц и статей
  • • Описания товаров и услуг
  • • Условия доставки и оплаты
  • • Пользовательские соглашения

Элементы интерфейса

  • • Кнопки (Buy, Add to cart, Subscribe)
  • • Навигационное меню
  • • Подписи к формам
  • • Всплывающие подсказки (tooltip)
  • • Баннеры и промо-блоки

Карточки товаров

  • • Названия товаров
  • • Характеристики и размеры
  • • Отзывы и рейтинги
  • • Карточки на маркетплейсах

Медиа и метаданные

  • • Alt-тексты изображений
  • • Подписи к видео
  • • Meta-описания страниц
  • • Тексты на изображениях (OCR)

Особое внимание стоит уделить карточкам товаров. Если вы продаёте на маркетплейсах, проверяйте не только свой сайт, но и карточки на Wildberries, Ozon, Яндекс Маркет. Подробнее об этом — в статье «Какие иностранные слова запрещены по 168-ФЗ».

3. Проблема SPA-сайтов: почему обычный парсер не справится

Современные сайты часто строятся на JavaScript-фреймворках: React, Vue, Angular, Next.js, Nuxt. Такие сайты называются SPA (Single Page Application) или SSR-приложениями. Их ключевая особенность — контент генерируется прямо в браузере на стороне клиента.

Если вы попытаетесь проверить SPA-сайт обычным парсером (например, скачаете HTML через curl или requests), вы получите пустую страницу с тегом <div id="app"></div> и ссылками на JavaScript-файлы. Никакого текста, никаких кнопок, никаких описаний — парсер их просто не увидит.

Почему это важно

По данным BuiltWith, более 40% коммерческих сайтов в Рунете используют JavaScript-фреймворки для рендеринга контента. Если ваш инструмент проверки не умеет выполнять JavaScript — он пропустит большую часть англицизмов.

Чисторечь решает эту проблему, используя полноценный браузерный движок (Playwright/Chromium) для загрузки страниц. Сервис дожидается полной отрисовки контента, выполнения JavaScript, загрузки динамических элементов и только после этого извлекает текст для анализа. Это значит, что проверяется именно то, что видят ваши пользователи и что увидит проверяющий орган.

Кроме того, сервис обрабатывает:

  • Динамически подгружаемые блоки (lazy loading)
  • Контент, появляющийся по событиям (раскрывающиеся FAQ, табы)
  • Содержимое фреймов и вложенных компонентов
  • Тексты на изображениях (OCR через Яндекс Vision)

4. Пошаговая инструкция проверки через Чисторечь

Разберём пошагово, как проверить сайт на англицизмы с помощью сервиса Чисторечь. Весь процесс занимает от 30 секунд для одной страницы до нескольких минут для полного обхода домена.

1

Регистрация через Яндекс ID

Перейдите на чисторечь.рф и нажмите кнопку «Войти». Авторизация происходит через Яндекс ID — никаких паролей и регистрационных форм. Нажмите «Войти с Яндекс ID», подтвердите доступ, и вы сразу попадёте в рабочую панель.

При первом входе вам начисляются бесплатные лимиты для пробной проверки.

2

Выбор типа проверки «URL / Сайт»

В рабочей панели выберите вкладку «URL / Сайт». Этот режим предназначен для проверки веб-страниц. Помимо него доступны режимы «Текст», «Файл», «Изображение», «Архив» и «Код» — но для проверки сайта нам нужен именно URL.

3

Ввод URL страницы

Вставьте адрес страницы, которую хотите проверить. Можно ввести как одну ссылку, так и несколько (каждую с новой строки). Сервис принимает любые публичные URL, включая страницы маркетплейсов, посадочные страницы и одностраничные приложения.

Если вы хотите проверить весь домен целиком, поставьте галочку «Обойти весь домен» — сервис автоматически найдёт и проверит все страницы (до 500 на корпоративном тарифе).

4

Получение отчёта с англицизмами и заменами

После запуска анализа сервис выполняет несколько этапов: загружает страницу через браузерный движок, извлекает весь видимый текст, отправляет его на ИИ-анализ и дополнительно сканирует латинские вхождения. Через несколько секунд вы получите отчёт, содержащий:

  • Список найденных англицизмов с указанием количества вхождений
  • Русские замены для каждого слова
  • Контекст использования — где именно на странице встретилось слово
  • Скриншоты текстов на изображениях (если включён OCR)

Отчёт можно экспортировать в CSV для передачи разработчикам или редакторам.

5

Обход всего домена (до 500 страниц)

Для полной проверки сайта 168-ФЗ недостаточно проверить одну страницу. Функция обхода домена автоматически находит все доступные страницы вашего сайта (через sitemap.xml и внутренние ссылки), загружает каждую через браузерный движок и анализирует содержимое.

Количество страниц зависит от тарифа: от 3 страниц на базовом до 500 на корпоративном. Для среднего интернет-магазина (50–100 страниц) подойдёт тариф «Бизнес». Результаты сохраняются в истории — вы всегда можете вернуться к ним.

5. Что делать с результатами

Получив отчёт, важно правильно расставить приоритеты. Не все англицизмы одинаково рискованны, и не все нужно заменять в первую очередь.

Приоритезация замен

Критично

Слова на публичных страницах: главная, каталог, карточки товаров, условия доставки. Эти страницы проверяют в первую очередь. Замените «sale» на «распродажа», «cashback» на «возврат средств», «delivery» на «доставка».

Важно

Элементы интерфейса: кнопки, навигация, формы. Часто содержат англицизмы «Login», «Cart», «Wishlist». Замените на русские аналоги: «Войти», «Корзина», «Избранное».

Умеренно

Тексты в блогах, статьях, описаниях. Здесь контекст важен: слово «маркетинг» может быть допустимо, если оно есть в нормативном словаре, а «контент-менеджер» — нет.

Работа с разработчиками

Экспортируйте результаты в CSV и передайте список замен разработчикам или редакторам сайта. Рекомендуемый процесс:

  1. Скачайте CSV с результатами анализа из Чисторечь
  2. Отфильтруйте англицизмы по страницам и приоритету
  3. Создайте задачи в трекере (Jira, YouTrack, Kaiten) на замену слов
  4. Проведите повторную проверку после внесения изменений
  5. Настройте регулярные проверки — контент обновляется, новые англицизмы могут появляться

Обратите внимание: некоторые слова не требуют замены. Товарные знаки (iPhone, Samsung), общепринятые технические термины из нормативных словарей и слова в цитатах — исключения из закона. Сервис Чисторечь учитывает контекст и помечает такие слова отдельно.

6. Преимущества ИИ-анализа перед ручной проверкой

Можно ли проверить сайт вручную? Технически — да. Но на практике ручная проверка неэффективна по нескольким причинам.

Критерий Ручная проверка ИИ-анализ (Чисторечь)
Скорость Часы и дни Секунды на страницу
Полнота Человек пропускает 20–40% слов ИИ + regex-сканер латиницы
Контекст Субъективная оценка Анализ контекста ИИ-моделью
SPA-сайты Нужно открывать каждую страницу Автоматический JS-рендеринг
Замены Нужно искать самостоятельно Готовые русские замены
Масштаб 1–5 страниц в час До 500 страниц за запуск
Изображения Нужно читать глазами OCR через Яндекс Vision

Словарная проверка (простое сравнение со списком слов) тоже недостаточна. Она не учитывает контекст: слово «кейс» допустимо как «чемодан», но запрещено в значении «бизнес-случай». ИИ-анализ Чисторечь понимает контекст и определяет, является ли слово англицизмом именно в данном употреблении.

Помимо ИИ, сервис использует двойную проверку: после анализа искусственным интеллектом запускается regex-сканер, который ищет все латинские вхождения в тексте. Это гарантирует, что ни одно иностранное слово не будет пропущено — даже если ИИ-модель по какой-то причине его не отметила.

7. Итоги

Проверить сайт на англицизмы в 2026 году — это не рекомендация, а необходимость. Закон 168-ФЗ уже действует, штрафы реальны, а проверки становятся системными.

Краткий план действий

  1. Зарегистрируйтесь на чисторечь.рф через Яндекс ID
  2. Проверьте главную страницу и ключевые разделы в режиме «URL / Сайт»
  3. Запустите полный обход домена для комплексной проверки
  4. Скачайте отчёт и передайте разработчикам список замен
  5. Проведите повторную проверку после исправлений
  6. Настройте регулярные проверки — контент обновляется

Не ждите, пока к вам придёт проверка. Закон касается всех, кто публикует информацию на русском языке в публичном пространстве. Чем раньше вы приведёте сайт в соответствие с требованиями 168-ФЗ, тем меньше рисков для вашего бизнеса.

Проверьте свой сайт прямо сейчас

Закон 168-ФЗ уже действует. ИИ-анализ найдёт все англицизмы и предложит русские замены за секунды.

Начать проверку