Как проверить сайт на англицизмы: пошаговая инструкция
С 1 марта 2025 года в России действует закон 168-ФЗ, обязывающий использовать русский язык во всех публичных коммуникациях. Штрафы за англицизмы на сайтах могут достигать 500 000 ₽. В этой статье — пошаговая инструкция, как проверить сайт на англицизмы быстро и без ошибок.
1. Зачем проверять сайт на англицизмы
Федеральный закон 168-ФЗ «О внесении изменений в Федеральный закон „О государственном языке Российской Федерации"» вступил в силу поэтапно: основные нормы — с 1 марта 2025 года, а положения о проверках и штрафах — с 1 января 2026 года. Это значит, что прямо сейчас за использование иностранных слов на сайте, в рекламе и в публичных документах уже могут оштрафовать.
Закон касается всех, кто публикует информацию, адресованную неограниченному кругу лиц на территории РФ. Это интернет-магазины, сайты компаний, маркетплейсы, рекламные площадки, государственные и муниципальные порталы, СМИ. Если ваш сайт содержит англицизмы — слова, заимствованные из английского языка и не включённые в нормативные словари, — вы рискуете получить штраф.
Размеры штрафов по 168-ФЗ
- Для граждан: от 2 000 до 4 000 ₽
- Для должностных лиц: от 5 000 до 20 000 ₽
- Для юридических лиц: от 100 000 до 500 000 ₽
Подробнее — в статье «Штрафы за англицизмы в 2026 году».
При этом штрафы накладываются за каждый случай нарушения. Если на сайте 50 страниц и на каждой по несколько англицизмов — это потенциально десятки отдельных нарушений. Именно поэтому проверка сайта 168-ФЗ стала критически важной задачей для любого бизнеса с онлайн-присутствием.
2. Что именно нужно проверять
Поиск англицизмов на сайте — это не просто проверка главной страницы. Закон распространяется на любую публичную информацию. Вот полный перечень элементов, которые необходимо проверить:
Текстовый контент
- • Заголовки и подзаголовки (h1–h6)
- • Тексты страниц и статей
- • Описания товаров и услуг
- • Условия доставки и оплаты
- • Пользовательские соглашения
Элементы интерфейса
- • Кнопки (Buy, Add to cart, Subscribe)
- • Навигационное меню
- • Подписи к формам
- • Всплывающие подсказки (tooltip)
- • Баннеры и промо-блоки
Карточки товаров
- • Названия товаров
- • Характеристики и размеры
- • Отзывы и рейтинги
- • Карточки на маркетплейсах
Медиа и метаданные
- • Alt-тексты изображений
- • Подписи к видео
- • Meta-описания страниц
- • Тексты на изображениях (OCR)
Особое внимание стоит уделить карточкам товаров. Если вы продаёте на маркетплейсах, проверяйте не только свой сайт, но и карточки на Wildberries, Ozon, Яндекс Маркет. Подробнее об этом — в статье «Какие иностранные слова запрещены по 168-ФЗ».
3. Проблема SPA-сайтов: почему обычный парсер не справится
Современные сайты часто строятся на JavaScript-фреймворках: React, Vue, Angular, Next.js, Nuxt. Такие сайты называются SPA (Single Page Application) или SSR-приложениями. Их ключевая особенность — контент генерируется прямо в браузере на стороне клиента.
Если вы попытаетесь проверить SPA-сайт обычным парсером (например, скачаете HTML через curl или requests), вы получите пустую страницу с тегом <div id="app"></div> и ссылками на JavaScript-файлы. Никакого текста, никаких кнопок, никаких описаний — парсер их просто не увидит.
Почему это важно
По данным BuiltWith, более 40% коммерческих сайтов в Рунете используют JavaScript-фреймворки для рендеринга контента. Если ваш инструмент проверки не умеет выполнять JavaScript — он пропустит большую часть англицизмов.
Чисторечь решает эту проблему, используя полноценный браузерный движок (Playwright/Chromium) для загрузки страниц. Сервис дожидается полной отрисовки контента, выполнения JavaScript, загрузки динамических элементов и только после этого извлекает текст для анализа. Это значит, что проверяется именно то, что видят ваши пользователи и что увидит проверяющий орган.
Кроме того, сервис обрабатывает:
- Динамически подгружаемые блоки (lazy loading)
- Контент, появляющийся по событиям (раскрывающиеся FAQ, табы)
- Содержимое фреймов и вложенных компонентов
- Тексты на изображениях (OCR через Яндекс Vision)
4. Пошаговая инструкция проверки через Чисторечь
Разберём пошагово, как проверить сайт на англицизмы с помощью сервиса Чисторечь. Весь процесс занимает от 30 секунд для одной страницы до нескольких минут для полного обхода домена.
Регистрация через Яндекс ID
Перейдите на чисторечь.рф и нажмите кнопку «Войти». Авторизация происходит через Яндекс ID — никаких паролей и регистрационных форм. Нажмите «Войти с Яндекс ID», подтвердите доступ, и вы сразу попадёте в рабочую панель.
При первом входе вам начисляются бесплатные лимиты для пробной проверки.
Выбор типа проверки «URL / Сайт»
В рабочей панели выберите вкладку «URL / Сайт». Этот режим предназначен для проверки веб-страниц. Помимо него доступны режимы «Текст», «Файл», «Изображение», «Архив» и «Код» — но для проверки сайта нам нужен именно URL.
Ввод URL страницы
Вставьте адрес страницы, которую хотите проверить. Можно ввести как одну ссылку, так и несколько (каждую с новой строки). Сервис принимает любые публичные URL, включая страницы маркетплейсов, посадочные страницы и одностраничные приложения.
Если вы хотите проверить весь домен целиком, поставьте галочку «Обойти весь домен» — сервис автоматически найдёт и проверит все страницы (до 500 на корпоративном тарифе).
Получение отчёта с англицизмами и заменами
После запуска анализа сервис выполняет несколько этапов: загружает страницу через браузерный движок, извлекает весь видимый текст, отправляет его на ИИ-анализ и дополнительно сканирует латинские вхождения. Через несколько секунд вы получите отчёт, содержащий:
- Список найденных англицизмов с указанием количества вхождений
- Русские замены для каждого слова
- Контекст использования — где именно на странице встретилось слово
- Скриншоты текстов на изображениях (если включён OCR)
Отчёт можно экспортировать в CSV для передачи разработчикам или редакторам.
Обход всего домена (до 500 страниц)
Для полной проверки сайта 168-ФЗ недостаточно проверить одну страницу. Функция обхода домена автоматически находит все доступные страницы вашего сайта (через sitemap.xml и внутренние ссылки), загружает каждую через браузерный движок и анализирует содержимое.
Количество страниц зависит от тарифа: от 3 страниц на базовом до 500 на корпоративном. Для среднего интернет-магазина (50–100 страниц) подойдёт тариф «Бизнес». Результаты сохраняются в истории — вы всегда можете вернуться к ним.
5. Что делать с результатами
Получив отчёт, важно правильно расставить приоритеты. Не все англицизмы одинаково рискованны, и не все нужно заменять в первую очередь.
Приоритезация замен
Слова на публичных страницах: главная, каталог, карточки товаров, условия доставки. Эти страницы проверяют в первую очередь. Замените «sale» на «распродажа», «cashback» на «возврат средств», «delivery» на «доставка».
Элементы интерфейса: кнопки, навигация, формы. Часто содержат англицизмы «Login», «Cart», «Wishlist». Замените на русские аналоги: «Войти», «Корзина», «Избранное».
Тексты в блогах, статьях, описаниях. Здесь контекст важен: слово «маркетинг» может быть допустимо, если оно есть в нормативном словаре, а «контент-менеджер» — нет.
Работа с разработчиками
Экспортируйте результаты в CSV и передайте список замен разработчикам или редакторам сайта. Рекомендуемый процесс:
- Скачайте CSV с результатами анализа из Чисторечь
- Отфильтруйте англицизмы по страницам и приоритету
- Создайте задачи в трекере (Jira, YouTrack, Kaiten) на замену слов
- Проведите повторную проверку после внесения изменений
- Настройте регулярные проверки — контент обновляется, новые англицизмы могут появляться
Обратите внимание: некоторые слова не требуют замены. Товарные знаки (iPhone, Samsung), общепринятые технические термины из нормативных словарей и слова в цитатах — исключения из закона. Сервис Чисторечь учитывает контекст и помечает такие слова отдельно.
6. Преимущества ИИ-анализа перед ручной проверкой
Можно ли проверить сайт вручную? Технически — да. Но на практике ручная проверка неэффективна по нескольким причинам.
| Критерий | Ручная проверка | ИИ-анализ (Чисторечь) |
|---|---|---|
| Скорость | Часы и дни | Секунды на страницу |
| Полнота | Человек пропускает 20–40% слов | ИИ + regex-сканер латиницы |
| Контекст | Субъективная оценка | Анализ контекста ИИ-моделью |
| SPA-сайты | Нужно открывать каждую страницу | Автоматический JS-рендеринг |
| Замены | Нужно искать самостоятельно | Готовые русские замены |
| Масштаб | 1–5 страниц в час | До 500 страниц за запуск |
| Изображения | Нужно читать глазами | OCR через Яндекс Vision |
Словарная проверка (простое сравнение со списком слов) тоже недостаточна. Она не учитывает контекст: слово «кейс» допустимо как «чемодан», но запрещено в значении «бизнес-случай». ИИ-анализ Чисторечь понимает контекст и определяет, является ли слово англицизмом именно в данном употреблении.
Помимо ИИ, сервис использует двойную проверку: после анализа искусственным интеллектом запускается regex-сканер, который ищет все латинские вхождения в тексте. Это гарантирует, что ни одно иностранное слово не будет пропущено — даже если ИИ-модель по какой-то причине его не отметила.
7. Итоги
Проверить сайт на англицизмы в 2026 году — это не рекомендация, а необходимость. Закон 168-ФЗ уже действует, штрафы реальны, а проверки становятся системными.
Краткий план действий
- Зарегистрируйтесь на чисторечь.рф через Яндекс ID
- Проверьте главную страницу и ключевые разделы в режиме «URL / Сайт»
- Запустите полный обход домена для комплексной проверки
- Скачайте отчёт и передайте разработчикам список замен
- Проведите повторную проверку после исправлений
- Настройте регулярные проверки — контент обновляется
Не ждите, пока к вам придёт проверка. Закон касается всех, кто публикует информацию на русском языке в публичном пространстве. Чем раньше вы приведёте сайт в соответствие с требованиями 168-ФЗ, тем меньше рисков для вашего бизнеса.