Журнал обновлений
Как мы улучшаем алгоритм и учим его тонкостям русского языка.
Разобрались со сложными словами и обновили интерфейс
Мы протестировали алгоритм на текстах с подвохом — там, где часто путаются не только программы, но и живые корректоры. Улучшили правила для самых спорных слов.
- Небо или нёбо: Теперь алгоритм понимает разницу. Если речь идет об анатомии (например, «воспаленное нёбо»), он ставит букву «ё». Если о природе («чистое небо») — оставляет «е».
- Все или всё: Закрыли самую частую проблему. Система научилась различать ситуации, когда говорится о людях («все жильцы спали»), и когда о действиях («всё ещё метёт»).
- Внешний вид: Убрали строгие холодные цвета, сделали дизайн более светлым и спокойным. На главную добавили демо-текст, чтобы можно было сразу увидеть, как работает подсветка замен и сомнений алгоритма.
Отказ от тяжелых моделей в пользу строгих правил
Мы поняли, что использовать громоздкие нейросети для расстановки одной буквы — это избыточно. Они потребляли много ресурсов сервера и, что самое неприятное, иногда самовольно меняли знаки препинания.
Что мы сделали:
- Убрали тяжелые машинные алгоритмы.
- Написали быстрый анализатор на основе строгих правил синтаксиса.
- Научили систему ориентироваться на контекст. Например, она понимает разницу между животным («упрямый осёл») и действием («осел в снег»).
В результате обработка текста стала моментальной, а ошибки из-за "фантазий" алгоритма полностью исчезли.
Запуск проекта
День рождения сервиса. Первая версия была запущена с использованием базовых методов анализа. Это дало нам хороший старт и понимание того, как именно нужно развивать инструмент, чтобы он стал по-настоящему полезным, точным и быстрым.