Наш технический бот стал примером того, как инициатива и автоматизация могут улучшить качество работы сайтов без дополнительного бюджета: ошибки обнаруживаются почти мгновенно, исправляются быстрее, повторяются реже, а пользователи меньше сталкиваются с «падающими» страницами. Это решение повысило стабильность проектов и создало новый стандарт контроля качества, который продолжает развиваться: мы уже можем добавить отслеживание скорости загрузки страниц, ошибок фронтенда, аномальных всплесков проблем, корректности индексации и многое другое.
Вместе с этим существенно уменьшилось и время жизни самих ошибок. То, что раньше могло висеть неделями, теперь исправляется в течение суток - примерно в 5-10 раз быстрее, чем раньше. Благодаря тому что бот группирует повторяющиеся сбои и показывает динамику одних и тех же ошибок, удалось устранить проблемы в логике фильтров, привести к порядку некорректные запросы и закрыть баги, которые появлялись много лет. В результате количество повторных ошибок сократилось примерно на 40%, а общее число критических сбоев, заметных пользователям, уменьшилось на 20-30%.
Мы всегда ищем способы улучшить работу проектов, с которыми сотрудничаем, поэтому по собственной инициативе предложили и внедрили технический Telegram-бот, который автоматически отслеживает критические ошибки на сайтах и сообщает о них в момент появления. Это решение стало важным шагом в сторону автоматизации, прозрачности и повышения качества пользовательского опыта.
Как технический Telegram-бот помог улучшить стабильность сайтов и сократить время обнаружения ошибок на 98%
на столько уменьшилось общее число критических сбоев, заметные пользователям
Раньше критические ошибки обнаруживались в основном от жалоб пользователей или случайно при выборочных проверках. Многие проблемы могли существовать от одного до семи дней, а некоторые «жившие» годами баги проявлялись только при редких условиях, и их было сложно поймать. После запуска бота ситуация изменилась полностью. Теперь каждая новая ошибка фиксируется в течение 1-10 минут после возникновения, что позволило сократить время её обнаружения на 95–98%.
на столько уменьшилось время обнаружения критических ошибок
Скоро здесь появится описание реализованного кейса