Team: Dog House
Хакатон: Т1 в Нижнем Новгороде
- не только отслеживает доступность сайтов,
- но и предсказывает сбои заранее,
- автоматически формирует план действий для команды с помощью ML и LLM.
✅ модульность
✅ надёжность
✅ лёгкий деплой
✅ минимальное время до реакции (MTTD/MTTR)
- 🔍 Crawler / планировщик — регулярные проверки сайтов (HTTP/HTTPS, SSL, response time, status code, content size, html size, console logs, full load time).
- 📡 REST API + документация для доступа к метрикам и результатам анализа.
- 📊 Веб-дашборд — цветовая индикация, карточки сайтов, графики пинга (последний час).
- 🤖 Telegram-бот — оповещения, графики производительности и прогноз от ML.
- 📈 Модель временных рядов (Prophet) для предсказания сбоев.
- 🧠 LLM (Gemini + RAG) — при аномалии: формирование задачи, поиск решения и распределение по ответственным.
- 🐳 Docker — всё как набор микросервисов для удобного деплоя.
- Строит "коридор нормы" с учетом сезонности.
- Работает в двух режимах:
- Прогноз — ищет сбой в будущем.
- Анализ истории — выявляет уже случившиеся резкие аномалии.
- TF-IDF преобразует логи в векторы.
- K-Means группирует ошибки → выявление массового типа сбоя.
- На вход: данные аномалии + сводка логов.
- DuckDuckGO ищет контекст (RAG).
- Gemini формирует структурированный отчет: описание проблемы + план действий.
⚠️ Оповещения о сбоях (с разделением по ролям: DevOps / Backend / SRE).- 📊 График пинга за последние проверки.
- 🔮 Прогноз стабильности ("Все стабильно" / "Возможны сбои").
git clone https://github.com/NSO-Clio/ActiveMonitor.git
cd ActiveMonitor
docker-compose up --build