Перейти к содержимому

Релизы GMONIT

Поставка GMONIT включает в себя два docker образа публикуемых в yandex container registry:

  • collector — содержит java сервер принимающий данные мониторинга;
  • grafana — содержит Grafana со встроенной визуализацией данных мониторинга.

Оба образа публикуются с тегами версий двух видов и содержат сборки, которые прошли наше ревью:

  1. v4 — самая свежая сборка;
  2. v4-12345 — сборка под конкретным номером.

В процессе релиза мы публикуем тег с номером сборки прошедшей наш staging процесс.

Например, релиз 31 июля 2025 имеет номер сборки 4590 и опубликован со следующими тегами:

cr.yandex/c...j/collector:v4
cr.yandex/c...j/collector:v4-4590
cr.yandex/c...j/grafana:v4
cr.yandex/c...j/grafana:v4-4590

Номерной тег v4-4590 всегда будет содержать один и тот же образ и никогда не будет изменен. Тег v4 через некоторое время начнёт указывать уже на другую более свежую сборку, проходящую staging процесс.

Для production систем рекомендуем использовать теги с номером сборки.

  • v4-6560 🆕 Добавлена кнопка копирования SLO. Теперь можно создать новый SLO на основе существующего — все параметры скопируются в форму создания.
  • v4-6558 ✨ Главная страница GMONIT теперь учитывает дашборд, выбранный в настройках профиля Grafana.
  • v4-6557 🔧 Исправлены нерабочие ссылки на страницах ошибок и транзакций — ссылки на несуществующие трейсы и транзакции «Unknown» больше не кликабельны.
  • v4-6554 🔧 1С: исправлен подсчёт сеансов и лицензий, исправлены пустые ссылки в таблице ошибок.
  • v4-6553 🆕 1С: расширены страницы СУБД и блокировок кластера — добавлены панели дедлоков, таймаутов СУБД и таблица длительности блокировок.
  • v4-6547 🔧 Исправлена ошибка, из-за которой панели пользовательских дашбордов игнорировали настройку минимального интервала.
  • v4-6533 🔧 Исправлена точность порогов в шаблонах алертов.
  • v4-6528 ✨ Добавлен выпадающий список пользовательских дашбордов на страницах APM и браузерного мониторинга. Для привязки используйте теги custom_nr_apm_app и custom_nr_browser_app.
  • v4-6523 🔧 Исправления в карточке инцидента: корректная фильтрация инцидентов по ML-движку, исправлен сброс временного диапазона.
  • v4-6512 ✨ Добавлен выпадающий список пользовательских дашбордов на главной странице. Чтобы дашборд появился в списке, добавьте ему тег custom_main_page в настройках Grafana.
  • v4-6509 🔧 Исправлено отображение SLI и error budget панелей на периоде 28 дней.
  • v4-6508 🆕 Добавлена кнопка удаления SLO.
  • v4-6507 ✨ В карточке инцидента автоматически скрываются пустые панели.
  • v4-6503 ✨ Улучшено отображение чисел на панелях SLO — динамическое количество знаков после запятой.
  • v4-6502 🔧 Исправлена ошибка, из-за которой основной SLO-алерт не срабатывал.
  • v4-6492 🔧 Исправления в менеджере инцидентов: устранено дублирование алертов, ошибки отображения таймлайна и валидации.
  • v4-6482 🆕 Добавлена страница настройки хранения данных — можно задать период хранения для каждого типа данных.
  • v4-6441 🔧 Исправлено отображение повторяющихся панелей и строк в дашбордах.
  • v4-6440 ✨ Исправлены единицы измерения памяти — теперь используются двоичные единицы (GiB) вместо десятичных (GB).
  • v4-6439 ✨ В панели GMONIT Stat добавлена возможность выбора функции агрегации.
  • v4-6428 ✨ Улучшен менеджер инцидентов — обновлена логика анализа алертов и обнаружения аномалий.
  • v4-6422 🔧 Исправлено отображение трейсов транзакций.
  • v4-6394 ✨ Добавлена возможность просматривать и редактировать панели стандартных дашбордов. Можно изменить запрос панели, но сохранить изменения в коробочном дашборде нельзя.
  • v4-6390 🆕 Добавлена ML-корреляция аномалий с обучением через обратную связь в карточке инцидента (лайки/дизлайки). Для подключения функции обратитесь в поддержку.
  • v4-6388 ✨ Панели из коробочных дашбордов теперь можно копировать в пользовательские дашборды.
  • v4-6382 ✨ Добавлен алерт об истечении лицензии и баннер-уведомление в интерфейсе.
  • v4-6377 ✨ Улучшен менеджер инцидентов — объединена обработка алертов и выбросов в единый механизм.
  • v4-6358 🆕 Новая визуализация панели GMONIT Stat.
  • v4-6357 ✨ Добавлена экспериментальная возможность отображать URL как имя транзакции. Для включения задайте переменную Grafana GMONIT_GRAFANA_SHORT_TX_NAMES=true
  • v4-6341 ✨ В панели ошибок добавлены быстрые ссылки в заголовке для перехода к связанным данным.
  • v4-6325 ✨ На страницу хостов добавлены метрики inode и uptime.
  • v4-6324 ✨ Обновлен интерфейс дашбордов мониторинга Oracle DB.
  • v4-6274 ✨ Улучшено отображение ошибок ЖР 1С. Теперь используется выдвижная панель вместо вложенной таблицы
  • v4-6272 🔧 Исправления обработки метрик и приёма мобильных данных.
  • v4-6241 ✨ Полностью переработана страница просмотра отчёта об ошибке.
  • v4-6239 🔧 Исправления интерфейса и панелей мониторинга.
  • v4-6220 🆕 Домашняя страница добавлена в новый UI.
  • v4-6212 ✨ Обновлены панели HTTP/AJAX статус-кодов.
  • v4-6182 ✨ Пользовательские дашборды интегрированы в сайдбар навигации. Добавьте тег gmonit_sidebar_top или gmonit_sidebar_bottom, чтобы дашборд появился в верхней или нижней части сайдбара.
  • v4-6179 🆕 Добавлены fast burn и slow burn алерты для SLO.
  • v4-6161 🚀 Добавлен расчёт SLI со скользящим окном
  • v4-6158 ✨ Добавлены дополнительные фильтры на страницы 1С мониторинга.
  • v4-6151 🔧 Исправления панелей транзакций.
  • v4-6141 🚀 Добавлена поддержка реплицируемых функций в ClickHouse.
  • v4-6137 ✨ Версия GMONIT теперь отображается в меню профиля пользователя.
  • v4-6099 🆕 Новый интерфейс управления инцидентами. Карточка инцидента теперь показывает затронутые сервисы, таймлайн алертов и выбросов, пиковые метрики и связанные трассировки — всё в одном месте для быстрого анализа.
  • v4-6096 ✨ Улучшения страницы SLO: добавлены лейблы, автоматический расчёт error budget на основе SLI, исправлена валидация формы.
  • v4-6070 ✨ Улучшения интерфейса: индикаторы загрузки, русификация выбора временного диапазона.
  • v4-6060 🚀 Оптимизирован запрос карты сервисов — быстрее загрузка и стабильнее результаты.
  • v4-6051 🔧 Исправления дашбордов инфраструктурного мониторинга: панели CPU и хранилища.
  • v4-6023 🆕 Кастомные дашборды теперь отображаются внутри интерфейса GMONIT. Навигация между стандартными и пользовательскими дашбордами стала единой.
  • v4-5977 🔧 Исправлено отображение заголовка внутри панелей.
  • v4-5972 🔧 Исправлена панель использования памяти в мониторинге 1С.
  • v4-5954 🆕 Добавлена страница SLO. Теперь можно задавать целевые показатели качества сервисов и отслеживать их выполнение.
  • v4-5945 ✨ Добавлена возможность развернуть панель на весь экран.
  • v4-5933 🔧 Исправления дашбордов мониторинга 1С.
  • v4-5928 ✨ Улучшения интерфейса.
  • v4-5885 🆕 Добавлена тёмная тема GMONIT!
  • v4-5881 ✨ Редизайн заголовка — обновлённый хедер стал компактнее и удобнее для навигации.
  • v4-5821 🆕 Поддержан сбор дополнительной метаинформация инфраструктурного мониторинга. Теперь можно получать огромное кол-во справочной информации про наблюдаемые системы.
  • v4-5825 🔧 Исправлены пробелы на странице summary для NGINX.
  • v4-5763 🔧 Исправлена нормализация имён хостов между 1С и инфраструктурным мониторингом.
  • v4-5762 🔧 Исправлен подсчёт ошибок в журнале событий 1С.
  • v4-5700 ✨ На карту сервисов добавлен фильтр по окружениям. Упрощает навигацию в инсталляциях с несколькими окружениями.
  • v4-5699 🔧 Исправлено отображение вложенных таблиц в журнале событий 1С.
  • v4-5697 ✨ Добавлены тултипы для элементов сайдбара в свёрнутом состоянии. Теперь при наведении видно название раздела.
  • v4-5689 ✨ Улучшения элементов управления дизайна.
  • v4-5609 ✨ Улучшения дизайна.
  • v4-5569 🆕 Новый домашний дашборд для мониторинга 1С. Он показывает сводный статус всех информационных баз, кластеров и хостов, позволяя быстро оценить состояние всей инфраструктуры и моментально замечать проблемные зоны.
  • v4-5567 🔧 Исправлена ошибка приёма обработанных исключений мобильного мониторинга.
  • v4-5555 🆕 Новый дизайн!
  • v4-5549 🔧 Исправлено несоответствие суммарных показателей на домашнем дашборде данным в сотах. Теперь агрегированные значения полностью консистентны.
  • v4-5540 🔧 По умолчанию на домашней странице показываются только сервисы с environment=production или без указанного environment. Сервисы GMONIT теперь скрыты по умолчанию. Для изменения поведения задавайте переменную окружения Grafana:
    Окно терминала
    GMONIT_ENVIRONMENT_FILTER_DEFAULTS=production,staging
    Указывайте желаемые значения фильтра environment через запятую.
  • v4-5537 🚀 Исправлена производительность SQL-запроса панели вызовов базы данных в APM.
  • v4-5528 🔧 Исправлен запрос подсчёта частоты ошибок в APM — показатели ошибок теперь соответствуют данным с других дашбордов и реальным данным.
  • v4-5524 🔧 Исправлена панель памяти для MSSQL — корректное отображение использования памяти и порогов.
  • v4-5449 🆕 Добавлен движок создания инцидентов на основе выбросов.
  • v4-5443 🔧 Исправлен баг сервисной карты в сценарии с одним узлом — карта больше не ломается и корректно отображает одиночные сервисы.
  • v4-5430 🔧 Исправлено отображение ошибок в мобильных трассировках.
  • v4-5425 ✨ Улучшения интерфейса — набор мелких правок для повышения удобства и читабельности.
  • v4-5419 🔧 Добавлен лимит на отчёты об ошибках и ссылки на хосты — предотвращение перегрузки списков и ускорение загрузки страниц.
  • v4-5411 🔧 Исправлен регрессионный баг в форме создания алертов — форма снова работает корректно.
  • v4-5371 🆕 Добавлена preview-версия карточки инцидента — экспериментальная карточка для быстрого обзора инцидентов.
  • v4-5366 ✨ Дополнительные улучшения интерфейса.
  • v4-5320 ✨ В новый интерфейс добавлена кнопка «Поделиться» — короткие ссылки для совместной работы.
  • v4-5318 ✨ Улучшены дашборды мониторинга 1С — удобнее отслеживать состояние систем.
  • v4-5282 🔧 В новый UI GMONIT добавлена поддержка отображения данных legacy инфраструктурного мониторинга (данные, интеграция которых настроена до v5-4514).
  • v4-5279 🆕 Новые дашборды мониторинга здоровья кластеров 1С. Теперь можно отслеживать здоровье кластера в разрезах хостов, баз данных, процессов, сеансов.
  • v4-5261 🔧 Исправления интерфейса.
  • v4-5245 ✨ На экран просмотра трассировок транзакции добавлена фильтрация по ID пользователя.
  • v4-5191 🔧 Исправления интерфейса.
  • v4-5185 ✨ Названия ключевых метрик браузерного мониторинга переведены на русский.
  • v4-5180 🔧 Исправлена группировка URL в автоинструментированном браузерном мониторинге — агрегация и отчёты стали компактнее.
  • v4-5168 ✨ Временные графики теперь выводятся со сглаживанием — визуализация данных стала приятнее.
  • v4-5158 ✨ Добавлена поддержка вложенных breadcrumbs. Навигация стала нагляднее и удобнее.
  • v4-5155 🔧 Исправлены смещение и масштабирование в time picker. Выбор временного диапазона работает корректно.
  • v4-5125 🆕 Реализован фиксированный заголовок для Grafana App. Теперь панель управления остаётся на экране при прокрутке.
  • v4-5104 🔧 Исправлена передача временного диапазона в URL. Ссылки с сохранёнными параметрами снова работают.
  • v4-5103 🚀 Завершён перенос GMONIT на новый UI внутри Grafana Apps. Интерфейс стал современнее и удобнее.
  • v4-5077 🔧 Исправлена ошибка приёма браузерных данных. Сбор данных снова стабилен.
  • v4-5076 🔧 Исправлена ошибка приёма мобильных данных. Отчёты по мобильным приложениям формируются корректно.
  • v4-5056 🔧 Исправлено отображение количества ошибок в списке распределённых трассировок. Теперь цифры совпадают с реальным числом ошибок.
  • v4-5016 🔧 Исправлена работа панели externals/response.
  • v4-4962 🚀 Поддержана работа дашбордов 1С-мониторинга при числе процессов компонентов 1C более 1000. Масштабируемость повышена.
  • v4-4942 ✨ Добавлен фильтр окружения для RUM-приложений. Упрощает анализ данных по dev/test/prod.
  • v4-4908 🔧 Фиксы интерфейса, обновление плагинов Grafana. Интерфейс Grafana на русском языке
  • v4-4893 ✨ Фильтрация приложений по окружениям теперь доступна не только на домашней странице, но и в списке APM. Это упростит поиск нужных сервисов в больших установках.
  • v4-4892 🔧 Фиксы интерфейса, коррекция работы с timeseries-панелями.
  • v4-4888 🆕 Добавлены коробочные алерты, обновлены Grafana и зависимости. Готовые правила позволяют быстрее начать мониторинг.
  • v4-4879 🚀 Ускорение и повышение глубины аналитики технического журнала 1С. Анализ больших объёмов логов стал быстрее.
  • v4-4873 🔧 Фиксы интерфейса логов, панелей ошибок транзакций и перцентилей.
  • v4-4826 🆕 Добавлена настройка Apdex-T для каждого приложения. Теперь можно точнее оценивать пользовательский опыт.
  • v4-4824 🆕 Добавлен новый дашборд для технического журнала 1С. На дашборде предоставлена глубокая аналитика виновников таймаутов.
  • v4-4811 🔧 Фиксы интерфейса, обновления источников данных и SQL-запросов.
  • v4-4793 🔧 Исправлена фильтрация по ключу сущностей 1С.
  • v4-4791 🆕 Представляем новый UI: поддержано в модулях APM и распределённой трассировки. Навигация стала проще и удобнее.
  • v4-4787 🚀 Оптимизация производительности хранения и агрегации метрик. Сбор и обработка данных теперь занимают меньше ресурсов.
  • v4-4758 🆕 Добавлен алерт для кластеров 1С. Он поможет вовремя реагировать на сбои в инфраструктуре.
  • v4-4715 🔧 Исправлены панели ошибок по статус-кодам в мобильных дашбордах.
  • v4-4650 🚀 Ускорена автоматическая группировка URL-ов. Это делает аналитику запросов более наглядной.
  • v4-4642 ✨ Добавлена фильтрация контейнеров по лейблам на домашней странице. Упрощает работу в средах с большим числом сервисов.
  • v4-4620 🔧 Исправлена потеря сигналов о релизе новой версии (данных отправляемых на https://collector/api/v1/deployment-markers).
  • v4-4619 🔧 Исправлено отображение APM приложений без имени на карте сервисов. Такие приложения теперь отображаются как узел N/A. При обнаружении подобных узлов, проверьте, не потеряна ли в ваших приложениях перменная NEW_RELIC_APP_NAME.
  • v4-4590 🔧 Исправлена работа фильтров по ОС в панелях браузерного мониторинга и Page view. Теперь фильтрация работает корректно и предсказуемо.
  • v4-4572 🚀 Добавлена переменная окружения BROWSER_ENABLED_FLAGS. Управляйте активными функциями RUM-агента, чтобы гибко настраивать виды собираемых данных и снижать входящий трафик.
  • v4-4531 🆕️ Теперь текущая версия сборки отображается прямо в Grafana. Быстро проверяйте, какая версия системы мониторинга сейчас развернута. Данные видны по нажатию иконки с вопросительным знаком в правом верхнем углу.
  • v4-4514 🚀 Новая схема хранения инфраструктурных метрик! Занимает в 10 раз меньше места: 130 млн записей теперь занимает ~1 ГБ (было 12 млн). Запросы стали ощутимо быстрее. Такая оптимизация стала возможна благодаря переходу на v4 и обновлению ClickHouse. Как обновиться и использовать:
    1. Выберите способ обновления:
      • Способ 1, на коллекторе (Выбирайте этот вариант, если хотите обновить все агенты сразу и у вас нет кастомных дашбордов, которые трудно обновить.):
        • Укажите переменную окружения INFRA_1_ACTS_AS_INFRA_2=true
      • Способ 2, на агентах (Выбирайте этот вариант для постепенного перехода, если у вас есть кастомные дашборды, которые нужно успеть адаптировать под новую схему.):
        • Укажите infra2 вместо infra в адресе коллектора (этот путь полезен, когда хочется обновить не все инфраструктурные агенты, это бывает в случае, когда некоторые инфраструктурные агенты отправляют данные для кастомных дашбордов, которые трудозатратно переписывать)
          • NRIA_COLLECTOR_URL: https://gmonit.ваш-домен.ru/infra2/infra-api
          • NRIA_COMMAND_CHANNEL_URL: https://gmonit.ваш-домен.ru/infra2/command-api
          • NRIA_IDENTITY_URL: https://gmonit.ваш-домен.ru/infra2/identity-api
    2. Обновите кастомные дашборды:
      • Замените dev_infra_metrics_eventsnr_infra_metrics_events.
      • Обращения к столбцу json переписать с использования JSONExtract(json, 'путь', 'тип') на json.путь.:тип. Например JSONExtractString(json, 'urlcheck.networkPath') или JSONExtract(json, 'urlcheck.networkPath', 'String') заменить на json.urlcheck.networkPath.:String
  • v4-4494 🆕 Добавлен фильтр окружений на главной для APM приложений. Как использовать: через ; добавьте лейбл environment и его значение через : в env NEW_RELIC_LABELS агента (пример: NEW_RELIC_LABELS=environment:prod;version:1.0.0), а так же нужно обновить конфигурацию grafana, добавив строку GMONIT_ENVIRONMENT_FILTER_DEFAULTS: 'production,empty', где production и empty значение тэгов (labels) ваших окружений, которые используются в фильтрации по умолчанию. Пока доступно только для APM, в ближайших обновлениях будет дополнено также для инфраструктурного и браузерного мониторинга.

🚀 v4-4475 GMONIT v4: поддержка новых версий ClickHouse и Redis

Заголовок раздела «🚀 v4-4475 GMONIT v4: поддержка новых версий ClickHouse и Redis»

Выпускаем v4 — важное техническое обновление, которое закладывает фундамент для будущих улучшений производительности и оптимизации хранения данных.

Почему это важно: ClickHouse прекратил поддержку версий 23.8 и 24.3, а в ближайшие месяцы завершит поддержку 24.8. Мы переходим на актуальные версии, чтобы двигаться вперёд вместе с экосистемой.

  • Минимальные версии зависимостей:
    • ClickHouse — 25.3
    • Redis — 7.2
    • Datomic больше не требуется
  • Переменная окружения Collector с опечаткой BROWSER_MONTINORING_ENABLED больше не поддерживается. Используйте корректное название: BROWSER_MONITORING_ENABLED
  • Контейнер Grafana теперь требует наличие переменной окружения GMONIT_LICENSE, по аналогии с контейнером collector.

‼️ Если при обновлении на v4 версии зависимостей не соответствуют требованиям — коллектор не запустится и выдаст соответствующую ошибку.

В рамках v3 обновления по-прежнему не требуют дополнительных действий, и в течение года мы продолжим выпускать критические исправления.

v4 — это основа для будущих изменений, которые станут возможны только с актуальными зависимостями. Эти улучшения уже в разработке и скоро будут доступны.

  1. обновите тэг GMONIT Collector и Grafana до v4-xxxx, например v4-4475
  2. обновите Clickhouse до 25.3
  3. обновите Redis до 7.2
  4. удалите переменную окружения DATOMIC_URI у контейнера collector
  5. при необходимости замените переменную окружения GMONIT Collector BROWSER_MONTINORING_ENABLED, содержащую опечатку, на BROWSER_MONITORING_ENABLED
  6. задайте контейнеру Grafana переменную оружения GMONIT_LICENSE, по аналогии с контейнером GMONIT Collector
  7. остановите и удалите контейнер transactor
  8. перезапустите контейнеры
  • v3-4469 🔧 Исправлена поддержка приема и обработки логов Java-приложений. Данные теперь поступают корректно.
  • v3-4465 🆕️ Добавлены алерты доступности 1С кластера. Своевременно узнавайте о проблемах с его работой.
  • v3-4389 ✨ Теперь аннотации подключения APM агентов стали информативнее благодаря добавлению лейблов! Узнавайте, на каком хосте и с какой версией подключился агент. Управляйте лейблами через переменную окружения агента NEW_RELIC_LABELS. Кроме того, теперь аннотации подключения можно фильтровать по хосту для удобства анализа. 🏷️
  • v3-4388 🔧 Исправлено отображение метрик контейнеров на главной странице. 📊
  • v3-4384 🔧 Исправления ошибок приёма данных мобильного мониторинга. 📱
  • v3-4381 🆕 Новый дашборд для анализа ошибок! Теперь вы можете отслеживать динамику, дату возникновения ошибок, разбивку по транзакциям для выявления проблемных мест, а также разбивку по классам ошибок, чтобы видеть, как одна и та же ошибка влияет на множество транзакций. 🔍
  • v3-4363 🆕 Новый дашборд “Доступность веб-систем”! Теперь вы можете настраивать внешних наблюдателей для множества сервисов с опросами через различные сетевые маршруты. Дашборд предлагает удобный интерфейс для отслеживания статуса ваших микросервисных кластеров и крупных инфраструктур. 🌐
  • v3-4345 🔧 Исправление списка приложений работающих на хосте. 🖥️
  • v3-4344 🔧 Исправления несоответствий в показаниях суммарной статистики на домашней странице. 📈
  • v3-4316 🔧 Исправления графиков использования операций баз данных. 🔄
  • v3-4299 🆕 Представляем новое API для передачи сигнала о релизе новой версии приложения! Встраивайте API-вызов в процесс деплоя и наблюдайте за метками обновлений на ваших APM дашбордах. Пример использования:
    Окно терминала
    curl -v -X POST -H "Content-Type: application/json" \
    -d '{"app_name":"Имя вашего приложения","provider":"nr-apm","revision":"Название версии"}' \
    http://collector:8080/api/v1/deployment-markers
    Теперь вы легко заметите, как новые версии влияют на нагрузку и ошибки! 📤
  • v3-4221 🔧 Исправление ошибок переходов внутри мобильных дашбордов.
  • v3-4215 🔧 Исправление отображения плиток (сот) на домашней при большом количестве сервисов.
  • v3-4210 🚀 GMONIT теперь работает без зависимости от datomic transactor! Удаляйте сервис и переменную DATOMIC_URI.
  • v3-4204 🔧 Исправлено отображение метрики рестартов контейнеров.
  • v3-4187 🔧 Исправления сканирования зависимостей на уязвимости.
  • v3-4181 🆕 Браузерные и инфраструктурные дашборды переведены на русский язык. Теперь все дашборды поставки GMONIT на русском языке. Будем признательны за ваши предложения по улучшению перевода.
  • v3-4180 🆕 Добавлена поддержка сохранения структурных логов. Теперь, если ваша система логирует объекты вместо строк, они будут доступны для просмотра.
  • v3-4161 🔧 Исправлено отображение критических сегментов в отчётах медленных APM транзакций. Улучшена читаемость при использовании тёмной темы.
  • v3-4150 🆕 В распределённой трассировке мобильного мониторинга добавлена группировка по URL — улучшена агрегация данных и навигация при работе с большим объёмом запросов.
  • v3-4145 🆕 Домашняя страница и дашборды APM теперь на русском языке!
  • v3-4136 ✨ Улучшена читаемость панелей статуса системы на главной: данные автоматически агрегируются по часам, дням или неделям в зависимости от масштаба просмотра.
  • v3-4114 🆕 Добавлены метрики отношения количества запросов к приложению к числу запросов к БД — помогают выявлять N+1 проблему (избыточные запросы к БД в циклах).
  • v3-4112 ✨ Добавлена связь между трассировками и отчетами о медленных транзакций.
  • v3-4046 🆕 На дашборд хостов добавлены панели с контейнерами и приложениями, запущенными на данном хосте. На панель контейнеров добавлена информация о приложениях и ссылка на хост.
  • v3-4043 ✨ Исправления названий панелей на дашбордах мобильного мониторинга.
  • v3-4040 🆕 На дашборды Summary и Page view RUM-мониторинга добавлен выбор персентиля для расчёта значений.
  • v3-4037 🔧 Исправлены ошибки отображения метрик контейнеров.
  • v3-4000 🆕 На домашнюю страницу добавлены две новых сводки: показатель здоровья системы за день с динамикой по сравнению со вчерашним днём и недельный график. Теперь структура экрана выстроена по принципу — от общего состояния к деталям и причинам отклонений.
  • v3-3958 ✨ Добавлен переключатель и отображение имени хоста в аннотациях подключения агента приложения.
  • v3-3953 ✨ На дашборд контейнеров добавлены имя хоста и ссылка на его дашборд.
  • v3-3947 ✨ Grafana обновлена до версии 11.6.0.
  • v3-3945 ✨ Изменение масштаба на карте сервисов теперь работает по вращению колеса мыши без зажатия кнопки ctrl.
  • v3-3943 🔧 Исправлена ошибка RUM-инструменации Grafana при рестарте сервиса GMONIT Grafana. Это обновление рекомендовано, если у вас установлена переменная GMONIT_GRAFANA_BROWSER_AGENT_COLLECTOR_URL.
  • v3-3919 ✨ Улучшения отображения трейсов OpenTelemetry: Обращения ко внешним сервисам помечаются визуальным маркером. Добавлено определение точки входа в OTel приложение при отсутствии batch processor.
  • v3-3906 🆕 Добавлены аннотации подключения агента приложения на графики APM мониторинга для улучшения контекста при анализе аномалий. Аннотации обычно совпадают с завершением старта приложения после его перезапуска.
  • v3-3905 🔧 Исправлена ошибка отображение плиток (сот) на домашней странице, при отображении более 1000 элементов.
  • v3-3900 🚀 Улучшена производительность панелей выводящих top-K timeseries кривых (Например: “Топ 5 веб-транзакций приложения” и т.п.).
  • v3-3899 🔧 Исправлена ошибка работы с Node.js агентом, в случае отсутствия настроенного имени приложения.
  • v3-3876 🚀 Улучшена производительность разводящей таблицы мониторинга MongoDB.
  • v3-3853 🚀 Улучшена производительность и стабилизирована работа карты сервисов.
  • Новый инструмент APM-мониторинга — профилирование приложений. Анализируйте продакшн без доп. настройки: задайте время замера (~10 мин) и получите отчет с количеством вызовов функций во всех потоках. Нагрузка на систему минимальна и возникает только во время замера. Быстро находите узкие места — профайлер показывает, какие функции чаще всего оказываются в стеке, помогая выявлять “горячие” участки кода.
  • Добавлен сервис ML-детекции аномалий. Обучайте модель на ключевых метриках, а нейросеть в реальном времени выявит отклонения, отобразит их на графиках и отправит алерты. Помогает быстро реагировать на сбои и предотвращать проблемы.
  • Добавлено разделение данных 1С по кластерам.
  • Улучшен UI дашборда метрик 1С для более удобного анализа.
  • Добавлен сбор данных журнала регистраций 1С и дашборд для их анализа.
  • Добавлен дашборд метрик ClickHouse для удобного мониторинга и анализа производительности базы данных в реальном времени.
  • Улучшен UI: добавлены связи между модулями RUM, Infra и APM для удобной навигации:
    • Теперь распределенные трейсы отображаются в APM-транзакциях и AJAX-запросах;
    • Страницы APM-приложений связаны с дашбордами метрик хостов и контейнеров.
  • Улучшен UI карты сервисов для случаев с множеством внешних сервисов. Если у APM-приложения более 20 соединений с внешними HTTP-сервисами, соединения свыше 20 группируются в один узел, чтобы избежать перегрузки интерфейса.
  • Добавлены переменные окружения для настройки TTL таблиц браузерного мониторинга: BROWSER_DEFAULT_EVENTS_TTL_DAY, BROWSER_TIMING_EVENTS_TTL_DAY, BROWSER_RESOURCES_TTL_DAY, BROWSER_JSERRORS_TTL_DAY, BROWSER_ROOT_TTL_DAY
  • Улучшения дашбордов распределённой трассировки:
    • Улучшено отображение спанов распределенной трассировки для RUM приложений автоинструментированных через APM;
    • Добавлено отображение платформы приложения для распределенной трассировки через OpenTelemetry;
    • Внутри спанов отображается больше аттрибутов и исправлены некорректные аттрибуты;
    • Более подробные трейсы коллектора GMONIT;
    • Исправления отображения трейсов начинающихся с AJAX/iOS/Android запроса.
  • Исправление ошибок RUM мониторинга.
  • Внедрена схема подключения APM агентов GMONIT с помощью оператора Kubernetes.
  • Поддержан мониторинг здоровья кластера Kubernetes через Prometheus.
  • Новый домашний дашборд. Представляет текущий статус системы подсвечивая критические отклонения от нормы.
  • Новый дашборд в APM: проверка зависимостей на уязвимости. Не требует доступ системы к интернету, однако необходима настройка локальной базы данных уязвимостей.
  • Новый дашборд метрики MongoDB. Интеграция производится с помощью OpenTelemetry.
  • Новые дашборды 1С: метрики процессов и ошибки из журнала регистрации.
  • Новый экспериментальный инструмент: построение воронок браузерного user journey.
  • Сбор логов для распределенной трассировки включен по умолчанию. Можно выключить с помощью LOGS_ENABLED=false.
  • Обновлён RUM агент.
  • Исправления сбора данных браузерного мониторинга.
  • Исправления отображения графиков в дашборде Anomaly detection.
  • Внедрён tail based sampling для улучшения работы с распределённым трейсингом.
  • Поддержка репликации ClickHouse.
  • В браузерный мониторинг добавлены графики количества уникальных пользователей.
  • Добавлена панель “время запросов к БД” в модуле обнаружения аномалий, для лучшего анализа производительности.
  • Распределённая трассировка и карта сервисов переведы на новую версию.
  • Обновления в распределённой трассировке:
    • Добавлено отображение HTTP статусов внутри трейсов.
    • Исправлены отображения спанов для браузеров и мобильных устройств.
    • Исправлено отображение user id для более точной идентификации пользователей.
    • Исправили проблему появления множественных трейсов из одного спана.
  • Исправления ошибок на карте сервисов.
  • Браузерный мониторинг получил фильтр по ошибкам, чтобы упрощать отладку.
  • Добавлена связь между ошибками и AJAX запросами для более прозрачного анализа.
  • В разделе “Dashboards” стандартные дашборды теперь сгруппированы в одну папку для облегчения навигации.
  • Новая документация доступна на docs.gmonit.ru.
  • Добавлена поддержка мониторинга для Flutter на iOS, Android и браузерах.
  • Поддержка ktranslate для приема SNMP данных сетевого мониторинга.
  • Улучшена карта сервисов: новые иконки, повышена производительность, добавлен переключатель для отображения узлов баз данных и внешних HTTP запросов.
  • Настраиваемые дашборды: используйте теги для отображения кнопки перехода на ваш дашборд в разделе Custom в навигации:
    • custom_main_page — для отображения в разделе Custom на главном дашборде;
    • custom_nr_apm_app — для отображения в разделе Custom на дашбордах APM приложений;
    • custom_nr_browser_app — для отображения в разделе Custom на дашбордах браузерных (RUM) приложений.
  • Исправлено: учёт таймзоны пользователя в дашборде scalability.
  • Поддержка ClickHouse версий до 24.3, замена устаревшей 23.8.
  • Новый дашборд в модуле APM: Обнаружение аномалий (Anomaly detection). Дашборд визуализирует 4 ключевые метрики доступности веб-приложения с выделением диапазона нормального поведения, рассчитанного на основе экспоненциального скользящего среднего с учетом стандартного отклонения. Диапазон разделен на три зоны:
    • Зеленая: ожидается 68% значений
    • Желтая: 95%
    • Красная: 100% Данные, выходящие за пределы красной зоны, считаются аномалиями. Аномалия определяется как отклонение от нормы продолжительностью 1 минута и более, что позволяет быстро выявлять проблемы на любом масштабе просмотра графика. Этот способ визуализации отличается от других дашбордов, которые обычно показывают средние значения.
  • На дашборде Anomaly detection также доступно подключение оповещений об аномалиях на основе алгоритмов машинного обучения. Обратитесь в нашу поддержку для настройки.
  • Улучшения пользовательского интерфейса:
    • Изменена визуализация графиков ошибок в APM дашбордах на столбцы для лучшего отображения частоты ошибок.
    • В браузерном мониторинге на экран группы страниц (Page views) добавлены:
      • Метрики Web Vitals
      • График User centric page load times
      • Исходящие AJAX запросы
      • Частота ошибок
  • В распределенную трассировку добавлена фильтрация по user id. Для получения данных user id на стороне приложений (как браузерных, так и APM) необходимо передать user id с помощью SDK. Инструкции:
  • Добавлены UDF функции в ClickHouse для получения данных метрик и событий. Они упрощают построение запросов и дают гарантии корректного вычисления статистики. Дашборды APM модуля переведены на использование UDF. Полная документация будет доступна на docs.gmonit.ru
  • Обновлена версия Grafana. Сделайте резервную копию базы данных кастомных дашбордов перед обновлением:
    docker compose exec postgres pg_dump -U postgres | gzip > postgres.sql.gz
  • Добавлена новая карта сервисов. Теперь доступно:
    • Отображение внешних (External) HTTP взаимодействий
    • Отображение обращений к базам данных (Datastore)
    • Отображение Apdex сервисов на узлах графа
    • Отображение RPM на связях между сервисами
    • Отображение RPM и времени ответа на узлах
  • Новый движок распределенной трассировки:
    • Добавлена поддержка браузерных и мобильных взаимодействий
    • Проведены технические оптимизации для работы под высокой нагрузкой
  • В браузерный мониторинг добавлен механизм автоматической группировки URL-адресов страниц, основанный на анализе статистики посещений. Теперь нет необходимости вручную настраивать и поддерживать SEGMENT_ALLOW_LIST_PATH. SEGMENT_ALLOW_LIST_PATH поддерживается как белый список в дополнение к статистике.
  • Добавлена метрика INP, оценивающая скорость реакции сайта на пользовательские взаимодействия, для браузерных приложений
  • Добавлен браузерный GeoIP, который позволяет определять город местоположения пользователя по его IP-адресу. Для работы требуется файл базы данных GeoIP в формате MMDB. Для настройки добавьте переменную окружения GEOIP_DB_PATH, а также смонтируйте файл базы данных в контейнер. Пример конфигурации:
    collector:
    environment:
    GEOIP_DB_PATH: '/gmonit/geoip.mmdb'
    volumes:
    - ./dbip-city-lite-2024-10.mmdb:/gmonit/geoip.mmdb
    Для проверки мы рекомендуем использовать базу db-ip “IP to City lite”. Эта бесплатная база имеет довольно точную выборку для российских IP
  • Внесен ряд правок и оптимизаций в UI/UX:
    • Стандартные ширины для числовых значений в таблицах
    • Добавлена параметризация вкладки Errors сервиса типом и именем транзакции
    • Переходы с панелей ошибок на дашборд Errors с соответствующей фильтрацией
    • Добавлены переходы на Page views и AJAX request между дашбордами браузерного мониторинга
    • Цветовая индикация числовых значений в таблицах
  • Обновлен Datomic. Замените образ сервиса transactor

    transactor:
    # ...
    #было cr.yandex/crpih7d63vpcj5dfn8jj/transactor:1.0.7021-8
    image: cr.yandex/crpih7d63vpcj5dfn8jj/transactor:1.0.7180-11
    # ...
  • Обновлен браузерный агент до версии 1.262.0 (июль 2024). Для корректной работы новых функций необходимо обновить RUM loader сниппет в ваших браузерных приложениях

  • Добавлена поддержка распределенной трассировки по протоколу OpenTelemetry. Бесшовная интеграция с существующими инструментами мониторинга распределенной трассировки. Приложения OpenTelemetry отображаются на экране Traces, а также внутри трейсов наравне с данными NewRelic. Настройте отправку трейсов по http в формате json в Collector GMONIT:

    receivers:
    otlp:
    protocols:
    grpc:
    endpoint: 0.0.0.0:4317
    include_metadata: true
    processors:
    batch:
    exporters:
    otlphttp/gmonit:
    endpoint: https://gmonit-collector-url/otlp
    encoding: json
    debug:
    service:
    pipelines:
    traces:
    receivers: [otlp]
    processors:
    - batch
    exporters:
    - otlphttp/gmonit
  • Добавлен мониторинг AJAX запросов браузерных приложений. Новые дашборды доступны на экранах приложений во вкладке Browser

  • Добавлена обработка User-Agent браузерных приложений, сбор статистики по использованию различных браузеров, их версий и операционных систем

  • Поддержан браузерный SDK. Документация NewRelic. Позволяет расширять мониторинг браузерных приложений произвольными событиями и метриками

  • Добавлена символикация ошибок минифицированных браузерных приложений.

    Документация NewRelic. Для использования необходима настройка переменных окружения а также загрузка source-map вашего приложения:

    1. Для GMONIT Collector:
    environment:
    BASIC_AUTH_NAME: grafana-http-user # default is 'admin'
    BASIC_AUTH_PASS: пароль
    1. Для Grafana. GMONIT_GRAFANA_COLLECTOR_URL может быть внутренний URL:
    environment:
    GMONIT_GRAFANA_COLLECTOR_URL: http://collector:8080/grafana
    GMONIT_GRAFANA_COLLECTOR_USER: grafana-http-user
    GMONIT_GRAFANA_COLLECTOR_PASSWORD: пароль
    1. Для каждой сборки вашего приложения отправлять source-map через POST запрос в Collector GMONIT. Пример на curl:
    Окно терминала
    curl -F "sourcemap=%SOURCE_MAP_PATH%" \
    -F "javascriptUrl=JS_URL" \
    https://gmonit-collector/sourcemaps-service/v2/applications/YOUR_APP/sourcemaps

    SOURCE_MAP_PATH – соответствует пути до source-map на файловой системе JS_URL – соответствует аттрибуту src в HTML теге script.

  • Браузерный мониторинг включен для веб-интерфейса GMONIT. Для настройки необходимо добавить переменную окружения GMONIT_GRAFANA_BROWSER_AGENT_COLLECTOR_URL для Grafana. Это должен быть внешний URL. Например:

    grafana:
    environment:
    GMONIT_GRAFANA_BROWSER_AGENT_COLLECTOR_URL: https://gmonit-collector/
  • Исправления работы инструментов распределенной трассировки

  • Поддержан сбор метрик по протоколу OpenTelemetry:
    • GMONIT можно указать в exporters otelcol-config.yml
      receivers: ...
      processors:
      cumulativetodelta:
      batch:
      exporters:
      otlphttp/gmonit:
      endpoint: https://gmonit-collector-url/otlp
      encoding: json
      service:
      pipelines:
      receivers: ...
      processors: [cumulativetodelta, batch]
      exporters: [otlphttp/gmonit]
      Или отправлять данные по http напрямую в коллектор GMONIT с адресом API /otlp
    • Поддержана delta temporality, поэтому рекомендуется использование cumulativetodelta процессора
    • Поддержано сохранение всех основных типов метрик: gauge, counter, histogram, exponential histogram
  • Поддержан мониторинг мобильных приложений на iOS и Android:
    • Мобильные метрики собираемые newrelic-ios-agent и newrelic-android-agent
    • Деобфускация обработанных ошибок и сбоев в Android
    • Символикация обработанных ошибок и сбоев в iOS
  • Добавлены метрики медленных SQL в APM. Они представлены на страницах transaction и database item
  • Поддержаны пользовательские события из APM SDK:
  • Исправления работы с RUM (браузерными) агентами
  • Оптимизирована работа с данными веб агентов
  • Оптимизирована работа с памятью http сервера коллектора