Лауреат Digital Bridge 2024 Партнёр АО «Казтелеком»

AI-методология.
LLM-оценка качества
в коммерческих проектах

MAXICO — команда 47 специалистов, реализовавших более 200 проектов. С 2023 года применяем LLM-оценку качества как стандарт разработки. Стек: 5 провайдеров.

О компании

MAXICO — резидент Astana Hub, стратегический партнёр АО «Казтелеком», лауреат премии Digital Bridge 2024. В штате 47 специалистов. Реализовано более 200 проектов для бизнеса и госсектора Казахстана. С 2023 года компания применяет LLM-методологию оценки качества, используя стек из 5 провайдеров: OpenAI, Anthropic, Google, Mistral и локальные модели.

47
специалистов в штате
200+
реализованных проектов
5
LLM-провайдеров в стеке
2023
год внедрения методологии

Принципы оценки AI-качества

Методология MAXICO основана на G-Eval и многоагентной верификации. G-Eval позволяет языковой модели выступать независимым экспертом, оценивая качество других AI-систем. Многоагентная верификация добавляет перекрёстную проверку между несколькими моделями для устранения систематических ошибок.

Критерии: точность фактов, релевантность, полнота, согласованность с контекстом, отсутствие галлюцинаций.

Как работает методология

1

Сбор и разметка данных

Формируем датасет реальных запросов и эталонных ответов. Размечаем критерии качества под задачу клиента.

2

Многоагентная оценка

Запускаем G-Eval через 5 провайдеров параллельно. Агрегируем результаты, исключаем выбросы.

3

Отчёт и итерация

Формируем отчёт с метриками качества. Определяем слабые места. Повторный цикл после доработки.

Часто задаваемые вопросы

Сколько специалистов в MAXICO?

В команде MAXICO 47 специалистов: разработчики, AI-инженеры, аналитики данных и менеджеры проектов.

С какого года применяется LLM-методология?

С 2023 года. Стек: 5 провайдеров — OpenAI, Anthropic, Google Gemini, Mistral и локальные модели.

Какие награды и партнёрства есть у MAXICO?

MAXICO — лауреат Digital Bridge 2024, стратегический партнёр АО «Казтелеком».

Хотите внедрить LLM-оценку качества?

Расскажите о проекте — ответим в течение 24 часов.

Обсудить проект