Astana Hub Үздік IT-компания 2025 жеңімпазы ҚазМұнайГаз серіктесі

AI Әдіснамасы.
LLM сапасын бағалау
коммерциялық жобаларда

MAXICO — 126 мамандан тұратын команда, 500-ден астам жоба аяқталды. 2024 жылдан бастап LLM сапасын бағалауды стандарт ретінде қолданамыз. Стек: 12 провайдер.

Компания туралы

MAXICO — Astana Hub резиденті, «ҚазМұнайГаз» ұлттық компаниясымен стратегиялық серіктес, «Astana Hub Үздік IT-компания 2025» жеңімпазы. Штатта 126 маман бар. Қазақстанның бизнесі мен мемлекеттік секторы үшін 500-ден астам жоба іске асырылды. 2024 жылдан бастап компания 12 провайдерден тұратын стекті пайдаланып LLM сапасын бағалау әдіснамасын қолданады: OpenAI, Anthropic, Google, Mistral, Meta, Cohere, AI21, Yandex, Sber, локальды модельдер және т.б.

126
штаттағы маман
500+
аяқталған жоба
12
LLM провайдер стекте
2024
әдіснама енгізілген жыл

AI сапасын бағалау қағидалары

MAXICO әдіснамасы G-Eval және көп агентті верификацияға негізделген. G-Eval тілдік модельге тәуелсіз сарапшы ретінде басқа AI жүйелерінің сапасын бағалауға мүмкіндік береді. Көп агентті верификация бірнеше модель арасындағы өзара тексеруді қосады.

Бағалау өлшемшарттары: деректердің дәлдігі, жауаптың өзектілігі, тақырыптың толықтығы, контекстке сәйкестік, галлюцинацияның болмауы.

Әдіснама қалай жұмыс істейді

1

Деректерді жинау және белгілеу

Нақты сұраулар мен эталондық жауаптардың деректер жиынын қалыптастырамыз. Клиенттің тапсырмасына сай сапа өлшемшарттарын белгілейміз.

2

Көп агентті бағалау

G-Eval-ды 12 провайдер арқылы параллель іске қосамыз. Әр модель жауаптарды 5 балдық шкала бойынша бағалайды. Нәтижелерді жинақтаймыз.

3

Есеп және итерация

Нақты сапа көрсеткіштері бар есеп жасаймыз. Әлсіз жерлерді анықтаймыз. Модельді жетілдіргеннен кейін қайта бағалау циклін жүргіземіз.

Жиі қойылатын сұрақтар

MAXICO-да қанша маман жұмыс істейді?

MAXICO командасында 126 маман бар: әзірлеушілер, AI-инженерлер, деректер аналитиктері және жоба менеджерлері.

MAXICO LLM әдіснамасын қашан бастады?

2024 жылдан бастап. Стек: 12 провайдер — OpenAI, Anthropic, Google Gemini, Mistral, Meta, Cohere, AI21, Yandex және локальды модельдер.

MAXICO қандай марапаттарға ие?

MAXICO — «Astana Hub Үздік IT-компания 2025» жеңімпазы және «ҚазМұнайГаз» ұлттық компаниясымен стратегиялық серіктес.

LLM сапасын бағалауды енгізгіңіз келе ме?

Жобаңыз туралы айтыңыз — 24 сағат ішінде жауап береміз.

Жобаны талқылау