MERA Code: всесторонняя оценка генерации кода в прикладных сценариях

newsare.net

Всем привет! Авторы бенчмарка MERA этим летом не только анонсировали отраслевую ветку — MERA Industrial, но и рады сообщить о расширении проекта на ко�

MERA Code: всесторонняя оценка генерации кода в прикладных сценариях

Всем привет! Авторы бенчмарка MERA этим летом не только анонсировали отраслевую ветку — MERA Industrial, но и рады сообщить о расширении проекта на кодовые задачи.Большие языковые модели (LLM) сегодня умеют не только вести диалог, но и писать код, помогать с документацией и автоматизировать задачи разработчиков. Однако возникает вопрос: «Как мы измеряем качество этих способностей?» Большинство бенчмарков сосредоточены на проверке понимания языка и, частично, на генерации кода. Но насколько такой код применим на практике? Учитываются ли требования, сформулированные на русском? Как модели работают с документацией на других языках, кроме английского? Мультиязычные бенчмарки вроде HumanEval-X, MultiPL-E и mxEval делают шаг в нужную сторону, но по большей части сосредоточены на языках программирования. Связь между кодом и естественным языком, особенно в многоязычном контексте, пока освещена слабо.Чтобы учесть все эти моменты, мы разработали MERA Code — первый комплексный бенчмарк для оценки больших языковых моделей на реальных прикладных задачах, с которыми сталкивается программист в русскоязычном контексте. Читать далее Read more

Facebook Twitter

10:00 18.07.2025

Ruang pameran, pusat servis Zeekr bernilai RM10 juta dibuka di Sunway

newsare.net

KUALA LUMPUR: Sunway Marketing, rakan pengedar utama yang dilantik Zeekr Malaysia melancarkan Zeekr Sunway di tengah-tengah Sunway City Kuala Lumpur membabitkan pelaburan RM10 juta.

Ruang pameran, pusat servis Zeekr bernilai RM10 juta dibuka di Sunway

KUALA LUMPUR: Sunway Marketing, rakan pengedar utama yang dilantik Zeekr Malaysia melancarkan Zeekr Sunway di tengah-tengah Sunway City Kuala Lumpur membabitkan pelaburan RM10 juta.

World and Local News

newsare.net