Posted 10 сентября, 13:24
Published 10 сентября, 13:24
Modified 11 сентября, 09:24
Updated 11 сентября, 09:24
По словам разработчиков, эта модель входит в число лидирующих LLM (большие языковые модели глубокого обучения, которые предварительно обучены на крупных объемах данных) в своем классе: она содержит 8 млрд. параметров. При необходимости MTS AI может создать LLM на татарском с большим количеством параметров — до 70 млрд параметров, а также большим контекстным окном до 32 тыс. токенов, — чтобы модель умела выполнять такие задачи как перевод и генерация длинных текстов.
— Создавая большую языковую модель на татарском, разработчики MTS AI хотели поддержать многообразие языков, существующих в России, помочь им развиваться и быть востребованными в цифровую эпоху, — сказал исполнительный директор MTS AI Дмитрий Марков.
Чтобы модель смогла понимать незнакомый язык, разработчики собрали датасет и перевели его с русского на татарский. После все данные и ответы модели проверили специалисты-тюркологи и носители языка.