Posted 10 сентября, 13:24
Published 10 сентября, 13:24
Modified 11 сентября, 09:24
Updated 11 сентября, 09:24
По словам разработчиков, эта модель входит в число лидирующих LLM (большие языковые модели глубокого обучения, которые предварительно обучены на крупных объемах данных) в своем классе: она содержит 8 млрд. параметров. При необходимости MTS AI может создать LLM на татарском с большим количеством параметров — до 70 млрд параметров, а также большим контекстным окном до 32 тыс. токенов, — чтобы модель умела выполнять такие задачи как перевод и генерация длинных текстов.
— Создавая большую языковую модель на татарском, разработчики MTS AI хотели поддержать многообразие языков, существующих в России, помочь им развиваться и быть востребованными в цифровую эпоху, — сказал исполнительный директор MTS AI Дмитрий Марков.
Чтобы модель смогла понимать незнакомый язык, разработчики собрали датасет и перевели его с русского на татарский. После все данные и ответы модели проверили специалисты-тюркологи и носители языка.
© Все права защищены. При использовании информации гиперссылка на сайт mkset.ru обязательна. Полные правила
Сетевое издание «Медиакорсеть». Средство массовой информации зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций,
регистрационный номер серия ЭЛ № ФС 77-74155 от 23 ноября 2018 г.
Учредитель: ООО «ПремьерМедиаИнвест»
Главный редактор: Мингазов Линар Аксянович
Телефон: +7 (499) 110-58-85
Электронный адрес: [email protected] / [email protected]
Адрес редакции: 109 044, Москва г, вн. тер. г. муниципальный округ Таганский, ул. Воронцовская, д. 20, этаж 2, ком. 14
По вопросам размещения рекламы на сайте обращайтесь: +7 (347) 216-00-58, [email protected]