ИИ поможет обрабатывать информацию и анализировать документы на татарском

10 сентября 2024, 13:24

Фото: МТС.

Цифровая экосистема представила разработанную MTS AI новую версию большой языковой модели (18+) для работы с текстами на татарском языке.

По словам разработчиков, эта модель входит в число лидирующих LLM (большие языковые модели глубокого обучения, которые предварительно обучены на крупных объемах данных) в своем классе: она содержит 8 млрд. параметров. При необходимости MTS AI может создать LLM на татарском с большим количеством параметров — до 70 млрд параметров, а также большим контекстным окном до 32 тыс. токенов, — чтобы модель умела выполнять такие задачи как перевод и генерация длинных текстов.

— Создавая большую языковую модель на татарском, разработчики MTS AI хотели поддержать многообразие языков, существующих в России, помочь им развиваться и быть востребованными в цифровую эпоху, — сказал исполнительный директор MTS AI Дмитрий Марков.

Чтобы модель смогла понимать незнакомый язык, разработчики собрали датасет и перевели его с русского на татарский. После все данные и ответы модели проверили специалисты-тюркологи и носители языка.

#Андрей Королев #Новости #Башкортостан

Подпишитесь

Сетевое издание «Медиакорсеть». Средство массовой информации зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций,
регистрационный номер серия ЭЛ № ФС 77-74155 от 23 ноября 2018 г.

Учредитель: ООО «ПремьерМедиаИнвест»

Главный редактор: Мингазов Линар Аксянович

Телефон: +7 (499) 110-58-85

Электронный адрес: info@mkset.ru / ooopremmediainvest@gmail.com

Адрес редакции: 109 044, Москва г, вн. тер. г. муниципальный округ Таганский, ул. Воронцовская, д. 20, этаж 2, ком. 14

По вопросам размещения рекламы на сайте обращайтесь: +7 (347) 216-00-58, reklama@mkset.ru

Редакционные правила

Политика конфиденциальности