Posted 10 сентября, 13:24

Published 10 сентября, 13:24

Modified 11 сентября, 09:24

Updated 11 сентября, 09:24

ИИ поможет обрабатывать информацию и анализировать документы на татарском

ИИ поможет обрабатывать информацию и анализировать документы на татарском

10 сентября 2024, 13:24
Фото: МТС.
Цифровая экосистема представила разработанную MTS AI новую версию большой языковой модели (18+) для работы с текстами на татарском языке.

По словам разработчиков, эта модель входит в число лидирующих LLM (большие языковые модели глубокого обучения, которые предварительно обучены на крупных объемах данных) в своем классе: она содержит 8 млрд. параметров. При необходимости MTS AI может создать LLM на татарском с большим количеством параметров — до 70 млрд параметров, а также большим контекстным окном до 32 тыс. токенов, — чтобы модель умела выполнять такие задачи как перевод и генерация длинных текстов.

— Создавая большую языковую модель на татарском, разработчики MTS AI хотели поддержать многообразие языков, существующих в России, помочь им развиваться и быть востребованными в цифровую эпоху, — сказал исполнительный директор MTS AI Дмитрий Марков.

Чтобы модель смогла понимать незнакомый язык, разработчики собрали датасет и перевели его с русского на татарский. После все данные и ответы модели проверили специалисты-тюркологи и носители языка.

Подпишитесь