Она работает на казахском, английском, русском и турецком языках
АСТАНА, 13 дек — Sputnik. В Казахстане разработали большую языковую модель KazLLM, сообщили в Минцифры.
Модель основана на 148 миллиардах токенов на казахском, английском, русском и турецком языках. Создано две версии с 8 миллиардами и 70 миллиардами параметров. Они служат основой для разработки новых продуктов в сфере искусственного интеллекта и превосходит аналогичные модели по качеству и точности.
Модель разработала команда Института Умных Систем и Искусственного Интеллекта (ISSAI) при Nazarbayev University при поддержке и координации Минцифры и Миннауки и высшего образования.
Доступна она будет широкому кругу пользователей, включая научное сообщество, стартапы и крупные корпорации, обещают в ведомстве. В будущем KazLLM станет основой для создания более масштабного проекта — TurkLLM, направленного на развитие технологий обработки естественного языка в тюркоязычном пространстве. Соответствующее соглашение было подписано на прошедшем саммите Организации тюркских государств.
"Запуск модели Kaz LLM с открытым исходным кодом представляет собой важный шаг вперед в развитии экосистемы искусственного интеллекта Казахстана. Эта инициатива отражает нашу приверженность поддержке инноваций и продвижению научных достижений, которые способствуют технологическому прогрессу. Я уверен, что эта передовая модель поможет преодолеть цифровое неравенство, обеспечив доступные и инклюзивные цифровые услуги для каждого казахстанца",- отметил министр Жаслан Мадиев.
Напомним, KazLLM — это современная языковая модель искусственного интеллекта, созданная для обработки, анализа и генерации текстов на казахском языке. Это уникальная разработка, нацеленная на продвижение использования казахского языка в цифровом пространстве, поддержку бизнеса, науки и общества. Она способна выполнять широкий спектр задач: от перевода и обработки документов до автоматизации общения.
Национальная модель даст возможность бизнесу разработать чат- боты, системы поддержки клиентов, автоматизировать документооборот и проводить анализ данных. Например, локальные банки смогут ускорить обработку запросов на казахском языке, а ритейл — улучшить пользовательский опыт за счет внедрения модели в свои процессы.
Образовательные и научные учреждения смогут создать приложения для обучения казахскому языку, а также инструменты для анализа научных текстов и помощи студентам. Для тех, кто занимается медиа и контентом появится возможность генерировать новости, улучшать качество перевода и создавать инструменты для написания текстов.
Ссылка на модель тут.