В Кыргызстане создадут национальный языковой корпус, — гендиректор IT-компании

В Кыргызстане создадут национальный языковой корпус, — гендиректор IT-компании

В Кыргызстане создадут национальный языковой корпус, - гендиректор IT-компании

Мирбек Окенов

В Кыргызстане создадут национальный языковой корпус и оцифруют архив КТРК для развития ИИ. Об этом сообщил генеральный директор Ulut Soft Мирбек Окенов в ходе панельной сессии «ИИ-инфраструктура: от дата-центров до глобальных сетей» на форуме КИТ-2025.

По его словам, в планах государства — создание кыргызского языкового корпуса, который станет основой для дальнейшей работы в сфере искусственного интеллекта. Базой для него станут все тексты, доступные в настоящее время.

«На следующий год запланирована оцифровка золотого фонда КТРК — это архивные радиозаписи, в том числе из советского периода. У нас сохранилось огромное количество уникального контента, который станет важной частью этого корпуса», — отметил Окенов.

Он также рассказал, что проблема недостатка данных для обучения ИИ постепенно теряет актуальность благодаря развитию синтетических датасетов.

«Искусственный интеллект уже может сам создавать обучающие данные. Важно лишь правильно направить этот процесс. Поэтому разработчики могут не ограничиваться только реальными текстами — синтетические датасеты тоже играют важную роль», — добавил он.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *