Добавить новость
Новости сегодня

Новости от TheMoneytizer

ИТМО и MWS AI открыли лабораторию по ускорению нейросетей и развитию языковых ИИ-моделей

ИТМО и MWS AI открыли лабораторию по ускорению нейросетей и развитию языковых ИИ-моделей

ИТМО и MWS AI (входит в МТС Web Services) открыли онлайн-лабораторию, в которой будут разрабатывать новые методы ускорения, сжатия и обучения ИИ-моделей. Ученые помогут адаптировать ИИ для более широкого круга языков и создадут новые модели для синтеза и распознавания речи на арабском и казахском языках. Также исследователи предложат алгоритмы, которые сделают нейросети быстрее, позволят снизить требования к их работе и запускать ИИ-модели непосредственно на пользовательских устройствах, сохраняя конфиденциальность данных.

Современные ИИ-модели отлично справляются с английским, китайским и русским языками — во многом благодаря огромному объему текстовых и речевых данных. Иначе дело обстоит с малоресурсными языками — так называют языки, по которым не хватает массива качественных данных для обучения ИИ-моделей. К их числу, например, относят арабский и казахский: несмотря на большое количество носителей, здесь по-прежнему ощущается острый дефицит наборов данных, особенно в задачах синтеза и распознавания речи. Для того, чтобы создать модели и речевые модели для таких языков, требуется дорогостоящий ручной сбор, разметка и обработка данных. В итоге качество поддержки этих языков в ИИ-инструментах уступает наиболее распространенным — из-за этого пользователи не могут полноценно использовать ИИ в повседневной жизни. 

Решением этих задач будут заниматься в новой лаборатории методов эффективного ИИ и инфраструктуры данных для низкоресурсных сред ИТМО и MWS AI. Исследователи будут разрабатывать новые модели для синтеза и распознавания речи на малоресурсных языках, а также работать над ускорением и сжатием существующих ИИ-моделей — например, Qwen и Llama. Алгоритмы и методы, созданные в лаборатории, подойдут для работы с любыми моделями, основанными на архитектуре «трансформер», к которым относятся современные большие языковые модели. Все решения планируется публиковать в открытом доступе на GitHub и HuggingFace.

Возглавят лабораторию старший научный сотрудник мегафакультета трансляционных информационных технологий ИТМО, разработчик-эксперт центра фундаментальных исследований MWS AI Али Аммар, руководитель центра машинного обучения и фундаментальных исследований Стаматиос Лефкиммиатис и старший научный сотрудник мегафакультета трансляционных информационных технологий ИТМО Алексей Кашевник. Над исследованиями будут работать сотрудники ИТМО и MWS AI, а также студенты и аспиранты факультета информационных технологий и программирования ИТМО. 

«Мой родной язык — арабский, и обучать модель для работы на нем намного дороже и сложнее, чем на английском. Это ограничивает исследования в области ИИ для носителей малоресурсные языков, поэтому мы хотим сделать ИИ-инструменты доступными для всех. В частности, мы планируем подготовить около 100 часов речи на арабском языке, которые, в том числе, сможем использовать для обучения моделей синтеза речи, в планах — обучение модели VibeVoice от Microsoft на русском, казахском и арабском языках», — подчеркнул руководитель лаборатории, сотрудник ИТМО и MWS AI Аммар Али.

При помощи математических методов оптимизации (квантизации, прунинга ИИ, линеаризации внимания) исследователи намерены разработать новые способы «сжатия» нейросетей, чтобы они работали быстрее и занимали меньше места при небольших потерях в точности (до 5%). В частности, ученые планируют увеличить скорость работы существующих моделей-трансформеров в 4 раза и снизить требования к вычислительным ресурсам для их запуска в 2 раза. Также команда будет создавать новые методы обучения ИИ-моделей классификации, сегментации и детекции данных, которые не требуют больших вычислительных затрат. Кроме того, разработчики планируют собирать и внедрять в существующие модели наборы данных для малоресурсных языков и создавать бенчмарки, которые помогут оценить работу больших языковых моделей (например, ChatGPT, Claude) на новых данных.

В перспективе снижение требований к ресурсам позволит «недорого» запускать ИИ-модели локально на устройствах с ограниченными вычислительными мощностями (например, на смартфонах) и обеспечит приватность, которая важна для университетов, бизнеса и отдельных пользователей. Кроме того, это даст возможность не зависеть от облачных сервисов крупных компаний и откроет для пользователей бесперебойный доступ к ИИ.

 

О компании:

Компания MWS AI (входит в МТС Web Services) основана в 2019 году. Она разрабатывает решения для создания и запуска корпоративных приложений на базе искусственного интеллекта. Также MWS AI выступает партнёром по ИИ-трансформации для крупного бизнеса и государственных организаций. Основной продукт MWS AI — платформа MWS AI Agents Platform. С её помощью сотрудники компаний могут без навыков программирования создавать ИИ-агентов и мультиагентные системы в визуальном конструкторе бизнес-сценариев и на естественном языке по текстовому запросу. Собственные разработки компании включают большие языковые и мультимодальные модели Cotype, модели речевой аналитики, алгоритмы распознавания речи и синтеза голоса. Экспертиза MWS AI в области компьютерного зрения сосредоточена в портфельной компании VisionLabs.

Читайте на сайте


Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. Абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.




Новости от наших партнёров в Вашем городе

Ria.city
Музыкальные новости
Новости России
Экология в России и мире
Спорт в России и мире
Moscow.media






Топ новостей на этот час

Rss.plus





СМИ24.net — правдивые новости, непрерывно 24/7 на русском языке с ежеминутным обновлением *