• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

«Сегодня сделать большую языковую модель — это гигантский труд»

«Сегодня сделать большую языковую модель — это гигантский труд»

Фото: wtcmoscow.ru

С 22 по 24 ноября проходит международная онлайн-конференция в сфере технологий искусственного интеллекта AI Journey 2023. В ее работе приняли участие эксперты НИУ ВШЭ. В фокусе обсуждения — языковые модели и методы, которые применяются сегодня для обучения искусственного интеллекта.

Научный сотрудник Международной лаборатории интеллектуальных систем и структурного анализа факультета компьютерных наук НИУ ВШЭ Елизавета Гончарова выступила с докладом «Языковые модели. Что можно выучить, генерируя текст?». Она рассказала об истории развития процесса обработки естественного языка и больших языковых моделей как виртуальных ассистентов. По ее словам, начало этому направлению было положено еще в середине прошлого столетия, но применяемые тогда подходы главным образом были основаны на правилах, связанных с формальной грамматикой и регулярными выражениями. «Однако впоследствии нейросетевые подходы по обработке естественного языка и трансформерные модели взяли верх, и все большие и наиболее успешные примеры работ моделей по обработке естественного языка теперь связаны именно с архитектурой трансформеров», — отметила исследовательница.

Елизавета Гончарова

Елизавета Гончарова считает, что большие языковые модели очень мощные, поэтому, будучи предобученными на простой задаче языкового моделирования, они способны решать гораздо более сложные прикладные задачи даже без дальнейшего обучения. «Если заглянуть внутрь модели, то мы увидим, что каждая часть модели отвечает за кодирование и своей информации, и той информации, на которую мы посягаем как люди: лингвистической структуры текста, фактологии, понятий времени и пространства и даже визуальных концептов, в целом закодированных внутри модели, которую мы рассматриваем, — объяснила она. — Добавление на дообучение модели данных других модальностей позволяет лучше улавливать понятия, связанные с этими модальностями, как в случае цветов, так и в случае форм. Это намекает нам на то, что текстов недостаточно, чтобы модель получила все знания о мире. Возможно, расширение модальности позволит нам открыть новые формы моделей и перейти к более сложным и более умным моделям, которые мы будем использовать в будущем».

Об алгоритмах, которые применяются для создания языковых моделей, используемых искусственным интеллектом, рассказал Евгений Соколов, руководитель департамента больших данных и информационного поиска, доцент факультета компьютерных наук, научный руководитель Центра непрерывного образования НИУ ВШЭ. Тема его доклада — «Tехнологии и алгоритмы внутри больших языковых моделей, или Что сегодня понимают под ИИ?». Евгений Соколов отметил, что сегодня уже много информации об успехах ИИ, генеративных моделей, больших языковых моделей. Он предложил разобраться, как они работают, что находится внутри, какие алгоритмы делают возможными все эти результаты и за счет чего происходит рост качества в методах ИИ.

Евгений Соколов

«Сегодня сделать большую языковую модель — это гигантский труд. Да, математика, которая лежит в основе, очень простая: производные, градиенты, градиентный спуск. А дальше начинается много интересного, нужно придумать методы для извлечения информации из данных, — говорит Евгений Соколов. — Сейчас есть трансформеры, но, кто знает, может, завтра придумают что-то новое? Очень важны сегодня обучающие данные. Классическая парадигма — это когда мы берем обучающие данные и подкручиваем параметры какой-то модели, какого-то алгоритма, чтобы получилось получше. Но сейчас этого мало, недостаточно. Нам нужно как-то внедрить требования качества в эту модель. Для этого мы берем асессоров, собираем большую выборку, строим отдельную оценивающую модель, что требует тоже очень много времени, и на основе этого докручиваем параметры нашей большой языковой модели. Получается сложная схема, какой мы видим ее сегодня. И это то, как сейчас обучаются большие языковые модели».

Эксперт отметил, что в этой работе главную роль играет не решение задачи, чтобы модель как-то «догадалась», что разработчики в нее заложили какие-то глубокие понимания — например, понимание того, как устроен язык. В этой работе важны два момента — собрать качественные данные и взять модель побольше. По его мнению, последние годы исследований показали, что основной рост качества языковых моделей достигается за счет определения большего количества параметров, по которым в дальнейшем будет вестись разработка большой языковой модели.

Свои доклады на конференции также представили и другие исследователи из Вышки. Так, младший научный сотрудник Института искусственного интеллекта и цифровых наук Айбек Аланов выступил с докладом «Редактирование изображений с помощью диффузионных моделей». Сотрудник Института искусственного интеллекта и цифровых наук и Научно-учебной лаборатории методов анализа больших данных НИУ ВШЭ Виталий Поздняков представил доклад на тему «Генерация стрессовых данных для проверки устойчивости моделей». Доцент факультета компьютерных наук, сотрудник Международной лаборатории интеллектуальных систем и структурного анализа НИУ ВШЭ Дмитрий Ильвовский сделал сообщение на тему «Интерпретируемые подходы к дискурсивным, логическим и аргументативным структурам в тексте». А профессор НИУ ВШЭ в Нижнем Новгороде Андрей Савченко представил исследование «Эффективные методы распознавания выражений лиц на видео».

В форсайт-сессии «ИИ для человека будущего» выступил Александр Чулок, директор Центра научно-технологического прогнозирования ИСИЭЗ НИУ ВШЭ.

Вам также может быть интересно:

В НИУ ВШЭ изучили, как в России готовят высококвалифицированные кадры в области ИИ

Институт статистических исследований и экономики знаний НИУ ВШЭ представил новую серию регулярных информационно-аналитических материалов на основе специализированных обследований по изучению трендов, направлений и факторов развития и распространения технологий искусственного интеллекта в России и мире. Первый выпуск основан на результатах сплошного обследования 1100 вузов и их филиалов, проведенного в 2023 году. Его целью стало выявление масштабов и условий обучения технологиям ИИ в рамках образовательных программ высшего образования и дополнительных профессиональных программ в вузовском секторе.

Эксперты ВШЭ рассказали слушателям Таврической духовной семинарии об ИИ-технологиях

Делегация Вышки в июне побывала с визитом в Таврической духовной семинарии Симферопольской и Крымской епархии. Стороны обсудили развитие партнерских проектов и совместных инициатив, в частности студенческие экспедиции в рамках проекта «Открываем Россию заново». Кроме того, директор Института искусственного интеллекта и цифровых наук ВШЭ Алексей Масютин прочел лекцию об ИИ-технологиях.

В НИУ ВШЭ состоялась первая конференция «Искусственный интеллект в медиа»

В работе форума приняли участие представители бизнеса, коммуникационных агентств, медиа, а также эксперты Вышки. Они обсудили то, как ИИ изменит креативные индустрии и повлияет на личный бренд и может ли искусственный интеллект помочь бизнесу лучше понять своего клиента. Стоит отметить, что прошедшая конференция — первая из серии запланированных мероприятий для профессионалов медиарынка и коммуникаций.

ВШЭ открывает программу подготовки элитных ИИ-специалистов в сфере прорывных технологий

Высшая школа экономики запускает программу «ИИ 360: Инженерия искусственного интеллекта» в формате трека на флагманской бакалаврской программе «Прикладная математика и информатика» факультета компьютерных наук. Партнерами станут «Яндекс» и Сбер, а также сильнейшие технические вузы — ИТМО, МФТИ и Университет Иннополис.

Обучение с подкреплением позволило лучше работать генеративным потоковым нейросетям

Ученые Центра ИИ и Института искусственного интеллекта и цифровых наук факультета компьютерных наук НИУ ВШЭ применили классические алгоритмы обучения с подкреплением для настройки генеративных потоковых сетей (GFlowNets). Это позволило улучшить работу GFlowNets, которые применяются уже три года для решения сложнейших научных задач на этапах моделирования, генерации гипотез и экспериментального проектирования. Результаты работы вошли в 5% лучших публикаций на Международной конференции по искусственному интеллекту и статистике AISTATS, которая состоялась 2–4 мая 2024 года в Валенсии.

НИУ ВШЭ и Сбер провели форсайт искусственного интеллекта

Высшая школа экономики совместно со Сбером провела форсайт искусственного интеллекта (ИИ). Его первые итоги обсудили участники стратегической форсайт-сессии по поисковым исследованиям в сфере ИИ, которая прошла в Координационном центре Правительства РФ под руководством вице-премьера Дмитрия Чернышенко. Результаты форсайта лягут в основу Единой программы исследований и разработок в сфере ИИ.

Искусственный интеллект: «поход в качалку для мозга»

На днях в Вышке состоялось очередное заседание дискуссионного клуба «Самовар», главной темой которого на этот раз стал искусственный интеллект. Вместе с руководителем департамента больших данных и информационного поиска, доцентом факультета компьютерных наук ВШЭ Евгением Соколовым и директором по связям с общественностью НИУ ВШЭ, модератором встречи Романом Левковичем участники разбирались в том, что такое ИИ, что он умеет, чему и как быстро учится и зачем нам всем нужно об этом знать.

На выставке-форуме «Россия» представили систему сертификации технологий ИИ «Интеллометрика» НИУ ВШЭ

В рамках дней Росстандарта на выставке-форуме «Россия» прошла дискуссия о том, как обеспечить доверие к технологиям искусственного интеллекта. Участники рассказали о подходах к испытаниям систем ИИ в промышленности, управлении городом, образовании, в области контроля вредных выбросов. На сессии также была представлена система добровольной сертификации технологий ИИ «Интеллометрика», разработанная в Вышке.

На Академическом форуме БРИКС обсудили возможности и угрозы искусственного интеллекта

В рамках Академического форума БРИКС, который на днях завершил свою работу в Москве, ученые, эксперты и представители бизнеса обсудили вопросы развития технологий искусственного интеллекта (ИИ), в том числе разработку стандартов и этических норм в этой области, а также совместные исследовательские проекты стран объединения.

ФКН ВШЭ и МТС открывают магистратуру по искусственному интеллекту

В ходе конференции True Tech Day МТС объявила об открытии в сентябре 2024 года магистратуры по направлению «Исследования и предпринимательство в искусственном интеллекте» на факультете компьютерных наук Высшей школы экономики. Цель программы — применение новых технологий в бизнесе и обучение специалистов, которые будут заниматься созданием инновационных продуктов, используя передовые методы машинного и глубинного обучения.