• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Звери, зарплаты и data leak: как разрабатываются задания для олимпиады школьников по ИИ

Звери, зарплаты и data leak: как разрабатываются задания для олимпиады школьников по ИИ

© Высшая школа экономики

В этом году участники Всероссийской олимпиады школьников по искусственному интеллекту впервые смогут зачесть ее результаты при поступлении в вузы. Елена Кантонистова, председатель методической комиссии олимпиады и академический руководитель онлайн-магистратуры факультета компьютерных наук «Машинное обучение и высоконагруженные системы», рассказала новостной службе «Вышка.Главное» о том, как ученые ВШЭ составляли задания для соревнований 2023 года, откуда взялась задача об уссурийских тиграх и почему школьникам полезно осваивать ИИ.

Во Всероссийской олимпиаде школьников по искусственному интеллекту могут участвовать ученики 8–11-х классов. Первые два этапа, отборочный и основной, проходят онлайн. Лучшие 50 участников, отобранные по их результатам, приезжают в Москву на заключительный очный финал.

В олимпиаде есть задания по математике, алгоритмам, машинному обучению. В 2023 году в отборочном и основном этапах было по два задания по каждому направлению. В отборочном этапе задания несложные и доступные всем участникам, добросовестно изучившим школьную программу по математике и информатике. В основном этапе задания уже сложнее, а в заключительном — всего две задачи по машинному обучению, но обе довольно непростые.

Елена Кантонистова

В прошлом году большинство членов методической комиссии, которая разрабатывает задания, были сотрудниками факультета компьютерных наук Вышки.

Расскажу подробнее о заданиях по машинному обучению, так как они представляют наибольший интерес и являются основными в олимпиаде. В 2023 году в отборочном этапе была классическая задача регрессии, то есть прогноз на основе набора данных с различными признаками. Участникам нужно было предсказать стоимость домов по различным характеристикам.

Вторая задача была посвящена несложному и интересному анализу данных. Летом один из российских заповедников предоставил нам данные о наблюдениях за животными: например, где и когда видели северных оленей, волков, уссурийских тигров, что они при этом делали и так далее. Участникам нужно было ответить на вопросы по этим данным, от несложных (сколько пропусков в данных, какой зверь встречается людям чаще всего) до довольно хитрых (например, какое животное было замечено осенью 2022 года ближе всего к центру Москвы или какое животное чаще всего уличают в кражах).

Такие несложные, но содержательные по смыслу задачи — очень хорошее подспорье, чтобы заинтересовать школьников, только начинающих свой путь в анализе данных. Для решения не нужно знать никаких сложных алгоритмов, но при этом придется поизучать данные и их особенности, чтобы получить ответ.

В основном этапе задачи были уже сложнее. Одна задача требовала построения рекомендательной системы: на основе информации о пользователях «ВКонтакте» нужно было порекомендовать им группы, которые могут им понравиться. Вторая задача тоже была нестандартная: по описанию вакансии спрогнозировать среднюю зарплату, которую будет получать сотрудник. Для решения этих задач уже нужно иметь опыт в решении разнообразных задач машинного обучения.

© Высшая школа экономики

Все задачи подобраны таким образом, чтобы от тура к туру их сложность возрастала. Кроме того, нам не хотелось повторяться в темах, поэтому все задачи были разнотипными и из разных областей. Наконец, самое непростое: так как олимпиада имеет статус всероссийской, то в ней не могут использоваться стандартные открытые наборы данных (датасеты). Необходимо было найти новые датасеты для задач, а это всегда большая проблема. В итоге, конечно, все разрешилось: какие-то данные члены методической комиссии собрали сами, а какие-то предоставили коллеги из больших технологических компаний (а также заповедник).

В заключительном этапе была одна относительно несложная задача — предсказать вероятность клика по рекламному объявлению (на табличных данных) — и одна очень интересная: image-text matching. Здесь нужно было обучить модель, которая по паре (картинка и текст) предсказывает степень их смыслового соответствия. Разработчики задач пытались поставить участников в ситуацию из реальной жизни, где данные не идеальны. Особенностями обеих задач был умышленный data leak (утечка данных). При нахождении утечки можно было значительно улучшить качество прогноза в задаче и подняться на первые позиции в рейтинге.

В итоге многие ребята успешно справились с задачами, и участники из топа рейтинга показали очень хорошие результаты.

Для школьников участие в этой олимпиаде не только интересно, но и полезно. Перед каждым этапом проходят подготовительные вебинары — их тоже проводила по большей части команда преподавателей ФКН. После окончания этапов проводились разборы заданий. Также участникам предоставили список материалов для изучения, чтобы им легче было справиться с заданиями олимпиады.

У команды разработчиков было много трудностей. Одна из основных — составить задачи так, чтобы их нельзя было решить современными генеративными моделями (речь, в частности, о ChatGPT). То есть сами задачи не должны быть стандартными, а также должны иметь формулировки, в которых разберется человек, но пока не разбираются генеративные модели. В прошлом году нам удалось составить такие задания. Дальше, конечно, будет сложнее.

В этом году олимпиада примет еще большие масштабы, так как ее результаты можно будет учесть для поступления в вузы. Мы надеемся поучаствовать в составлении заданий и для следующих олимпиад.

Вам также может быть интересно:

ИИ в образовании: как преодолеть соблазн готовых решений

Искусственный интеллект уже стал обыденностью для молодежи: как показал опрос, около 87% студентов ведущих вузов используют ИИ в процессе обучения. Большая часть из них отметила, что он помогает им экономить время, при этом они проверяют сделанную ИИ работу. Результаты исследования были представлены на конференции по анализу данных и технологиям ИИ Data Fusion. В ее работе приняли участие научный руководитель НИУ ВШЭ Ярослав Кузьминов и другие эксперты Вышки.

Большинство студентов не верят, что ИИ сможет заменить их на работе

Большинство студентов считают, что ИИ не сможет заменить их на работе в ближайшие десять лет. Низким такой риск называют 27,2% респондентов, 41,5% — крайне маловероятным. Эти оценки были получены НИУ ВШЭ в ходе опроса 4200 студентов в 2025 году. Они приводятся в докладе «Эпоха больших языковых моделей: почему они все еще не профессионалы», подготовленном научным руководителем НИУ ВШЭ Ярославом Кузьминовым и старшим преподавателем кафедры высшей математики НИУ ВШЭ Екатериной Кручинской. Доклад был представлен на XXV Ясинской (Апрельской) международной научной конференции по проблемам развития экономики и общества, которая проходит с 15 по 18 апреля в НИУ ВШЭ.

Точный ИИ-оракул: какие тренды интересуют бизнес

Современные технологии ежедневно меняют мир, автоматизируя бизнес-процессы в различных отраслях. Специалисты НИУ ВШЭ представили масштабный опыт команды iFORA по реализации ИИ-проектов в интересах крупных компаний и органов власти.

Перспективы ИИ: математика машинного обучения в фокусе

Институт искусственного интеллекта и цифровых наук ФКН НИУ ВШЭ провел выездной воркшоп «Математика машинного обучения». Здесь собрались ведущие ученые и специалисты НИУ ВШЭ в области машинного обучения, математики и статистики. В центре внимания исследователей оказались математические аспекты, лежащие в основе современных и наиболее перспективных направлений машинного обучения. Программа воркшопа включала мини-курсы, практические работы, доклады и круглый стол, посвященный перспективам развития ИИ в России.

Внедрение искусственного интеллекта в организации: какие эффекты отмечают сотрудники

45% организаций, которые занимались внедрением ИИ в работу, заявили о повышении производительности труда в результате его использования. Об этом говорится в исследовании «Внедрение ИИ в работу организаций: чем обусловлена вариация эффектов на труд?». Исследование проведено директором Центра статистики труда и заработной платы ИСИЭЗ НИУ ВШЭ Анной Демьяновой и стажером-исследователем центра Дарьей Талакаускас. Оно было презентовано на XXV Ясинской (Апрельской) международной научной конференции по проблемам развития экономики и общества (XXV ЯМНК), проходящей в НИУ ВШЭ с 15 по 18 апреля.

«Олимпиадное комьюнити Вышки будет расти с каждым годом»: как прошел первый День олимпиадника в НИУ ВШЭ

5 апреля в атриуме кампуса университета на Покровском бульваре прошел первый День олимпиадника — мини-фестиваль для участников «Олимпиад Вышки» и их друзей. Команда НИУ ВШЭ подготовила насыщенную программу, включающую квест, интерактивное шоу в стиле «Что было дальше?», командный воркшоп и написание Тотального диктанта — 2025.

10 лет на высоте: подведены итоги юбилейного конкурса «Высший пилотаж»

С 2016 года количество регистраций на конкурс увеличилось почти в 18 раз, число участников отборочного этапа — в 13 раз, а получивших приглашение на заключительный этап — в 10 раз. Количество направлений, по которым проводится «Высший пилотаж», выросло более чем в 2 раза, и сегодня это не просто интеллектуальное состязание, а пространство для развития и взаимодействия участников, экспертов, педагогов, студентов, представителей бизнеса.

«Идею всегда задает человек»: что дает ИИ образованию и медиа

ИИ-технологии меняют принципы работы образования и медиаиндустрии. Большинство студентов уже в той или иной мере используют ИИ, а нейросети уже массово производят все виды контента. Возможности и вызовы эксперты обсудили на конференции «Образование и медиа в эпоху цифровых перемен», организованной Дирекцией по маркетинговым коммуникациям НИУ ВШЭ и «Яндекс Образованием».

В НИУ ВШЭ наградили финалистов НТО по разработке компьютерных игр

28 марта в Центре культур НИУ ВШЭ состоялось торжественное награждение призеров и победителей профиля «Разработка компьютерных игр» среди школьников 8–11-х классов Национальной технологической олимпиады (НТО). В финале приняли участие более 60 человек. Профиль организует НИУ ВШЭ в партнерстве со студией Ninsar.Games, Национальной киберфизической платформой «Берлога», VK Play и VK Education.

В России появятся очные площадки для сдачи нормативов ТехноГТО на золотые значки

Первые очные площадки для сдачи нормативов технологической грамотности ТехноГТО на золотые значки откроются весной 2025 года в 31 регионе Российской Федерации. Комплекс ТехноГТО является частью Национальной технологической олимпиады (НТО) и реализуется Кружковым движением НТИ совместно с президентской платформой «Россия — страна возможностей» и «Движением первых» при поддержке НИУ ВШЭ и Росмолодежи.