• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Искусственный интеллект распознает изображения хуже человека

Искусственный интеллект распознает изображения хуже человека

© iStock

У компьютерного зрения нет тех физиологических особенностей, которые есть у человека, поэтому оно хуже распознает изображения. К такому выводу пришли ученые из ВШЭ и Московского политехнического университета. Результаты исследования опубликованы в сборнике Proceedings of Seventh International Congress on Information and Communication Technology.

Чтобы понять, как машинное восприятие изображений отличается от человеческого, российские ученые загрузили изображения классических визуальных иллюзий в онлайн-сервис распознавания образов IBM Watson Visual Recognition. Большая часть из них представляла собой геометрические силуэты, частично скрытые геометрическими формами цвета заднего плана. Система пыталась определить, что представляет собой поступившее изображение, и указывала степень уверенности в своем ответе.

Оказалось, что искусственный интеллект не способен распознать ни одну воображаемую фигуру. Исключение составил раскрашенный воображаемый треугольник. В силу высокого контраста с фоном он был распознан правильно.

Владимир Винников

«Объекты, похожие на те, что мы использовали в ходе эксперимента, встречаются в реальной жизни, — комментирует автор исследования Владимир Винников, аналитик Научно-учебной лаборатории методов анализа больших данных факультета компьютерных наук ВШЭ. —  Например, прицеп трейлера или радиобашня, которые по ночам обозначаются только габаритными огнями, автопилот автомобиля или самолета воспринимает таким же образом, как мы — воображаемые геометрические фигуры».

Человеческий глаз постоянно непроизвольно движется, а светочувствительная поверхность его сетчатки имеет форму полусферы. Чтобы человек увидел иллюзию, изображению достаточно быть векторным — состоять из опорных точек и соединяющих их кривых. Человеческое воображение достроит картинку благодаря физиологической особенности зрения — постоянному движению глаз.

В оптико-электронных системах все устроено иначе. Их светочувствительная матрица имеет плоскую, как правило прямоугольную, форму, а сама система линз далеко не так свободна в движении, как человеческий глаз. Поэтому искусственный интеллект не может достроить воображаемые линии, которые связывают фрагменты геометрической иллюзии. Машинное зрение видит только то, что реально изображено, тогда как человек достраивает в воображении полное изображение по его очертаниям.

Нейросетевые системы распознавания образов сегодня активно распространяются в коммерческом секторе. Однако вопрос, насколько точно машина распознает изображение, до сих остается открытым. От точности его распознавания могут зависеть человеческие жизни. Например, если автопилот автомобиля или самолета не распознает объект с низкой контрастностью относительно фона и не успеет вовремя уклониться от препятствия, может произойти катастрофа.

Ученые полагают, что недостатки машинного распознавания образов можно исправить.

Например, дополнить распознавание растровых изображений, представляющих собой сетку пикселей, имитацией физиологических особенностей движения глаз, которые позволяют глазу видеть двумерные и трехмерные сцены. Альтернативный способ — добавить векторное описание изображений. Оно позволит запрограммировать машину на обход изображения по траекториям, заданным векторами.

«Воображаемые фигуры обязательно стоит использовать в качестве тестов в системах, которые зависят от распознавания фото- и видеопотоков. Например, в автопилотах машин или беспилотных летательных аппаратов. Это поможет избежать рисков, связанных с использованием систем машинного интеллекта в промышленности и транспортных системах», — полагает Владимир Винников.

Вам также может быть интересно:

Вышка расширит сотрудничество с Агентством стратегических инициатив для разработки передовых решений

В Высшей школе экономики прошел День знакомства университета и Агентства стратегических инициатив (АСИ). Стороны представили свои исследовательские и аналитические проекты и наметили направления совместной работы. Задача ученых и экспертов — повысить эффективность и ускорить внедрение в практику прорывных научных разработок по широкому спектру направлений — от экономических прогнозов до нейропротезирования.

Исследователи НИУ ВШЭ и Сбера добавят эмоций искусственному интеллекту

Ученые Центра искусственного интеллекта НИУ ВШЭ и исследователи Лаборатории искусственного интеллекта Сбербанка разработали специальную систему, которая с помощью больших языковых моделей сделает искусственный интеллект (AI) более эмоциональным при общении с человеком. Синтезом AI-эмоций займутся набирающие популярность мультиагентные модели. Научная работа о проведенном исследовании опубликована в рамках Международной совместной конференции по искусственному интеллекту — IJCAI 2024.

Вышка и «Яндекс» научат преподавателей российских вузов ИИ-грамотности

«Яндекс Образование» и факультет компьютерных наук НИУ ВШЭ (ФКН ВШЭ) создали совместный онлайн-гайд, посвященный промптингу — формулированию запросов к нейросетям. Он доступен всем на платформе «Яндекса» и в первую очередь будет полезен преподавателям, которые никогда не пользовались GPT в работе или только начинают применять ИИ-инструменты. Как правильно создать запрос к нейросети? Как грамотно использовать GPT-модели в образовательных целях? Какие задачи преподаватели могут решать с помощью искусственного интеллекта? Гайд отвечает на эти и другие вопросы по работе с нейросетями.

«Оставаться конкурентным специалистом без применения нейросетей может стать нелегкой задачей»

Цифровые технологии прочно вошли в нашу жизнь и продолжают стремительно развиваться. Неудивительно, что все чаще возникает вопрос, сможет ли однажды искусственный интеллект полностью заменить специалистов. О перспективах лингвистики в эпоху нейросетей рассуждает Даниил Осипов, кандидат филологических наук, доцент Школы иностранных языков НИУ ВШЭ.

В НИУ ВШЭ разработали нейросеть для оценки уровня владения английским языком

Нейросеть «ИИ Лингво» была разработана совместно Центром искусственного интеллекта, Школой иностранных языков и онлайн-кампусом НИУ ВШЭ. Модель обучена на основе тысяч экспертных оценок устных и письменных текстов. Система позволяет оценить способность к устному и письменному общению на английском языке.

Ученые НИУ ВШЭ рассказали о будущем искусственного интеллекта в судопроизводстве

Современные технологии меняют не только нашу повседневную жизнь, но и такие консервативные сферы, как судебная система. Сотрудники кафедры конституционного и административного права НИУ ВШЭ в Нижнем Новгороде Ирина Михеева и Олег Шерстобоев проанализировали возможности и вызовы, связанные с внедрением ИИ в судебный процесс. Исследование опубликовано в журнале «Вестник Российского университета дружбы народов».

«В третий раз соберем на площадке ВШЭ лучших ученых и исследователей ИИ в России»

Институт искусственного интеллекта и цифровых наук ФКН НИУ ВШЭ и Центр ИИ 25–26 октября в Москве организуют конференцию Fall into ML 2024. Главной темой ежегодного мероприятия станут перспективы развития фундаментального искусственного интеллекта. Титульным партнером конференции выступит Сбер.

В Вышке упростили разработку интеллектуальных сервисов

Ученые НИУ ВШЭ разработали MLOps-платформу, применение которой поможет внедрять эффективные и безопасные ИИ-решения во всех кампусах и подразделениях университета. В дальнейшем рассматривается возможность масштабирования инструмента на внешний рынок.

Бизнес-разработки и студенты в науке: какие еще задачи у новой лаборатории Института ИИ и цифровых наук

Лабораторию теоретических основ моделей ИИ возглавил старший научный сотрудник факультета компьютерных наук Никита Пучкин, за прикладные разработки будет отвечать руководитель проектов Института ИИ и цифровых наук Елизавета Жемчужина. О том, чем будет заниматься лаборатория, как планируется организовать сотрудничество с индустриальными партнерами и какая роль в ее работе отводится студентам Вышки, они рассказали в интервью «Вышке.Главное».

НИУ ВШЭ – Нижний Новгород и ИТ-кампус будут готовить магистров в области ИИ и компьютерного зрения

17 сентября директор нижегородского кампуса Высшей школы экономики Анна Бляхман и директор АНО «Проектный офис ИТ-кампуса НЕЙМАРК» Валерий Черепенников заключили соглашение о присоединении ИТ-кампуса к программе магистратуры «Искусственный интеллект и компьютерное зрение». Поступить на программу в сетевом формате можно будет в 2025 году.