Опубликовано 01 июля 2016, 19:29

Роботы зари: Кто и как использует нейронные сети

Диагностика заболеваний, поиск пропавших людей и другое

Диагностика заболеваний и поиск пропавших людей

Роботы зари: Кто и как использует нейронные сети

В июне приложение Prisma, позволяющее с помощью нейросетей обрабатывать фотографии в стиле известных художников, покорило чарты Appstore.

CEO Google Cандар Пичаи в этом году заявлял, что главный приоритет компании — машинное обучение: «Его применяют во всех продуктах — в поиске, рекламе, YouTube и магазинах приложений. Благодаря ему переосмысляются другие шаги».

В марте нейросеть Google AlphaGo (создатели — компания DeepMind, купленная Google в 2014 году за $500 млн) одержала третью победу над одним из сильнейших игроков мира в го Ли Седолем. Нейросети уже работают во многих продуктах массового использования. Deep learning (глубинное обучение) улучшает качество имеющихся алгоритмов, либо позволяет сделать то, что раньше было невозможно. Например, распознавать дорожные знаки в видеорегистраторе, определять пешеходов на дорогах, пол, возраст и эмоции людей, синтезировать звуки и тексты. «Нейросети уже с 2012-го начали превосходить человека по качеству исполнения некоторых привычных задач. Например, определение объекта на картинке из тысячи возможных. Теперь человек в некоторых задачах ошибается чаще, чем нейросеть», — говорит Григорий Сапунов, сооснователь платформы Intento.

Год назад Micro запустил проект How old, который угадывал по фотографии, сколько лет пользователям. Вначале ему это плохо удавалось, но за год система научилась на большом массиве данных распознавать реальный возраст. Яндекс, Micro, Baidu и другие крупные интернет-компании уже несколько лет экспериментируют с искусственным интеллектом и нейронными сетями. «Секрет» рассказывает о существующих проектах.

Изображение, тексты, речь и музыка

В 2013 году проект Clarifai был признан одним из лучших в сфере распознавания изображений и видео. Разработчики выпустили открытый код API, чтобы позволить другим компаниям и программистам использовать технологию. Другой яркий пример — российский сервис Findface, разработанный компанией N-Tech.Lab — фотографию человека можно загрузить в систему, она распознает лицо и найдёт его профиль в «ВКонтакте».

Сервис объявлений о продаже автомобилей «Авто.ру», принадлежащий Яндексу, в конце июня запустил в своих мобильных приложениях функцию распознавания автомобилей. Она позволяет найти марку и модель машины по фотографии, изучить объявления о ней, опубликованные на сайте. Приложение определяет автомобиль с помощью технологии «компьютерного зрения».

Летом 2015 года исследователи из Университета Тюбингена представили научную работу о переносе стиля знаменитых художников на фотографии. На западном рынке запустился Instapainting, в России — его полная копия Ostagram. С помощью нейросетей можно не только накладывать стили картин, как это делают приложения Ostagram или Prisma, но и перерисовывать картины.

Американская компания Deepomatic соединяет изображения медиа ресурсов, например, интернет-изданий о моде, с картинками в интернет-магазинах. Алгоритмы учитывают, какие изображения пользователь разглядывал в интернете, и отправляют его за покупкой похожего товара в магазин партнёра, с которым компания делится выручкой.

Программы, которые умеют распознавать и анализировать увиденное, могут пригодиться не только для создания развлекательных или рекламных сервисов. Разработчик Андрей Карпати создал проект NeuralTalk: написал код для генерации описаний картинок, соединил свой ноутбук с камерой и прошёл по улицам Амстердама. Программа смотрела вокруг с помощью камеры компьютера и описывала, что видит. Если дополнить такую программу синтезатором голоса, слепой человек сможет лучше понять окружающее пространство. Кстати, до этого Карпати создал программу, в которую можно загрузить тексты, скажем сонеты Шекспира, чтобы научить её генерировать похожие.

Бостонский стартап Ava помогает следить за здоровьем с помощью нейросети. Чтобы получить информацию о калориях, содержащихся в блюде, которое вам предстоит съесть, нужно сфотографировать его и загрузить в приложение. Компания привлекла $3 млн от венчурных фондов — Khosla Ventures и других, а также от Innovation Endeavors бывшего CEO Google Эрика Шмидта.

Софтверная компания Affectiva научилась распознавать эмоции людей и продавать эти знания рекламодателям для выбора целевой аудитории. Недавно софт стали пытаться применять в играх: технология анализирует выражение лица человека через вебкамеру, и игра реагирует на эмоции человека. Например, если пользователь заскучал, предлагает ему новый квест или неожиданное препятствие. Так получается создавать более персонализированные игры в зависимости от его состояния.

Роботы уже могут писать сценарии для фильмов — первый короткометражный фильм с главным героем сериала «Кремниевая долина» появился в сети в июне. На основе глубокого обучения уже давно генерируют зарифмованные тексты в компании «Яндекс» (альбом «Нейронная оборона», проект «Автопоэт»).

В 2015 Google внедрил Smart Reply, запущенный в ноябре 2015. Алгоритм читает письма и автоматически генерирует три ответа на выбор, пользователи Gmail Inbox app может отправить любой одним нажатием кнопки.

Дроны и автомобили

Разработчик графических ускорителей Nvidia поставила систему в автомобиль, водитель проехал 2000 миль, нейросеть наблюдала за его действиями и анализировала картинку с камеры, и так научилась управлять автомобилем, в том числе во время дождя.

В феврале в Швейцарии несколько университетских профессоров собрали дрон, который смог автономно летать по лесу, определять тропинки и искать пропавших людей. Его действиями управляет нейросеть. Технология применяется в роботах-автомобилях, которыми занимаются Google, Baidu и другие компании. Нейросеть запоминает траекторию движения и с каждым разом становится умнее.

В октябре 2015 года хакер Джордж Хоц в своём гараже приступил к разработке системы автопилота на базе автомобиля Acura ILX, мини-ПК Intel NUC, двух GPS-модулей, лазерного радара и шести камер от смартфонов. По словам Хоца, преимущество его автопилота в том, что он осваивает навыки вождения на основе практического водительского опыта в отличие от других аналогов, которые учатся с помощью кода, описывающего ситуации на дороге и алгоритмы действий в таких ситуациях. Первый автомобиль под управлением разработанной Хоцом системы автопилота уже прошёл испытания.

Боты

Американский стартап Luka использует нейросети, чтобы учить ботов разговаривать как людей. Глубинное обучение помогает программе лучше понять, какие слова и реплики нужно говорить в разных ситуациях. Если задаться целью, можно научить бота имитировать реплики конкретных людей и разговаривать в стиле друга или родственника. Так можно продлить жизнь любимого человека. В 2014 году запустился стартап Eterni.me, который предлагает всем желающим создать аватар, который будет учиться у своего реального прототипа, а в случае смерти владельца сможет пообщаться с его друзьями и родственниками, пошутить и рассказать историю из жизни.

Впрочем, использовать обучающихся ботов можно не только для того, чтобы почтить память ушедшего друга. Компания Burner тестирует бота-фантома, который будет отвечать людям, с которыми владелец не хочет общаться сам. Например, он сможет вежливо отказаться от свидания, сообщить, что очень занят и устал надоедливым ухажёрам.

Медицина

Эксперты прогнозируют, что нейронные сети помогут диагностировать симптомы заболеваний на ранних стадиях и даже изобретать новые лекарства. Например, с их помощь можно будет точнее интерпретировать результаты УЗИ, совершать быстрый поиск по базам данных с похожими историями болезней и назначать адекватное лечение. Компания Atomwise уже сейчас работает с фармацевтическими компаниями, анализируя объём данных о разных препаратах и реакциях на лечение с их помощью, и на основе этого предсказывая действия новых лекарств.

Проект в области диагностики Enlitic использует обучение и распознавание изображений, чтобы помогать врачам ставить диагнозы и определять отклонения от нормы. Платформа Quantified Skin, основанная на нейросетях, даёт рекомендацию по количеству и виду физической нагрузки для улучшения здоровья и состояния человека. Система помогает избавиться от хронических заболеваний, связанных с ожирением.

Проект Deep Geics проводит экспертизу в области анализа генома и работает над технологией предсказания заболеваний. Компания внедряет новое поколение вычислительных технологий, которые должны помочь понять, что происходит с клеткой, когда ДНК мутирует.

Фотография на обложке: Michael Hanschke / Reuters