$ 64.1568.47$53.94
25 июля 2016 года в 08:20

Павел Голубев. Когда искусственный интеллект превзойдёт создателей

И почему этого не нужно бояться

Павел Голубев. Когда искусственный интеллект превзойдёт создателей

В 2016 году технологии машинного обучения — самая популярная тема в IT. Не проходит дня без новостей о нейросетях, самообучающихся продуктах или самоуправляемых автомобилях. Причина массового интереса в том, что это уже не футурология, а вполне прикладные вещи. Например, мы в своём сервисе используем нейросети для повышения эффективности рекламы. Эти механизмы лежат в основе алгоритмов медиации и были заложены ещё несколько лет назад, на первых этапах разработки, когда мы делали внутреннее решение для работы с рекламой в игровом издательстве.

Строго говоря, нейросети — это лишь один из подразделов машинного обучения. Таких подразделов много, и у каждого есть достоинства и недостатки. Наиболее распространены и хорошо изучены линейные методы, которые предполагают, что результат, выдаваемый моделью, линейно зависит от свойств, на основе которых она делает выводы. Линейные методы интуитивно понятны и хорошо интерпретируются, но часто взаимосвязи между свойствами носят нелинейный характер. В этом случае формула усложняется.

Мы используем усложнённый метод, потому что его результаты в полтора-два раза точнее. Главная задача сервиса — максимизировать стоимость каждого рекламного показа для разработчика мобильного приложения. Для этого мы учим предиктор, наш искусственный интеллект, предсказывать цену, которую рекламные сети готовы платить за отдельный показ.

У рекламодателей есть множество способов назначения ставок. Они могут выставлять фиксированную ставку или среднюю ставку за последнее время, менять её значение в зависимости от контекста, учитывая, например, название приложения, возраст клиента и т. д. Необученный искусственный интеллект не сможет сделать никаких предположений о том, насколько рекламодатель заинтересован в рекламном показе. Поэтому на первом этапе искусственный интеллект просто наблюдает за рекламодателями и пытается найти шаблоны в их поведении. Один из простейших шаблонов — увеличение конверсии рекламы в пятницу и субботу и существенное её снижение в понедельник.

Такие паттерны мы умеем отслеживать и вручную, но каждый новый параметр увеличивает сложность прогнозирования. Модель устройства, GPS, предыдущая активность пользователя, вид соединения, время, проведённое в приложении, — всё это влияет на стоимость рекламы. Методы машинного обучения позволяют автоматизировать процесс настройки ставки: за четыре года мы собрали большой объём данных вида «свойства / результат», где каждой группе «свойств» соответствует какой-то целевой «результат». Эти данные используются для обучения предиктора — в результате он умеет по набору параметров предсказывать ставку, которую рекламодатель готов заплатить за рекламное место.

Ещё одна задача, которую решает искусственный интеллект в нашем продукте, — определение вероятности конверсии рекламы в действие пользователя. Например, он может предсказать, с какой вероятностью пользователь просто кликнет по рекламе, а с какой — установит игру и пройдёт первые пять уровней. Как правило, при тщательной ручной оптимизации рекламы хорошим показателем для конверсии из клика в установку считается значение в 1% и выше. Предиктор позволяет увеличить конверсию до 3–5%. Замечу, что цифры приведены для полноэкранных статических баннеров внутри мобильных приложений. В других форматах и при другом инвентаре показатели могут существенно отличаться.

Чтобы лучше продемонстрировать возможности искусственного интеллекта, расскажу историю из опыта. Наши партнёры запустили на этапе обучения предиктора рекламу приложения для рисования. Они открутили некоторое количество показов и обнаружили, что много установок пришло из детской игры «Маша и медведь». Мы, разумеется, сделали вывод, что рекламу приложения для рисования имеет смысл показывать в «Маше и медведе» в большем объёме.

Но затем мы включили предиктор и почти сразу обнаружили, что приложение для рисования больше не рекламируется в «Маше и медведе» — наш искусственный интеллект решил, что нет смысла показывать именно эту рекламу именно там. Примерно две недели мы разбирали баги и пытались понять, почему сеть так себя ведёт, ведь было очевидно, что реклама подходит и трафик конвертируется. Несколько инженеров разбирались, как именно машина приняла такое странное, очевидно неправильное решение. В конце концов медиабайеры убедили нас переключить рекламную кампанию из режима управления предиктором в ручной. Мы старгетировали кампанию на игру «Маша и медведь». Несколько дней весь трафик из игры лился исключительно на приложение для рисования. Вообще весь трафик, какой был в игре. Знаете, сколько конверсий мы получили? Ноль.

Получается, искусственный интеллект принял верное решение, а люди две недели пытались убедить его в том, что он не прав, пока сами на практике не убедились в обратном. Мы до сих пор не понимаем, как вышло, что сначала реклама конвертировалась, а потом с теми же условиями перестала. Вероятно, предиктор взял в расчёт общее количество трафика, которое уже было потрачено на рекламодателя, или день недели или какой-то неведомый нам фактор. Не знаю. Подвох в том, что в какой-то момент основ для принятия решения у нейросети становится слишком много, чтобы мы могли понять, что действительно послужило причиной.

Со временем искусственный интеллект может настолько превзойти своих создателей, что окажется за пределами нашего контроля. Для этого должны сойтись несколько предпосылок: искусственный интеллект должен обладать некими базовыми ценностями, большим количеством ресурсов и возможностью улучшать свой исходный код.

Базовая ценность — это то, к чему он всегда стремится. Например, для человека базовой ценностью является инстинкт самосохранения и продолжения жизни, а для нашего предиктора — максимизация стоимости рекламного показа. Ради выполнения базовой ценности искусственный интеллект должен использовать языки программирования и терминал, чтобы совершенствовать собственный код. Ему понадобится много ресурсов, чтобы параллельно запускать большое количество новых версий и анализировать их эффективность.

Без должного контроля, а также при поддержке программиста, который заинтересован в эволюции, со временем искусственный интеллект разовьётся настолько, что сможет улучшать самого себя постоянно с недоступной нам скоростью. Рано или поздно, эволюционируя, он придёт к переосмыслению своей базовой ценности и следующим шагом неизбежно выйдет из-под контроля создателя. Все, я думаю, помнят вторую часть «Терминатора».

Чтобы избежать такого сценария, мы устанавливаем машине чёткие пороги обучения. Обучение прекращается, точнее, перестаёт иметь смысл, если предметная область уже достаточно изучена. Шаблоны монетизации рекламных показов могут быть изучены досконально — искусственный интеллект научится предсказывать их с очень высокой точностью, но за рамки предсказания стоимости никогда не выйдет. Да, он неизбежно превзойдёт нас в знаниях, но эти знания конечны. И пусть мы не поймём логику его решений, мы всё равно сохраним контроль.

Фотография на обложке: Bloomberg / Getty Images

Обсудить ()
Новости партнеров