secretmag.ru
Технологии

Гуру Google — о том, что могут рассказать об обществе поисковые запросы

Автор книги «Все лгут» предупреждает
Бывший специалист Google по большим данным Сет Стивенс–Давидовиц написал книгу «Все лгут. Поисковики, big data и интернет знают о вас всё». Он анализировал запросы в поисковиках, чтобы доказать: победа Трампа закономерна, а сексуальные пристрастия многих людей — очень странные. «Секрет» узнал у Стивенсона-Давидовица, насколько правдива его книга и какой результат исследования поразил его больше всего.

Бывший специалист Google по большим данным Сет Стивенс–Давидовиц написал книгу «Все лгут. Поисковики, big data и интернет знают о вас всё». Он анализировал запросы в поисковиках, чтобы доказать: победа Трампа закономерна, а сексуальные пристрастия многих людей — очень странные. Оказалось, что люди, скрывающие свои взгляды, убеждения и интересы от близких и случайных знакомых в соцсетях, предельно откровенны с поисковиком Google. «Секрет» узнал у Стивенсона-Давидовица, насколько правдива его книга и какой результат исследования поразил его больше всего.

— Профессор Стэнфорда Радж Четти назвал вашу книгу «Фрикономикой на стероидах». Что он имел в виду?

— Очень великодушно с его стороны! Я прочитал «Фрикономику» почти сразу после окончания колледжа, где изучал философию. Тогда я не знал, что делать в жизни дальше, и эта книга вдохновила меня пойти в науку о больших данных. Идея «Фрикономики» состоит в том, что можно узнать глобальные вещи об обществе с помощью анализа простых данных. Я до сих пор от этого в восторге, и я попытался сделать то же самое в своей книге.

Я написал несколько статей в The New York Times о выводах, которые сделал из анализа Google-запросов американцев, и издательство предложило написать книгу. Я мог бы сказать, что для меня важно было только поделиться идеями, а не стать успешным. Но как говорится: «Все лгут».

— У «Все лгут» и «Фрикономики» есть общий посыл: люди, узнайте правду! Кому вообще это нужно в эпоху пост-правды?

— Мне кажется, все люди понимают: мы редко говорим честно о том, что происходит у нас в голове. Всегда интересно узнать, что другие пытаются от вас спрятать. К тому же много пишу про секс! А секс всегда продаёт, согласны? Я решил изучить человеческую сексуальность через запросы на порносайтах, многим интересны результаты.

— В исследовании вы использовали открытые источники, например Google Trends. Вы не пытались получить доступ к закрытой информации для точных вычислений?

— Google очень заботится о личных данных пользователей. Люди крайне откровенны с поисковиком на любые темы: от сексуальности до ментальных проблем. Google всегда говорит, что для компании сохранение личной информации пользователей в секрете — главный приоритет. Да, доступ к этой информации мог бы мне пригодиться и сделать финальный результат работы точнее. Но частенько бывает, что компании предоставляют учёным данные, а они попадают другим людям, компаниям, политикам. Это того не стоит — вспомним ситуацию с Cambridge Analytica.

— С какими проблемами вы столкнулись, когда писали книгу?

— В исследовании не было определённой формулы, как и что нужно делать. Иногда, анализируя данные, я натыкался на очень неожиданные вещи. Ещё всегда сложно интерпретировать факты. Со временем ты улучшаешь этот навык, но всё равно делаешь ошибки. Нужно быть очень осторожным с выводами. Человек склонен видеть то, что он хочет увидеть, а не правду. Поэтому надо проверять все возможные объяснения и не идти на поводу у собственных представлений о том, как всё устроено. Нельзя доверять своей интуиции, нужно использовать данные. И даже в этом случае бывают ситуации, когда ты оцениваешь популярность употребления определённых слов, не получаешь нужного результата и специально перефразируешь запрос, чтобы результат соответствовал гипотезе. Я с этим боролся и борюсь.

— Вас не упрекали в том, что ваши выводы ошибочны? Всё-таки, если я гуглю что-то ужасное, не факт, что я буду делать нечто ужасное.

— Выводы, которые я делаю в книге, основаны на открытых данных, то есть все люди могут перепроверить всё, что я пишу. Они не смогут сказать: «В США нет расизма» или «Сексуальность людей не бывает очень странной». Потому что данные показывают, что расизм есть, а люди правда странные, когда речь идёт о сексуальных фантазиях.

Конечно, критика была, но не на фундаментальном уровне. С идеей, что люди лгут в социальных сетях и реальной жизни, но откровенны в поисковых запросах, большинство согласно. Обычно в интервью журналисты говорят мне, что они, например, ищут в поисковиках какие-то отвратительные вещи по работе. Например: «Я гуглил ИГИЛ (организация запрещена в России. — Прим. «Секрета») два дня назад потому, что я писал текст, а не потому, что я хочу туда вступить». Понятно, что журналистов не так много, но надо понимать, что и другие запросы иногда связаны с любопытством, а не с плохими намерениями.

— Какая информация вас больше всего напугала?

— Уровень расизма меня очень напугал. И ещё меня очень удивило, сколько человек делают запросы, связанные с суицидом. То есть многие люди страдают и держат это в тайне. Тема ментальных проблем до сих пор сильно табуирована.

— А как результаты повлияли на то, что вы думаете о людях, и на ваши отношения с близкими?

— В целом люди оказались более странными, чем я думал. Все эти странности ты никогда не увидишь на бизнес-встрече или семейном ужине, но они транслируются в интернет. Отношения с друзьями и родителями не сильно изменились — никто не думает, что я читаю их мысли или вижу их насквозь. Но есть вещь, которая меня раздражает. Некоторые друзья думают, что на самом деле я пишу не о других людях, а о себе. Например, я пишу про странные запросы о сексе, которые делают люди, и мои друзья говорят мне: «Сет! Мы и не знали, что ты такой!»

— Книга написана очень просто. Её главная цель – развлечь читателя?

— Скорее показать, насколько мощный инструмент для исследования даёт учёным интернет. Многие до сих пор не осознают, насколько это революционно для науки.

Фотография на обложке: Strelka Institute for Media, Architecture and Design / Flickr

Подписывайтесь на «Секрет фирмы» в «Яндекс.Дзене» и Google News.