Подозрительные лица: Как VisionLabs зарабатывает на компьютерном зрении
«И вот тогда я особенно сильно ощутил холодное дыхание кассового разрыва», — вспоминает сооснователь компании VisionLabs Алексей Нехаев. В июле 2014 года российский разработчик систем распознавания лиц готовился закрыть первую серьёзную сделку — с украинским «Приватбанком». Но после того, как комплекс «Бук» сбил в небе над Донецкой областью самолёт Malaysia Airlines, переговоры остановились.
Стартап, который Нехаев и его партнёр Александр Ханин организовали несколькими годами ранее, смог продержаться ещё несколько месяцев без выручки и наконец нашёл крупных клиентов. Ими стали «Лето банк» (теперь — «Почта банк») и российское подразделение американского бюро кредитных историй Equifax.
Сейчас Visionlabs сотрудничает с несколькими десятками банков в России и СНГ. «Почта банку» система распознавания лиц только в 2016 году позволила предотвратить заключение мошеннических сделок на 1,5 млрд рублей.
Софт VisionLabs подключается к камерам наблюдения. Система Luna выхватывает из видеопотока снимок лица и сверяет его с двумя базами: клиентов и мошенников. Кроме того, Luna используется для идентификации сотрудников.
Конкуренты ругают VisionLabs за отсутствие «по-настоящему сильной технологии» (развёрнутые комментарии экспертов представлены в конце материала), однако отдают должное уровню «шума, который компания создаёт на рынке». Год назад фонд Sistema VC (входит в АФК «Система») инвестировал в стартап 350 млн рублей, оценив его в 1,4 млрд.
«Секрет» рассказывает, как VisionLabs зарабатывает на компьютерном зрении и машинном обучении.
Поиск себя
Эта история началась в 2011 году, когда робототехник Александр Ханин смастерил чёрную коробку, внутри которой находился микрокомпьютер SoC на операционной системе Embedded Linux и собственной прошивке. Подключившись к любой аналоговой камере, коробка могла распознать в видеопотоке лица людей и автомобили. «Способность видеть — это более 80% того, что нам дают органы чувств; когда мы научим этому роботов, почти полностью решим задачу создания настоящего искусственного интеллекта», — объясняет свой интерес выпускник МГТУ им. Н.Э. Баумана.
Алексей Нехаев в то время был сотрудником компании «Крок», занимался IT-проектами, которые системный интегратор вёл в «Иркутскэнерго», Tele2 и других компаниях. С будущим бизнес-партнёром его свёл знакомый. Банкир Алексей Кордичев, с которым Нехаев тогда учился в школе управления «Сколково», позвал группу молодых учёных Бауманки во главе с Ханиным выступить перед студентами. «Когда Саша прочитал лекцию о продукте, идея компьютерного зрения показалась мне свежей и привлекательной с точки зрения бизнеса», — вспоминает Нехаев.
Кордичев тоже вдохновился и стал финансовым советником VisionLabs. Кроме того, в качестве научного руководителя к команде присоединился профессор французского Национального института исследований в информатике и автоматике Иван Лаптев. В этом составе стартаперы стали резидентами инновационного центра «Сколково». Сейчас у Ханина 45,28% акций компании, 25% — у Sistema VC. Нехаев, Кордичев и Лаптев делят оставшуюся часть.
Сначала Ханин и его партнёры хотели приспособить «чёрную коробку» для автоматизации пропускных систем — чтобы шлагбаум распознавал номер и пускал на закрытую территорию только автомобили с правом доступа. Эту концепцию основатели развивали два года и даже заключили контракты с производителями программного обеспечения — exacqVision и StreamLabs.
Но ЧОПы, разработчики систем видеонаблюдения, ритейлеры и другие потенциальные клиенты и партнёры плохо понимали, зачем им компьютерное зрения. Продажи не шли.
«Нужно было продать десятки тысяч лицензий, чтобы достичь финансового результата, который у нас есть сейчас (выручка за 2016 год — 85 млн рублей, — Прим. "Секрета")», — объясняет Ханин. — В тот момент мы питались святым духом. Например, у меня зарплата была — 5850 рублей в месяц».
Концентрация
В 2013 году VisionLabs победил в конкурсе Intel и попал в американскую акселерационную программу Technology To Market Accelerator. Фаундеры провели три месяца в бизнес-школе имени Уолтера Хааса в Университете Беркли и за это время определились с новой концепцией. Решили делать сервис для банков.
Вернувшись в Россию, стартаперы попали в акселератор ФРИИ, который инвестировал в проект 1 млн рублей. Подробности сделки стороны не раскрывали; CNews сообщал о доле в 2,2%, что для ФРИИ вполне характерно.
Программа обучения от американской почти не отличалась. Но пользу из сотрудничества с ФРИИ извлечь удалось — фонд помог установить контакты с банками.
Когда в конце 2013 года VisionLabs победил в конкурсе Ханты-Мансийского банка на разработку биометрической системы, казалось, что стартап вот-вот полетит. Но сделка не состоялась из-за того, что в банке началась реорганизация (в результате был создан банк «ХМБ Открытие»). Деньги, между тем, заканчивались.
Положение должен был спасти контракт с украинским «Приватбанком», на который предприниматели вышли через его российскую дочку, но сделка сорвалась из-за гибели рейса MH17.
Избежать провала в итоге удалось благодаря контракту с «Лето банком» (теперь — «Почта банк»).
Продукт
В 2014 году биометрические сервисы уже были, например, у Сбербанка и «ХКФ банка». Потенциальные клиенты спрашивали у Ханина и Нехаева, чем их решение принципиально лучше. Они объясняли, что их продукт работает быстрее при меньшей аппаратной нагрузке.
«Для анализа сходств мы не используем такие очевидные вещи, как размер черепа, — объясняет Ханин. — Со штангенциркулем не ходим и никого не измеряем». Анализ производит нейросеть, которая сама выбирает необходимые параметров. Это могут быть текстуры, складки, другие особенности.
Суть обучения нейросети не в том, чтобы загрузить в неё заданный человеком перечень параметров, а показать ей как можно больше примеров: вот фото одного и того же человека, но тут он с чёлкой, здесь — без, тут — с макияжем, там — в очках. Чем больше у нейросети примеров соответствия и несоответствия фотографий конкретному человеку, тем быстрее она обучается.
Продажи
Искать новых клиентов помогало участие в финансовых конференциях. «Мы объясняли, как ускорим кредитный конвейер, как поднимем предсказательную силу модели, как сократим количество рабочих часов персонала», — рассказывает Ханин. По его словам, Luna экономит 20-40 секунд на обслуживании каждого клиента.
«Мы не только с мошенниками помогаем бороться, но также исключаем влияние человеческого фактора, — продолжает Ханин. — Работник может не узнать клиента, прикрепить к кредитной заявке фото не того человека, неправильно сфотографировать лицо — так, что в кадре окажутся посторонние предметы».
В конце 2014 года российское подразделение американского бюро кредитных историй Equifax подписало с VisionLabs эксклюзивное соглашение на использование движка распознавания лиц в своём межбанковском сервисе предотвращения мошенничеств.
«С этого момента мы перестали бегать за клиентами — банки уже сами звонили и говорили: нужен пилот на такой-то кейс», — гордится Нехаев. По его словам, в 2014 выручка компании составила 21 млн рублей, в 2015-м — 33 млн, в 2016-м — 85 млн.
В июле 2016 года компания получила инвестиции венчурного фонда Sistema VC в размере 350 млн рублей. Фонд приобрёл 25% VisionLabs, оценив компанию в 1,4 млрд руб. ФРИИ после этой сделки из капитала вышел.
Контекст
Согласно прогнозу исследовательской компании MarketsandMarkets, к 2021 году объём мирового рынка систем распознавания лиц достигнет $6,84 млрд. Основатели VisionLabs оценивают потенциал российского рынка в несколько десятков миллионов долларов только в коммерческом секторе.
Один из крупнейших мировых игроков — японский производитель электроники NEC. Его алгоритм идентификации и распознавания лиц признан лучшим в отрасли по версии Американского национального института стандартов и технологий (NIST) в 2017 году. Ещё один гигант — Cognitec Systems.
На российском рынке несколько десятков компаний. Один из самых известных проектов — NTechLab с популярным сервисом Findface. Его алгоритм может распознать 1 млрд изображений в режиме реального времени. Стартап привлёк $1,5 млн инвестиций от фонда Impulse.V.C.
Алгоритмы распознавания лиц компании «Вокорд» заняли первое место в тесте Вашингтонского университета Megaface в 2016 году. Технологии «Вокорда» используют «Газпром», МВД, ФСБ, Альфа-банк.
Ещё один заметный игрок — «Центр речевых технологий». Его продукты используют «Ростелеком», «Мегафон» и МТС. Одно из решений «Центра» — система идентификации болельщиков для стадионов. Челябинская компания 3Divi фокусируется на софте, распознающем лица, движения и жесты, для устройств на iOS и Android.
Планы
Недавно у VisionLabs открылся голландский офис — компания мечтает о международной экспансии. У стартапа уже есть опыт совместной работы с компаниями уровня Google и Facebook. Пока, правда, только над некоммерческими проектами.
Продолжая осваивать финансовый сектор, VisionLabs экспериментирует с другими направлениями.
Компания разработала «маски» для видеозвонков в ICQ и «Историй» «ВКонтакте» — продуктов Mail.Ru Group. «Мы доработали технологию распознавания так, что она смогла анализировать лицо в динамике — мимику, поверхность, микродвижения, повороты», — говорит Ханин.
Условия сотрудничества стороны не раскрывают. В Mail.Ru Group «Секрету» сказали лишь, что VisionLabs представил «наиболее технологическое решение» с учётом всех требований. По данным «Коммерсанта», стартап мог заработать около 100 млн рублей.
Ханин говорит, что этот же продукт стал частью игрового сервиса [Face.Dj](https://itunes.apple.com/ru/app/face-dj/id1208394008?mt=8 http://visionlabs.ai/facedj-info.html), с помощью которого человек сможет «перенести» себя в виртуальное пространство: «Захотите поиграть в футбол, баскетбол, Sims со своим реальным лицом в игре — делаете селфи и внедряете модель в персонажа».
Совсем новый проект — софт для проведения собеседований. Полностью рекрутеров он не заменит, но VisionLabs обещает, что технический персонал (операционистов, консультантов, промоутеров) решение компании сможет набирать без участия человека.
Мнения
VisionLabs — одна из многих компаний, занимающихся распознаванием лиц. Ничего выдающегося в этой области она ни достигла. Она не занимает верхней строчки ни в одном из значимых мировых рейтингов, делая упор на рейтинг LFW, где входит в первую пятёрку. Но в этом рейтинге у 33 компаний результат превышает 99% — это говорит о том, что он давно утратил актуальность и не позволяет провести различие между разными алгоритмами.
Основные усилия компания тратит на то, чтобы создавать шум на рынке. Но отсутствие по-настоящему сильной технологии и недостаток опыта в реализации серьёзных проектов приводит заказчиков к разочарованию. Мы часто слышим негативные отзывы клиентов из банковского сектора о качестве решения VisionLabs, когда они обращаются к нам в поисках альтернативы.
То, что компания делает на самом деле, — ставит свои системы «на тест», чтобы потом рассказывать об этом как о реальном внедрении. Но ни одна компания не может долго существовать без выручки. Деньги инвесторов рано или поздно закончатся.
Однозначно VisionLabs — один из лидеров в распознавании лиц. Причём не только в России, но и на международном рынке. Несомненное преимущество — поддержка венчурных инвесторов. Это позволяет агрессивно наращивать технические и маркетинговые компетенции. Чем компания привлекают инвесторов, я не знаю. Сами мы решения VisionLabs не тестировали.
Фотографии: Александр Карнюхин / «Секрет фирмы»