Что такое парсинг. Объясняем простыми словами
Парсинг — автоматизированный сбор и систематизация информации в интернете с помощью специальных программ (парсеров).
Допустим, вы захотели узнать, по какой цене продают товар ваши конкуренты. Но конкурентов у вас — тысячи, и сидеть искать цены на их сайтах, а потом заносить их в табличку можно вечно. Тогда можно воспользоваться программой-парсером, которая будет искать информацию по заданным параметрам на определённых сайтах, а потом сама её систематизирует.
Парсинг в бизнесе чаще всего используют для:
- анализа цен конкурентов;
- отслеживания каких-либо изменений в информационных системах;
- приведения в порядок своего сайта (например, поиск ошибок, несоответствий, пропусков в карточках товара);
- составления различных баз данных.
Парсить можно только данные, находящиеся в открытом доступе. Взлом личных кабинетов и сбор персональных данных их владельцев запрещён. Также нельзя использовать данные, защищённые авторским правом.
Пример употребления на «Секрете»
«Федеральная антимонопольная служба (ФАС) провела встречу с представителями крупнейших ретейлеров электроники по поводу программ, которые мониторят цены конкурентов (парсинг-программ). В ведомстве опасаются, что роботы могут незаконно координировать экономическую деятельность компаний».
(Из новости об интересе ФАС к системам мониторинга цен.)
Факт
С 1 марта 2021 года в России запретили парсинг персональных данных, которые человек сделал общедоступными, теперь можно собирать только данные, на сбор которых он дал разрешение.
Статью проверил:
Вадим Ковригин, доцент Российского экономического университета им. Г. В. Плеханова