ask@ftvmetrics.com +79259265003, Москва
АНАЛИЗ ДАННЫХ И АНАЛИТИКА

Маркетинг: парсим скриптовые сайты — решаем задачи бизнеса.

Прогоамма реализована с помощью Mathematica 12.2
Author: Wolfram Research, Inc.
Title: Mathematica
Edition: Version 12.1
Publisher: Wolfram Research, Inc.
URL: https://www.wolfram.com/mathematica
Place of publication: Moscow, Russian Federation
Date of publication: 2020

Например, я торгую автозапчастями. Товар не эксклюзивный, представлен многими продавцами. Если я знаю ситуацию на рынке, то имею все основания повысить свою маржинальность, а также решать важные задачи по тактике продаж. Если не знаю, то всегда проигрываю: занижаю цену — снижаю маржинальность, завышаю цену — снижаю объем продаж.

Нужную мне информацию я планирую взять у агрегаторов запчастей, которые продвигают товар независимых продавцов. Сайтом emex.ru, например, пользуются более 700 поставщиков. Для агрегатора выгодно, если продавцы и покупатели не видят картину в целом и в конкурентной борьбе между собой увеличивают ценность агрегатора. Сайты emex.ru и exist.ru — скриптовые. Данные в них подгружаются по мере необходимости из внутренних баз данных. Если парсить традиционный сайт, то данные отображаемые на web-странице можно увидеть и в исходном html коде. В скриптовых сайтах это не так — в коде web-страницы нет никаких явных данных. И дело не в том, что они отсутствуют, а в том, что они еще не подгрузились.

Для того чтобы получить данные в коде, надо иметь инструментарий, позволяющий открыть виртуальную сессию и делать паузы для подгрузки данных.

Это не исчерпывает перечень проблем. Например надо уметь раскрывать вложенные списки. В противном случае много данных будет потеряются (не будут отображены в коде).

Хорошо, пусть я преодолел перечисленные трудности и сумел получить желаемые данные. Что это даст для бизнеса?

Первая проблема при работе с полученными данными связана с непонятностью в применении статистических методов к выставленным продавцами ценам. Пример: на оси z (значения от 0 до 20000 рублей) — цена, на оси x (значения от 0 до 40 дней) — время ожидания доставки, на оси y (значения от 0 до 30 штук) — количество товара на складе.

Тот же пример, но на первом рисунке присутствуют все предложения, а на втором — только предложения продавцов с высоким рейтингом. На втором рисунке уже прослеживаются разумные тренды — чем дольше ждешь — тем цена ниже.

Вывод простой. Некоторые продавцы «вводят в заблуждение» и если не понять как, то всегда будет иметь место занижение вами цены.

Для этого можно использовать данные по рейтингам продавцов за 90 дней. Данные по рейтингам продавцов можно обобщить и визуализировать. Таблица рейтинга для диапазона от 0 до 0.5 (весь диапазон от 0 до 1).

Первое число в группе — суммарный рейтинг. При этом он складывается из значений триплексов. Первое число в триплексе — доля отказов от продажи, второе число — доля опозданий и третье — доля предложений о перемене одной запчасти на другую. Из рисунка видно, что часть продавцов играет на более дешевых предложениях (запчастей по такой цене у них нет), а часть на занижении сроков доставки (запчасть имеется, но логистически очень далеко).

Хорошо, поняли на какие данные надо ориентироваться. Тогда можно начать решать задачи ценообразования.

Первое число в строке в рамке — декларируемое количество запчастей на складе продавца. Красное число — цена. Последний дуплекс — рейтинг и код продавца.

В тактике продаж важно понимать динамику рынка. По имеющимся данным расчетным методом можно посчитать только относительную динамику в дамках скользящей 90-дневной статистики единиц продаж.

Логика простая — ваши продажи не должны сильно отличаться от обобщенных показателей (в штуках) рынка.

Анализ ценообразования продавцов показывает, что пока в тактике продаж они слепо следуют за курсом доллара. При этом важно в тактику продаж ввести режим «продавать/не продавать», если себестоимость запчастей не соответствует курсу доллара. Массовое запаздывание по срокам доставки, кроме случаев специального ввода в заблуждение, может быть связано с недостаточной проработкой логистической составляющей: где хранить, в каком количестве и какой вес/объем.

Если встать на путь систематического улучшения бизнеса, то можно к парсингу основных агрегаторов добавить статистику поисковых запросов, собираемую браузерами.