Согласно открытым данным, мировой рынок решений по прогнозированию спроса будет расти на 11,5% в год. В России на фоне ухода международных вендоров и импортозамещения этот рост может быть еще динамичнее. Чтобы не ошибиться с выбором из множества решений разной степени зрелости, компаниям стоит обращать внимание на следующие шесть групп факторов.
Все технологии, используемые для прогнозирования спроса, можно условно разделить на две категории:
статистические методы прогнозирования. Например, скользящие средние и метод Хольта — Винтерса;
прогнозирование на основе искусственного интеллекта и машинного обучения. Например, регрессионные модели и алгоритмы на базе деревьев решений, использование нейронных сетей.
Хотя машинное обучение и искусственный интеллект больше на слуху, они не всегда обеспечивают наибольшую точность. Статистические методы стабильны, некоторые из них не требуют большого объема данных и тоже дают положительный эффект для бизнеса.
Например, с помощью простой медианы можно рассчитать прогноз, даже если доступно всего несколько статистических наблюдений, а решение нужно принимать прямо сейчас.
Статистические методы прогнозирования более интерпретируемы и зачастую могут быть использованы для проверки прогноза спроса, созданного на базе ML-алгоритмов. Кроме того, они менее требовательны к «железу». Это особенно актуально сейчас, когда графические процессоры, необходимые для машинного обучения, стоят дорого, а сроки их поставок существенно выросли.
Поэтому важно, чтобы решение для прогнозирования спроса имело «под капотом» инструменты обеих категорий — и статистические методы, и машинное обучение.
Раньше алгоритмы прогнозирования были проще — прогнозные модели можно было воспроизвести с помощью Excel, при этом компании сталкивались с ограничениями по объему и детализации данных и расчетов. Возросшие требования к точности и детализации прогноза привели к созданию новых методов прогнозирования (ML), одновременно создавая потребность в накоплении оцифрованных данных о факторах, влияющих на спрос.
При этом человек самостоятельно воспроизвести расчет уже не сможет, и успешность новых методов прогнозирования должна измеряться метриками качества. Каждый вендор патентует свою математику, итеративная разработка которой с промышленной апробацией гипотез в некоторых случаях занимает по 10-15 лет.
Главная причина усложнения — требования к скорости расчетов и точности. Самые строгие бенчмарки предъявляет ритейл (80-85% по разным метрикам против 70-75 у FMCG).
Например, в магазинах есть категории свежей выпечки и зелени, которые заказываются и доставляются больше одного раза в день. Значит, прогнозировать спрос необходимо с такой же детализацией, что требует быстродействия системы при сохранении возможности масштабирования. При этом возникает потребность учитывать не только общую сезонность, но и прогноз погоды на краткосрочном горизонте времени.
Корреляция метрик качества прогноза спроса и конечного бизнес-эффекта также требует отдельного внимания. Зачастую при внедрении прогнозных систем вводятся интегральные показатели точности прогноза, рост которых с большей степенью вероятности улучшит маржинальность бизнеса.
Система прогнозирования спроса сама должна уметь выявлять корреляции и устанавливать степень взаимного влияния факторов.
Например, учитывать эффект каннибализации — ситуацию, когда похожий товар по акции рядом на полке «съедает» часть спроса на нашу позицию или ввод нового товара приводит к снижению спроса на аналогичные позиции. Надо брать во внимание и влияние дополняющих товаров: конфет и чая, углей для мангала и жидкости для розжига и т. д. Для поиска таких взаимосвязей чаще всего используются алгоритмы машинного обучения.
Поскольку флагманом усложнения требований к прогнозированию является ритейл, компаниям, которым требуется максимальная точность и скорость, стоит изучить кейсы по внедрению именно из этого сектора.
Одна из главных ошибок при работе с ПО для прогнозирования спроса — недооценка влияния качества и полноты данных на результат. Поэтому, во-первых, решения должны включать набор алгоритмов для работы с информацией разного качества.
Например, у компании может не быть истории продаж за последние 2-3 года, чтобы система могла обучиться влиянию сезонности, либо отсутствовать история промоакций.
Во-вторых, необходимы инструменты для очистки и подготовки таких данных. Самые распространенные методики — срезание всплесков и спадов. Часто это статистические аномалии, которые негативно влияют на качество прогноза.
Например, в статистике продаж магазина может появиться разовый всплеск из-за оптовой продажи, которую некорректно включили в историю чеков физлиц. Качественная система должна исключать подобные ситуации из расчетов.
Еще один дефект в данных — «молчаливое исключение». Товар убрали из ассортимента на полгода, но в системе это не отметили. Когда позиция снова появляется, «нули» искусственно занижают прогноз. Другой пример — не отмечены даты начала и окончания промоакций, которые существенно влияют на спрос.
Для ML-алгоритмов также важно обращать внимание на пропуски данных и ошибки ведения оцифрованных факторов.
Использование прогнозных значений в качестве факторов тоже может повлечь дополнительную ошибку. Так, например, фактор «прогноз погоды» сам по себе является прогнозом с определенной погрешностью.
При этом важно понимать, что точность прогноза может быть снижена из-за изменений плановых значений по сравнению с фактическими. Например, если планируется проведение промоакции по цене, существенно отличающейся от фактической, а также если происходят незапланированные дополнительные распродажи товаров одновременно с основной акцией.
В качественных системах можно задавать правила очистки и обработки данных или использовать те, что предусмотрены по умолчанию, чтобы избежать неточностей из-за недостоверной информации.
Дефект «молчаливого исключения» и похожие ситуации проще обнаруживать, если система прогнозирования интегрирована с другими цифровыми решениями. Например, если товар не производился, его нет на складах, значит, и в магазинах он появиться не мог. Данные можно реконструировать, сопоставляя историю запасов и продаж.
Интеграция с другими системами позволяет избежать человеческого фактора и возможных ошибок при ручной загрузке данных.
Еще один важный момент — время. Например, компании нужно формировать прогноз каждое утро, а данные с кассовых терминалов поступают лишь к двум часам ночи. Информация должна автоматически передаваться в систему, рассчитываться за несколько часов и отправляться аналитикам уже к 7-8 утра.
Чаще всего интеграция делается с ERP- и POS-системами, которые как раз собирают кассовые данные, а также корпоративным хранилищем и системами нормативно-справочной информации. Для этого у системы должны быть интерфейсы API или специализированные шины обмена данными.
Худшее, что может случиться с системой после внедрения, — ей не будут пользоваться. Частые причины — либо низкое доверие категорийных менеджеров и специалистов по планированию к продукту, либо неудобный интерфейс.
Интерфейс должен наглядно подсвечивать критичные позиции, требующие внимания специалиста. Это важно, потому что проверить все вручную на больших объемах данных невозможно.
Также пользователь должен иметь возможность настроить уровень чувствительности системы, чтобы та не игнорировала важное, но и не перегружала пользователя слишком большим объемом уведомлений. Поэтому ПО должно уметь отсеивать малозначимые факторы и помогать пользователям ориентироваться с помощью той же «светофорной» системы.
Кроме того, ПО должно позволять гибко настроить уровни прогнозирования. Часто на практике возникает необходимость посмотреть данные в разрезе категорий, регионов, месяцев, бизнес-целей.
Важно, чтобы аналитик мог через drag&drop добавлять колонки и строчки в интерфейс «на лету», не отправляя каждый раз запрос программистам на доработку. То же касается возможности кастомизировать дашборды и графики.
С гибкостью параметров конфигурации системы cитуация двоякая. С одной стороны, важна полнота информации. С другой, когда параметров становится слишком много (например, 200+), усложняется работа и становится трудно выявить взаимосвязи.
Продвинутые системы позволяют пользователю управлять удобным набором ключевых настроек и автоматически калибровать прочие параметры.
Чрезмерное усложнение требует специальной подготовки команды. Однако далеко не все компании могут нанимать математиков, чтобы разбираться с детализированными настройками. Это дорогостоящие специалисты, которых на рынке не так много.
Последний момент, на который важно обратить внимание, — это потенциальный подрядчик по внедрению. Если решение предоставляет вендор без развитой партнерской сети или стартап, в случае его ухода с рынка дальнейшая поддержка ляжет на собственную команду. Наличие у вендора широкой партнерской сети и долгой истории на рынке — критичные факторы.
Еще одним плюсом будет, если внедрение сопровождается методической поддержкой со стороны интегратора или консалтинговой компании, а у вендора есть обучающие материалы по продукту.
Кроме того, системы прогнозирования спроса быстро устаревают, поэтому нужно регулярно интересоваться дорожной картой развития вендора. Ее запрос на старте позволит отличить компании с собственными разработками от тех, которые предлагают перелицованные Open Source- или партнерские продукты.
При выборе переупакованного Open Source-решения команда не сможет повлиять на дальнейшее развитие продукта, все изменения будут зависеть от потребностей сообщества пользователей этого ПО.