Прогнозирование спроса на экспресс-доставку: инструменты и метрики

Почему прогноз спроса в экспресс-доставке решает операционные проблемы

Когда вы управляете хабом, который должен обработать тысячи отправлений в считанные минуты, или выстраиваете смены курьеров на последней миле, ошибка прогноза — это не просто цифра в отчёте. Это очень конкретная физическая боль. Не хватает рук на сортировке, сбиваются слоты подачи, растёт время обработки каждого отправления, а SLA начинает таять с каждой минутой задержки.

Хороший прогноз — это, по сути, страховка от хаоса. Он позволяет заранее распределить ресурсы так, чтобы не наступила ситуация, когда в понедельник утром у тебя курьеров в два раза меньше, чем нужно, а в среду днём они сидят без заказов. Выравнивание нагрузки по сменам, снижение зависимости от дорогих «пожарных» решений — тех же внеплановых рейсов, которые вылетают в копейку, или сверхурочных, которые выжигают команду. На практике я всегда отталкиваюсь от трёх утилитарных целей, для которых и затевается всё прогнозирование. Первое — планирование мощности хаба и последней мили, чтобы понимать, сколько линий сортировки мы должны запустить и какой пул курьеров вывести на смену. Второе — управление пиками по дням недели, часам и географии: утренний залп заявок из делового центра по поведению абсолютно не похож на вечерний B2C-всплеск. И третье — снижение потерь от недогрузки или, что критичнее, от перегруза сети, когда она встаёт в пробку из отправлений.

Что именно прогнозируют в экспресс-логистике

Когда говорят «прогноз спроса», часто подразумевают одну циферку — сколько заказов будет завтра. Но для того чтобы сеть работала, одной циферки катастрофически мало. Мы прогнозируем несколько срезов реальности одновременно. Это и количество заявок по часам и дням — здесь важна динамика внутри суток, а не просто итог. Это и объём по зонам доставки и районам, потому что в один район может утром уйти вдвое больше отправлений, чем в другой. Отдельный слой — спрос по типам отправлений: документы versus короба, это совершенно разные требования к курьерам и сортировке. Нагрузка на конкретные окна приёма даёт понимание, в какой момент на въезде в хаб образуется очередь из курьеров-сдатчиков. Количество повторных попыток доставки напрямую влияет на завтрашнюю загрузку. И главное — потребность в курьерах, линиях сортировки и магистральных отправках: сколько машин какого тоннажа уйдёт по направлениям.

Чем точнее сегментация, тем полезнее прогноз

Один усреднённый прогноз на весь город — это почти всегда гарантированный провал планирования. Экспресс-доставка тем и сложна, что спрос в ней распределён крайне неравномерно. Деловой центр даёт плотный утренний пик: все хотят успеть отправить документы до начала совещаний. Складские зоны и фулфилмент-операторы, наоборот, просыпаются ближе к обеду и создают вторую волну. А B2C-заявки с доставкой на дом начинают активно поступать ближе к 16:00 и уходят в вечерний интервал. Если этого не сегментировать, вы получите «среднюю температуру по больнице» и будете весь день выравнивать перекосы вручную. Набор отдельных прогнозов по зонам и временным слотам всегда даёт более рабочий план, потому что он учитывает, что курьер на деловой квартал и курьер на спальный район — это две разные логистические задачи.

Какие данные нужны для прогноза спроса

Одной истории заказов недостаточно. Модель должна видеть контекст выполнения, а не просто факт создания заявки. Если у вас нет данных о фактическом времени забора и доставки, вы никогда не узнаете, что вчера SLA был формально соблюдён только благодаря сверхурочным. Без понимания отмен, переносов и недоставок вы будете закладывать в прогноз иллюзорный спрос, который на самом деле не реализовался. А без информации о загрузке хаба и курьерских смен вы не сможете сопоставить, сколько вы «прогнозировали» и сколько в итоге «смогли переварить».

Базовый набор данных

Что обязательно должно быть в витрине данных для рабочей модели: история заказов с датой и временем создания; фактическое время забора и доставки — это критично для оценки реальных окон пиковой нагрузки; зона отправления и зона назначения — без этого сегментация не работает; тип клиента и тип услуги — чтобы отличать планового B2B от внезапного B2C; отмены, переносы, недоставки — они объяснят, почему в прошлый вторник в 15:00 у вас был провал; загрузка хаба и курьерских смен в моменте — чтобы понять лимиты; календарные факторы: день недели, праздники, предпраздничные дни — в срочной логистике это главный модулятор спроса; внешние факторы, если они влияют на спрос: погода, акции крупных отправителей, изменения тарифов, расписание магистралей (понимание, что в 17:00 уходит последний рейс на регион, часто вызывает волну заявок).

Что часто портит качество данных

Самые неприятные сюрпризы при сборке модели обычно прячутся не в сложности алгоритмов, а в грязных данных. Разные справочники адресов и зон — когда один и тот же квартал в системе TMS называется «Центр-1», а в CRM — «зона А», модель просто не поймёт, что это одно и то же место. Дубли заявок от нервных клиентов, которые создали три отправления на один пакет документов. Пустые поля по времени события — без них восстановить реальную динамику пика невозможно. Смешение операционных и коммерческих статусов, когда, например, «доставлено» и «закрыто без оплаты» долгое время сидят в одной куче. И отсутствие единой логики по отменам и возвратам: отмену, сделанную до подачи курьера, и возврат после неудачной попытки прогноз должен обрабатывать по-разному.

Инструменты аналитики для прогнозирования спроса

Рынок часто хочет найти одну «волшебную кнопку», но реальность такова, что мы всегда работаем со связкой инструментов. Один слой отвечает за сбор и очистку данных, другой — за расчёт прогноза, третий — за визуализацию и передачу операторам. Это нормально: инструмент должен решать свою конкретную задачу.

Инструмент	Что делает	Где полезен
BI-система	Строит дашборды и регулярные отчеты	Для контроля спроса и нагрузки в реальном времени
SQL и DWH	Собирает и очищает данные	Для создания единой витрины показателей без мусора
Python/R	Строит модели прогноза	Для анализа временных рядов и многофакторных моделей
Excel/Google Sheets	Быстрые расчеты и ручная проверка	Для пилотов, оперативных сверок и проверки гипотез
WMS/TMS/CRM	Источники операционных данных	Для связки спроса и факта исполнения, без этого модель слепа
Системы маршрутизации	Показывают влияние прогноза на план рейсов	Для планирования последней мили и загрузки магистралей

Как выбрать инструмент под задачу

Если вы только начинаете системный прогноз, не стоит сразу разворачивать тяжёлый ML-пайплайн. Чаще всего на старте хватает BI-панели, куда подтягиваются выгрузки из WMS/TMS, и простой модели в Python на уровне скользящих средних с календарными поправками. Это даст быструю проверку гипотез и понятный операторам результат. Когда потоков становится много, сеть распределена по нескольким хабам, а факторов, влияющих на спрос, больше десятка, — вот тогда без нормальной витрины данных и автоматизированного обновления прогнозов не обойтись. Появляется потребность в real-time или near real-time обновлении, потому что экспресс-доставка не ждёт еженедельного отчёта.

Методы прогнозирования: от простого к устойчивому

Когда я слышу от коллег, что им нужно «сразу внедрить ИИ для прогноза», обычно предлагаю начать с базы, которую можно объяснить сменному диспетчеру. В экспресс-доставке доверие к прогнозу операционной команды — это половина успеха. Если люди не понимают, почему модель выдала ту или иную цифру, они будут её игнорировать. Поэтому внедрение почти всегда идёт поэтапно.

1. Простой исторический средний

Берём усреднённое количество заявок за аналогичный день прошлой недели или месяца. Это самый быстрый ориентир, когда данных мало или нужно за сутки сделать хоть какую-то прикидку для планирования смен. Минус очевиден: модель совершенно не чувствует пики, праздники и резкие изменения поведения клиентов. Завтра пятница, а в прошлую пятницу был перенос выходного — и средний даёт осечку.

2. Скользящее среднее

Полезный метод, когда спрос относительно стабилен и нет резких трендов. Он сглаживает случайные всплески. Но его фатальная проблема — запаздывание при смене тренда. Если у вас пошёл органический рост потока на 20%, скользящее среднее будет систематически плестись позади на несколько шагов, и вы постоянно будете занижать потребность в ресурсах.

3. Модели временных рядов

Переход к более осознанному прогнозированию, когда вы начинаете учитывать сезонность, недельные циклы, тренд и праздничные эффекты. Это рабочий уровень для регулярных объёмов, особенно если у бизнеса накоплена чистая история за год-полтора. Модель уже понимает, что декабрь отличается от июля, а понедельник — от пятницы.

4. Регрессионные модели и ML

К этому этапу мы переходим, когда на спрос начинает влиять множество внешних факторов, которые ручными правилами уже не описываются. Акции крупных отправителей, погода (внезапный снегопад мгновенно увеличивает спрос на курьерскую доставку в B2C), тарифные изменения, география, календарь с плавающими праздниками — всё это начинает играть. Плюс ML в том, что он позволяет учесть больше переменных и их нелинейные взаимодействия. Минус — жёсткие требования к качеству данных и постоянный контроль переобучения, когда модель «запоминает» прошлогодний всплеск и ждёт его каждый раз.

5. Иерархический прогноз

Самый ценный инструмент для сети экспресс-доставки. Когда нужно согласовать прогноз по компании в целом, по региону, по конкретному хабу и по отдельной зоне доставки внутри города, обычные модели начинают давать рассинхрон. Сумма прогнозов по зонам не сходится с общим прогнозом по хабу, и начинается подгонка. Иерархический подход решает это математически, а не костылями в Excel. Это особенно важно, потому что ошибка на одном уровне — например, занижение нагрузки на конкретный хаб — быстро ломает план магистральных рейсов и смен на последней миле для всего направления.

Какие метрики точности планирования использовать

Без метрик прогноз остаётся чьим-то частным мнением, а не инструментом управления. Но в логистике мы оцениваем не только точность попадания как таковую, а то, насколько ошибка опасна для операционного процесса. Можно иметь среднюю точность 95%, но если 5% ошибки приходятся на утренний пик понедельника, это парализует хаб.

Основные метрики

Метрика	Что показывает	Когда применять
MAE	Среднюю абсолютную ошибку в штуках отправлений	Для понятной оператору оценки в натуральных единицах
MAPE	Ошибку в процентах	Для сравнения разных направлений и периодов, но осторожно на малых объёмах
RMSE	Сильнее штрафует крупные промахи	Когда важнее не прозевать экстремальные пики и провалы
WAPE	Ошибку с учетом объема, взвешенная по потоку	Для логистики и объёмных портфелей — лучшая метрика по умолчанию
Bias	Систематическое завышение или занижение прогноза	Для проверки, не врёт ли модель в одну сторону из месяца в месяц
Service level miss	Насколько прогноз подвёл операцию и ударил по SLA	Для прямой оценки бизнес-влияния прогноза на доставку

Kakie metriki osobenno vazhny dlya ekspress-dostavki

Для нас, в срочной логистике, «красивая средняя точность» за месяц — это часто фикция. Прогноз, который идеально отработал тихую среду и провалился в понедельник утром, в реальной работе бесполезен, потому что он подвёл в самый важный момент. Поэтому мы обязательно смотрим отдельно точность по часам — именно в пиковые окна; точность по пиковым дням — понедельник, пятница, дни после праздников; точность по ключевым зонам — деловой центр, спальные районы, складские кластеры; отклонение на уровне конкретного хаба и смены — чтобы начальник смены видел не среднюю температуру, а свою реальность; и долю ситуаций, когда ошибка прогноза напрямую привела к нарушению SLA. Это главный KPI: сколько раз мы не успели за 59 минут из-за того, что прогноз подвёл.

Как оценивать прогноз в реальной операционной среде

Чисто математическая оценка модели — это только полдела. Я не раз видел, как модель с отличными метриками на бумаге в жизни не работала, потому что была оторвана от процесса.

Сравнивайте не только модель, но и процесс

Смотреть нужно не только на MAPE, но и на то, как прогноз встроен в операционный цикл. Успели ли мы на его основе скорректировать смены до часа X? Хватило ли людей на сортировочных линиях и курьеров на подаче, или диспетчеры опять в пожарном режиме нарезали зоны? Уменьшилось ли число срочных ручных вмешательств, когда начальник хаба в 10 утра обзванивает «резервистов»? Снизились ли переработки у постоянной команды, которая без нормального прогноза вынуждена закрывать дыры сверхурочно? И самое важное — как изменилась доля доставок в срок. Если эти показатели стоят на месте или падают, модель не помогает, какие бы цифры она ни рисовала.

Делайте backtesting

Backtesting — это когда мы берём модель и прогоняем её на прошлых периодах, притворяясь, что живём в них заранее и не знаем будущего. В экспресс-доставке это критически важно, потому что календарные пики и сезонные всплески повторяются каждый год с нюансами: прошлый декабрь мог быть аномально снежным, а этот — сухим, и модель должна перестроиться. Без backtesting вы рискуете утвердить модель, которая «помнит» только один сценарий прошлого и ошибается на новом.

Практическая схема внедрения прогноза

Шаг за шагом, без перескоков. Если попытаться сразу уйти в сложный ML без очистки зон и статусов, вы получите красивый прототип, который не сможет использоваться в работе.

Соберите исторические данные минимум за 6–12 месяцев. Год — оптимально, чтобы захватить сезонность и праздники.
Очистите справочники зон, статусов и времени событий. Это самая трудоёмкая, но критическая часть: если адресная база и статусная модель — каша, на выходе будет каша.
Разбейте спрос по часам, дням и ключевым сегментам: зоны, типы клиентов, окна подачи.
Постройте базовый прогноз и сравните его с реальным спросом за тестовый период, не трогая «боевые» планы.
Введите метрики MAE, MAPE, WAPE и bias. Смотрите на них в разрезе разных срезов, а не только в целом.
Проверьте прогноз на пиках и в праздники. Если там провал — модель нельзя применять, даже если в среднем она хороша.
Свяжите результат с планом смен, маршрутами и мощностью хаба. Модель должна выдавать не просто число, а конкретные рекомендации для старшего смены.
Настройте регулярный пересмотр модели не реже одного раза в месяц. Рынок экспресс-доставки меняется быстро, и модель, обученная на позапрошлом квартале, начинает тупить на новом поведении клиентов.

Типичные ошибки при прогнозировании спроса

Большинство этих граблей я проходил лично или наблюдал у коллег по рынку. Первое и самое частое — прогнозирование только по общему объёму без сегментации. Это даёт иллюзию контроля, но не даёт никакой реальной помощи в планировании. Второе — использование «грязной» истории без очистки: если в данные попали дубли из-за сбоя CRM или неучтённые возвраты, прогноз будет систематически врать. Третье — игнорирование праздников и нестандартных дней: предпраздничный день и обычный вторник — это два совершенно разных спроса. Четвёртое — отсутствие проверки на пиковых нагрузках: многие команды смотрят только на точность в среднем и упускают, что модель занижает утренний пик на 30%. Пятое — ориентация только на одну метрику: MAPE в отрыве от WAPE и bias часто уводит в ложное ощущение точности. Шестое — слабая связь аналитики с операционным планированием, когда прогноз существует в одних таблицах, а смены рисуются в других, и они никак не пересекаются. И последнее — ручные корректировки без фиксации правил: если начальник смены каждый раз вручную докидывает 15% «на всякий случай» и не записывает почему, ваша модель никогда не обучится на этих поправках.

Как сделать прогноз полезным для руководителя логистики

Руководителю логистики не нужен 50-страничный отчёт с графиками всех временных рядов. Ему нужно за чашкой кофе утром увидеть картину на день и понять, где ждать проблем. Хороший прогноз отвечает не на вопрос «что будет в среднем», а на вопрос «что мне делать сегодня утром, чтобы SLA не просел».

Поэтому мы всегда формируем короткую управленческую картину: ожидаемый объём по часам — чтобы видеть волны нагрузки; зоны риска по перегрузке — конкретные районы города или окна подачи, где будет жарко; список смен, которым нужен резерв — чтобы понимать, где прямо сейчас недостаточно людей или машин; прогноз отклонения от SLA — оценка риска, основанная на рассогласовании прогноза и доступных мощностей; рекомендации по дополнительным курьерам или усилению хаба — конкретные цифры: сколько человек, на какое время, в какую зону.

Минимальный набор дашборда

На одном экране у руководителя должны быть сведены: фактический спрос versus прогноз в реальном времени, чтобы сразу видеть отклонения; загрузка по часам с подсветкой критических зон; отклонение по зонам в карте или диаграмме; error rate по ключевым сегментам, чтобы понимать, где модель может тупить систематически; и прогноз на ближайшие 24–72 часа для принятия решений наперёд. Без такого дашборда прогноз будет жить своей жизнью, а операция — своей.

FAQ

### Как часто нужно обновлять прогноз спроса?
Для экспресс-доставки оптимальный горизонт обновления — раз в сутки как база, но для критичных потоков, особенно когда пошли незапланированные всплески заказов или изменилась магистральная схема, обновление должно происходить несколько раз в день. Если вы заметили, что к 11 утра поток уже на 20% выше прогноза, ждать вечернего пересчёта — значит гарантированно провалить SLA во второй половине дня.

### Какая метрика лучше: MAPE или WAPE?
Для логистики и особенно для объёмных портфелей отправлений удобнее WAPE. Она взвешена по объёму и менее чувствительна к искажениям на сверхмалых сегментах, где MAPE может улетать в неадекватные проценты только потому, что там десять заказов в день, а вы ошиблись на три штуки.

### Можно ли строить прогноз без машинного обучения?
Да, и часто это самый правильный путь на старте. Временные ряды, скользящие средние с календарными поправками и простая сегментация дают понятную и объяснимую базу. ML начинает быть нужен тогда, когда факторов становится много, они взаимодействуют друг с другом нелинейно, и ручные правила уже не могут за всем уследить.

### Что важнее — точность модели или качество данных?
Качество данных. Это железобетонное правило. Даже самая сильная ML-модель не компенсирует грязные статусы, дубли заявок и несогласованные справочники зон. Сначала наведите порядок в данных, потом стройте прогноз. Иначе вы будете принимать решения на основе искажённой картины мира.

### Как понять, что прогноз действительно помогает?
Самый надёжный индикатор — это то, как меняется операционная реальность. Если после внедрения прогноза у вас снижается количество ручных срочных корректировок (меньше обзвонов «срочно найти трёх курьеров»), уменьшается перегрузка хаба в пиковые часы и растёт доля доставок в срок, значит прогноз реально работает в операционном контуре, а не только в отчётах аналитиков.

### С чего начать, если данных мало?
Не ждите идеального года истории. Начните с того, что есть: базовая сегментация по дням недели, часам и зонам доставки — это уже даст первую, пусть грубую, но рабочую структуру. Затем добавьте календарные факторы — праздники, предпраздничные дни, переносы выходных. И обязательно проверьте свой прогноз backtesting на нескольких прошлых периодах, чтобы не строить иллюзий относительно его точности до того, как он попадёт в работу.