На складе с оборотом 3000+ строк комплектации в день переход с ТСД на pick-by-light или pick-by-voice даёт измеримый прирост 30–60% к скорости комплектацииgost-58447-pbl. Но технологии принципиально разные по механике работы: light лучше для мелкоштучного picking в узких зонах с плотными стеллажами, voice — для крупных ячеек, паллетного picking и работы со свободными руками. Ошибка выбора стоит 1,5–4 миллиона рублей инвестиций, которые не окупятся в разумные сроки. Эта статья помогает сделать обоснованный выбор между двумя технологиями.

Что такое pick-by-light: свет указывает ячейку

Pick-by-light — система светодиодных дисплеев, установленных на каждой ячейке стеллажа. При поступлении задания на комплектацию дисплей нужной ячейки загорается и показывает количество единиц, которое нужно взять. Комплектовщик подходит, берёт товар, нажимает кнопку подтверждения — дисплей гаснет, загорается следующий.

Архитектура системы: контроллер зоны (1 контроллер обслуживает 60–120 ячеек) → световые модули, смонтированные на краю каждой ячейки → проводная шина или беспроводная связь с WMS через Wi-Fi. Каждый модуль состоит из: цифрового дисплея (2–4 разряда — показывает количество единиц для извлечения), кнопки подтверждения (оператор нажимает после того, как взял товар), опционально — кнопки «+1 / –1» для корректировки количества, если в ячейке меньше товара, чем требуется. Стоимость одного модуля: 2000–5000 рублей в зависимости от функциональности (базовый с дисплеем и кнопкой — от 2000, расширенный с цветной индикацией и корректировкой — до 5000).

Где light работает лучше всего: мелкоштучный picking из полочных стеллажей (фарма, электронные компоненты, косметика, запчасти), зоны с высокой плотностью ячеек (800–2000 ячеек на зону), партионный picking — когда один обход обслуживает 10–20 заказов одновременно. Особенно эффективен light в зонах с визуально похожими товарами (например, лекарства в одинаковых блистерах, электронные компоненты в одинаковых пакетиках) — свет однозначно указывает нужную ячейку, тогда как при voice-picking оператор может ослышаться и подойти к соседней ячейке с похожим адресом.

Ограничение: при крупногабаритном товаре (паллетное хранение, крупные короба) light менее полезен — комплектовщик и так видит, откуда брать, а дисплей на паллетном стеллаже на высоте 6 метров не разглядеть. Второе ограничение: при частом изменении планировки (перестановка ячеек, смена ассортимента) — переустановка модулей стоит денег и времени. Каждый модуль крепится к конкретной ячейке, и при перемещении товара модуль нужно перенастраивать (привязать к новому адресу в WMS). На складе с ротацией ассортимента более 20% в квартал это создаёт постоянную нагрузку на IT-отдел.

Техническая особенность: модули light питаются либо от общей шины (проводная система — надёжнее, но сложнее монтаж), либо от батареек (беспроводная — проще установка, но замена батареек каждые 12–18 месяцев на 1000 модулей — это 80–120 человеко-часов работы). При выборе системы уточняйте тип питания и стоимость обслуживания.

Что такое pick-by-voice: голос ведёт комплектовщика

Pick-by-voice — система голосовых команд: комплектовщик надевает наушник с микрофоном, WMS диктует адрес ячейки и количество, комплектовщик подтверждает голосом (обычно — повторяет контрольные цифры ячейки). Руки и глаза свободны — не нужно смотреть на экран ТСД или на световой дисплей.

Архитектура: голосовой терминал (носимое устройство на поясе или жилете) → гарнитура (наушник + микрофон) → Wi-Fi-связь с WMS → голосовой движок (распознавание и синтез речи). Каждый терминал «обучается» голосу оператора за 15–30 минут — система адаптируется к произношению и тембру.

Где voice работает лучше всего: паллетный и коробочный picking из фронтальных стеллажей (оператор управляет погрузчиком или рохлёй — обе руки заняты), склады с большими расстояниями между ячейками (5000+ м² — параллельность голосовых команд и перемещения даёт максимальный выигрыш), холодные и морозильные склады (перчатки не мешают работе, в отличие от ТСД с экраном и кнопок light), зоны с тяжёлым товаром (обе руки нужны для перемещения короба весом 10–25 кг), склады с мультиязычным персоналом — современные voice-системы поддерживают 15–20 языков и переключаются между профилями операторов за 5 секунд.

Ограничение: шумная среда (конвейеры, погрузчики) снижает точность распознавания. При уровне шума выше 85 дБ — нужны гарнитуры с активным шумоподавлением (на 40–60% дороже стандартных). Второе ограничение: при мелкоштучном picking с ассортиментом 5000+ SKU голосовые команды длинные — комплектовщик устаёт слушать и подтверждать. Третье ограничение — акцент и дикция: система калибруется под конкретного оператора, но при сильном акценте или нечёткой речи точность распознавания падает до 95–97%, что неприемлемо.

Техническая особенность: голосовые терминалы последнего поколения работают на базе локального распознавания (без облака) — задержка между командой и ответом составляет 0,3–0,5 секунды. Более старые системы с облачным распознаванием дают задержку 1–2 секунды, что раздражает оператора и снижает скорость. При выборе системы проверяйте: распознавание локальное или облачное, поддерживается ли русский язык нативно (а не через перевод), есть ли офлайн-режим при потере Wi-Fi.

Скорость: цифры от 200 до 320 строк в час

Pick-by-light — 200–280 строк/час. Скорость определяется расстоянием между ячейками (в мелкоштучных зонах — 0,5–1,5 метра) и временем извлечения. Узкое место: нажатие кнопки подтверждения добавляет 1–2 секунды на строку.

Pick-by-voice — 260–320 строк/часela-2024. Скорость выше за счёт параллельности: комплектовщик слышит следующий адрес, пока ещё движется к текущему. Руки свободны — не нужно перекладывать товар, чтобы нажать кнопку. Узкое место: время голосового подтверждения (2–3 секунды).

Важная оговорка: 260–320 строк/час для voice достигается на складах с крупными ячейками и маршрутом без возвратов. На мелкоштучном складе с плотными стеллажами voice даёт 180–240 строк/час (голосовые команды длиннее, подтверждение чаще), а light — 220–280. В этом сегменте light быстрее.

Почему voice быстрее на крупных ячейках: при паллетном picking оператор тратит основное время на перемещение между ячейками (расстояние 5–15 метров, время 10–30 секунд). Пока он идёт — голосовой терминал уже диктует следующий адрес. При подходе к ячейке оператор уже знает, куда идти. С ТСД или light такой параллельности нет: оператор должен остановиться, посмотреть на экран или дисплей, потом двигаться. Выигрыш voice — 3–5 секунд на строку, что при 300 строках в день даёт 15–25 минут экономии.

Сравнение с ТСД: оба метода дают прирост 30–60% относительно ТСД-picking (150–200 строк/час). Разница между light и voice — 10–20%, и она сильно зависит от конкретных условий склада: планировки, типа товара, квалификации персонала, уровня шума.

При выборе между технологиями полезно провести пилот: оборудовать одну зону (50–100 ячеек для light или 3–5 операторов для voice) и замерить производительность и точность в реальных условиях вашего склада в течение 2–4 недель. Стоимость пилота: 200–400 тысяч для light (50 модулей + контроллер + интеграция), 200–300 тысяч для voice (3 терминала + гарнитуры + ПО). Пилот даёт достоверные цифры для вашего конкретного склада, а не средние по отрасли. Если пилот показал прирост менее 15% — технология не оправдана, ищите узкое место в других процессах (размещение, маршрутизация, планировка).

Точность: 99,7% против 99,9%

Pick-by-light — точность 99,8–99,9% при мелкоштучной работеdybskaya-tech. Свет однозначно указывает ячейку — перепутать сложнее, чем при голосовом адресе. Кнопка подтверждения фиксирует факт извлечения. Ошибки: комплектовщик берёт неправильное количество (но из правильной ячейки) — 80% всех ошибок light.

Pick-by-voice — точность 99,5–99,7%. Голосовое подтверждение (оператор повторяет контрольные цифры ячейки) — эффективный метод контроля, но ошибки произношения и распознавания добавляют 0,1–0,3% к уровню ошибок. Ошибки: неправильная ячейка (оператор ослышался или система неверно распознала) — 60% ошибок voice.

Разница в 0,2% кажется незначительной, но при 5000 строк в день это 10 ошибок (voice) против 5 (light). Для фармы и точных производств — критично. Для дистрибуции бытовых товаров — в пределах допуска.

Способы повышения точности. Для light: установка дополнительной кнопки «количество» (оператор подтверждает не только ячейку, но и количество — точность растёт до 99,95%), весовая верификация на выходе из зоны (собранный заказ взвешивается, расхождение — сигнал). Для voice: двойное подтверждение адреса (оператор повторяет последние 3 цифры ячейки — система сверяет), контрольные вопросы для ценных SKU («подтвердите цвет упаковки»). Каждый дополнительный контроль добавляет 1–3 секунды на строку, но для критичных категорий это оправдано.

Стоимость внедрения: от 0,8 до 5 миллионов рублей

Pick-by-light на 500 ячеек (типичная мелкоштучная зона):

  • Световые модули: 500 × 3500 рублей = 1 750 000
  • Контроллеры: 5 × 80 000 = 400 000
  • Монтаж и кабель: 350 000–500 000
  • Интеграция с WMS: 150 000–300 000
  • Итого: 2,65–2,95 миллиона рублей

Pick-by-voice на 15 операторов (типичная средняя зона):

  • Голосовые терминалы: 15 × 45 000 = 675 000
  • Гарнитуры: 15 × 12 000 = 180 000 (+ запас 30%)
  • ПО (лицензии): 200 000–400 000
  • Интеграция с WMS: 100 000–200 000
  • Итого: 1,16–1,46 миллиона рублей

Voice дешевле в 2–2,5 раза при сопоставимом масштабе. Но light масштабируется линейно (каждая новая ячейка = +3500 рублей), а voice — ступенчато (каждый новый оператор = +57 000 рублей, но лицензия на ПО покупается один раз). Есть и третий фактор: стоимость обслуживания. Light-модули практически не требуют обслуживания (замена вышедших из строя — 1–2% в год), но при поломке контроллера зоны простаивают 60–120 ячеек (пока контроллер не заменят или отремонтируют). Voice-терминалы требуют замены аккумуляторов каждые 12–18 месяцев (2000–4000 рублей за аккумулятор), замены гарнитур каждые 12–24 месяца (12 000 рублей за комплект), но поломка одного терминала — простой одного оператора, а не целой зоны.

При расширении зоны с 500 до 1000 ячеек: light вырастет до 5,3 миллиона, voice (если операторов достаточно) — останется на уровне 1,5 миллиона. Для больших складов voice выгоднее.

Подробнее о расчёте окупаемости складских технологий — WMS-система: окупаемость и выбор.

Обучение персонала: 30 минут против 2 дней

Pick-by-light: обучение нового комплектовщика — 2–4 часа. Принцип интуитивен: горит — подойди, возьми, нажми. Через 1 день оператор выходит на 80% целевой производительности, через неделю — на 100%. Текучесть персонала не критична: новый сотрудник обучается за полсмены.

Pick-by-voice: обучение — 1–2 дня. Первый этап: калибровка голоса (30 минут — оператор диктует набор слов, система адаптируется). Второй этап: тренировочные задания (4–8 часов — оператор ходит по складу с голосовыми командами). Третий этап: работа под наблюдением (1 смена). Через 3–5 дней оператор выходит на 80% производительности, через 2 недели — на 100%.

При высокой текучести (более 30% в год) light выгоднее: меньше времени и денег на обучение каждого нового сотрудника. При стабильном коллективе — разница несущественна.

Отдельный фактор: языковой барьер. На складах с многоязычным персоналом (мигранты) voice-система должна поддерживать несколько языков — это либо дополнительная лицензия, либо ограничение. Light языконезависим — свет понятен всем.

Сравнение затрат на обучение при текучести 40% в год (типично для складов в крупных городах):

ПоказательPick-by-lightPick-by-voice
Время обучения 1 новичка3–4 часа12–16 часов
Выход на 80% производительности1 день3–5 дней
Стоимость обучения (ФОТ наставника)500–800 ₽2000–3200 ₽
Количество новичков/год (20 чел. × 40%)88
Годовые затраты на обучение4000–6400 ₽16 000–25 600 ₽
Потери производительности на обучении24–32 чел.-ч96–128 чел.-ч

При стоимости человеко-часа 400 рублей потери производительности на обучении: light — 9600–12 800 рублей/год, voice — 38 400–51 200 рублей/год. Разница — 28 800–38 400 рублей. Не критично для крупного склада, но ощутимо для среднего.

Учитывайте и психологический фактор. Voice-picking вызывает сопротивление у возрастных сотрудников (55+): непривычно разговаривать с машиной, дискомфорт от наушника на протяжении всей смены. На складах, где средний возраст комплектовщиков выше 45 лет, адаптация к voice занимает в 1,5–2 раза дольше. Light такого барьера не создаёт — световой сигнал интуитивен для любого возраста. При планировании внедрения проведите анкетирование персонала: если более 40% команды выражают опасения по поводу голосовой технологии, заложите дополнительные 2 недели на адаптацию и мотивационную программу.

Сводная таблица: 8 параметров

ПараметрPick-by-lightPick-by-voice
Скорость (мелкоштучный)220–280 строк/ч180–240 строк/ч
Скорость (паллетный/коробочный)120–160 строк/ч260–320 строк/ч
Точность99,8–99,9%99,5–99,7%
Стоимость (500 ячеек / 15 оп.)2,7–3,0 млн ₽1,2–1,5 млн ₽
Обучение2–4 часа1–2 дня
Руки свободныНет (кнопка)Да
Работа в холоде (–18°C)Ограниченно*Да
МасштабированиеДорогое (на ячейку)Дешёвое (на оператора)

*Световые модули работают до –20°C, но кнопки неудобны в толстых перчатках. Существуют модели с сенсорным подтверждением (ИК-датчик, реагирующий на движение руки перед ячейкой), но они на 40% дороже стандартных и менее надёжны — ложные срабатывания при случайном движении мимо ячейки.

Кейс: фармсклад — выбор между light и voice

Фармацевтический дистрибьютор, склад 4800 м², 12 000 SKU, 6500 строк в день. Зона мелкоштучного picking — 1800 ячеек (полочные стеллажи), зона паллетного picking — 2200 паллетомест. 18 комплектовщиков. До изменений: ТСД, средняя производительность — 165 строк/час, точность — 99,1%.

Задача: повысить скорость до 220+ строк/час и точность до 99,5%+ (требование для фармы).

Анализ показал: 70% строк (4550 в день) — мелкоштучные из полочных стеллажей (лекарства в блистерах, флаконы, тюбики — визуально похожие товары, где точность идентификации критична), 30% (1950) — коробочные и паллетные из фронтальных стеллажей (крупные упаковки, ящики). Решение: комбинированный подход — каждая технология применяется там, где даёт максимальный эффект. Мелкоштучная зона — pick-by-light (1800 ячеек, 12 комплектовщиков): свет однозначно указывает нужную ячейку среди сотен одинаково выглядящих. Паллетная зона — pick-by-voice (6 комплектовщиков): руки свободны для перемещения тяжёлых коробов, параллельность команд и движения даёт максимальную скорость.

Инвестиции. Light: 1800 модулей × 3200 рублей + 15 контроллеров + монтаж + интеграция = 7,8 миллиона. Voice: 8 терминалов (6 + 2 запасных) × 48 000 + гарнитуры + ПО + интеграция = 680 тысяч. Итого: 8,48 миллиона.

Результат через 3 месяца: мелкоштучная зона — 245 строк/час (рост 48%), точность 99,85%. Паллетная зона — 290 строк/час (рост 76%), точность 99,6%. Общая точность склада — 99,77% (целевая 99,5% — достигнута). Сокращение штата комплектовщиков с 18 до 14 (4 ставки × 60 тысяч = 240 тысяч в месяц экономии). Окупаемость: 8,48 / 0,24 = 35 месяцев по ФОТ. Но с учётом снижения ошибок (каждая ошибка фармсклада стоит 5–15 тысяч в штрафах и рекламациях, при 99,1% было 58 ошибок/день, стало 15) — дополнительная экономия 200+ тысяч в месяц. Итоговая окупаемость — 19 месяцев.

Подробнее о складской технике и подборе оборудования — складская техника: виды и подбор.

Дополнительный эффект, который заметили через 6 месяцев: текучесть персонала в зоне комплектации снизилась на 22%. Комплектовщики, работающие с voice и light, оценивали условия труда выше, чем операторы ТСД: меньше физической нагрузки на глаза (не нужно постоянно смотреть на экран), свободные руки, ощущение более высокой квалификации.

Ключевой вывод из кейса: комбинирование технологий (light + voice) на одном складе — не экзотика, а стандартная практика для складов с разнородным ассортиментом. Каждая технология применяется там, где она эффективнее. Единственное требование — интеграция обоих решений с одной WMS, чтобы задания распределялись автоматически и отчётность была единой. При выборе WMS уточняйте: поддерживает ли система одновременную работу с pick-by-light и pick-by-voice, есть ли готовые коннекторы к оборудованию, сколько стоит интеграция.

Если бюджет ограничен и нужно выбрать одну технологию: для мелкоштучного склада (фарма, электроника, косметика, автозапчасти) — light. Для паллетного и коробочного склада (FMCG, напитки, стройматериалы, бытовая техника) — voice. Для холодного склада (заморозка, охлаждённая продукция) — только voice. Для склада с текучестью персонала выше 40% — light (быстрее обучение).

FAQ

Можно ли использовать light и voice одновременно на одном складе? Да, и это оптимальная стратегия для склада с разнородным ассортиментом. Light устанавливается на мелкоштучные зоны (полочные стеллажи с ячейками менее 0,5 м³), voice используется на паллетных и коробочных зонах (фронтальные стеллажи, крупные ячейки). WMS распределяет задания между технологиями автоматически: если заказ содержит позиции из обеих зон — он разбивается на две подзадачи, каждая обрабатывается соответствующей технологией, результаты собираются в зоне консолидации. Единственное требование: интеграция обоих модулей с одной WMS — иначе задвоение данных и рассинхронизация остатков. При выборе WMS уточняйте наличие готовых коннекторов к конкретным производителям оборудования light и voice.

Что выбрать для холодного склада (–18°C и ниже)? Однозначно voice. При –18°C комплектовщик работает в толстых термоперчатках — нажимать мелкие кнопки light-модулей физически невозможно без снятия перчатки, а снятие перчатки при –18°C — это обморожение за 10–15 минут. Голосовое управление не зависит от температуры: гарнитура надевается под капюшон или балаклаву, микрофон работает при температурах до –30°C, голос распознаётся нормально (дыхание конденсируется, но микрофон с защитным фильтром справляется). Дополнительное преимущество voice на холодном складе: регламент ограничивает время непрерывного пребывания при –18°C до 1–2 часов. Пока комплектовщик отогревается (15–20 минут), его голосовой терминал заряжается в тёплой зоне. Существуют морозостойкие light-модули (до –25°C), но кнопки всё равно остаются проблемой — альтернативные сенсорные модули ненадёжны при конденсате и инее.

Какой срок службы оборудования? Light-модули: 7–10 лет при нормальной эксплуатации (LED-дисплеи практически не деградируют, механические кнопки рассчитаны на 1–3 миллиона нажатий). Контроллеры зон: 5–8 лет. Голосовые терминалы: 4–6 лет (аккумулятор теряет ёмкость после 500–800 циклов зарядки, механический износ корпуса и разъёмов). Гарнитуры: 1–2 года (это расходный материал — амбушюры изнашиваются, микрофонный провод перетирается, подушки наушников теряют форму). При расчёте TCO (полной стоимости владения) на 5 лет light и voice выходят примерно на одинаковый уровень: light дороже на старте (оборудование ячеек), но почти не требует обслуживания; voice дешевле на старте, но расходники (гарнитуры, аккумуляторы) ежегодно съедают 15–25% от первоначальных инвестиций.

Нужен ли ТСД при наличии light или voice? Для зоны с light — ТСД в процессе picking не нужен (подтверждение выполняется кнопкой на модуле ячейки). Для voice — ТСД также не нужен (подтверждение выполняется голосом). Но на складе всегда есть операции за пределами picking, для которых ТСД остаётся основным инструментом: приёмка товара (сканирование штрихкодов при поступлении), размещение на хранение (сканирование ячейки и паллеты), инвентаризация (сканирование и ввод количества), отгрузка (контрольная сверка). Полный отказ от ТСД невозможен — light и voice заменяют ТСД только на этапе picking, все остальные процессы продолжают работать через терминалы. Поэтому при внедрении light или voice не продавайте существующие ТСД — они нужны для остальных операций.

Как выбрать, если бюджет ограничен? При бюджете до 1,5 миллиона — voice (покрывает 15–20 операторов с запасом на гарнитуры). При бюджете 3+ миллиона и мелкоштучном ассортименте — light на 500–800 ячеек. При бюджете менее 500 тысяч — лучше инвестировать в качественные ТСД и оптимизацию маршрутов в WMS, а light/voice отложить до роста объёмов. Промежуточный вариант: начать с voice на 5–8 операторов (600–800 тысяч) и оценить эффект за 3 месяца. Если ROI положительный — масштабировать. Если нет — проблема не в технологии picking, а в других процессах (размещение, маршрутизация, планировка), и их нужно оптимизировать сначала.

Какой минимальный объём заказов оправдывает внедрение? Light — от 2000 строк в день на оборудованную зону (иначе модули простаивают и окупаемость уходит за 4+ года). Voice — от 1500 строк в день на команду операторов. При меньшем объёме эффективнее работать с ТСД и партионным picking — затраты в 5–10 раз ниже, а прирост скорости относительно бумаги сопоставим (40–60%). Подробнее о выборе метода picking — picking на складе: 5 методов и расчёт скорости.

Есть ли альтернативы light и voice? Да. Pick-by-vision (очки дополненной реальности) — оператор видит подсветку нужной ячейки через AR-очки. Технология перспективная, но пока дорогая (очки от 80 тысяч рублей за единицу) и с ограничениями по времени работы аккумулятора (3–4 часа). Pick-by-robot (коллаборативные роботы, подвозящие стеллаж к оператору) — инверсия классического picking: не оператор идёт к товару, а товар приезжает к оператору. Стоимость: от 15 миллионов за минимальную зону (50 роботов + стеллажи + ПО). Оправдано при потоке от 5000 заказов в день и ассортименте от 20 000 SKU. На горизонте 3–5 лет обе технологии станут доступнее, но сегодня light и voice остаются основным выбором для большинства российских складов.