Catalog Hub

AI нормализация номенклатуры
для ERP и закупок

Catalog Hub приводит хаотичную номенклатуру к структурированному виду до того, как она попадает в ERP или MDM. Готовый JSON для вашего мастер-справочника.

Симптомы

Один товар — несколько записей

Одна и та же бумага, запчасть или расходник хранится под 3–5 разными именами. Нельзя достоверно посчитать остатки по складам, годовое потребление или сопоставить прайсы поставщиков.

Одна позиция — три записи

ПрайсБумага А4 80г белая 500л
1С (склад А)Бумага офисная белая А4
SAP (склад Б)Office paper A4 80gsm
→ 3 независимые истории закупок

Одно свойство — четыре формата

Оператор 180 г/м²
Оператор 280 гм2
Оператор 380g
Оператор 480 gsm
→ автоматическое сравнение невозможно

Разный набор атрибутов

Карточка Аформат / плотность / белизна / листов
Карточка Бформат / плотность
→ какая из карточек полная?

Дубли не находятся текстовым поиском

Запись 1Бумага А4 80г белая 500л
Запись 2Бумага офисная А4 80 gsm
Сходство строк~38%
→ поиск дублей вручную

История потребления разрозненна

Запись 1200 пач. — 2022
Запись 2150 пач. — 2023
Запись 3180 пач. — 2023
→ одна бумага или три разных?

Прайс не совпадает со спецификацией

ТендерБумага А4 80г белая
ПрайсБумага офисная А4 белая
→ сверка вручную в Excel

Классификация и нормализация

Свободный текст → структурированный JSON

Входная строка из 1С, SAP или прайса поставщика превращается в код классификатора, заполненные свойства и список того, чего не хватает для полной карточки.

Вход
Бумага A4 80г белая 500 листов
POST /classify → Классификация
94%
1069-0001-0009-100042830
Бумага для печати
4%
1069-0001-0009-100042814
Бумага для рисования
2%
1069-0001-0009-100078496
Бумага для заметок
POST /normalize → Нормализация
Извлечено из входной строки
ФорматА4
Плотность80 г/м²
Цветбелый
Листов в пачке500 шт.
Не заполнено — требует уточнения
Белизна (%)→ 146
Класс бумаги→ A / B / C

Идентификация бренда

Бренд, MPN и модель из свободного текста

Для брендовых позиций достаточно строки из счёта или прайса. Система извлекает структурированные идентификаторы и даёт confidence по каждому полю.

Вход
Canon imageRUNNER ADVANCE C5535i МФУ цветной A3
POST /identify → Идентификация
Бренд
Canon
100%
MPN
C5535i
98%
Модель
imageRUNNER ADVANCE C5535i
96%
GTIN / EAN
не найден в строке
Собранная карточка товара
Canon
imageRUNNER ADVANCE C5535i
1071-0001-0006-100043161·Многофункциональное устройство (МФУ) лазерные
MPN: C5535iGTIN: —
96%общий confidence
Следующий шаг

Передать brand + MPN в /enrich — система найдёт технические характеристики этого товара по товарным каталогам и открытым источникам.

Обогащение

Характеристики из каталога и datasheet

По brand + MPN система находит технические характеристики в товарных каталогах и открытых источниках. К каждому значению — источник и confidence.

Вход — результат /identify
БрендCanon
MPNC5535i
ОКТРУ1071-0001-0006-100043161
Зачем это нужно

Покупатель видит не просто «МФУ Canon» — а карточку с 20+ характеристиками из datasheet производителя и товарных каталогов. Каждое значение аудитируемо.

POST /enrich → Обогащение из каталогов
Формат печатиA3
из строки
98%
ЦветностьЦветной
из строки
99%
Скорость печати35 стр/мин
datasheet
100%
Разрешение1200×1200 dpi
datasheet
99%
ТехнологияЛазерная
каталог
100%
Память (RAM)3 ГБ
datasheet
97%

Что получает ERP-команда

Чистая миграция вместо ручного хаоса

Готовность к запуску ERP на 3–6 месяцев раньше. Воспроизводимый процесс. Справочник, который не «плывёт» через полгода.

Единые шаблоны по каждой категории

Реестр свойств с обязательными / основными / опциональными / редкими атрибутами.

Автоматическая классификация SKU

Свободный текст → код категории справочника. Точность: первый вариант ≈80%, в пяти первых ≈97%.

Автоматическое заполнение свойств

Извлечение значений из существующих описаний с приведением к канону.

Поиск дублей по нормализованным свойствам

Не текстовое сравнение, а сравнение по структурированным данным.

Стабильные ID для свойств и значений

Переименование лейбла на казахский / английский не ломает downstream.

JSON-контракт на выходе

Загружается напрямую в ваш MDM или ERP.

Функция снабжения

Поверх нормализованных данных открывается аналитика, которой раньше не было

Когда данные нормализованы, становятся возможны вещи, недоступные на грязных данных в принципе.

Что видит ваш стек сейчас
Три SKU в ERP, одна категория «Трубы» в системе аналитики
ПоставщикОписание из счётаЦена за метр
Поставщик APipe DN32 PN16 galvanized 6m$110
Поставщик BТруба Ø32 давление PN16 цинк$148
Поставщик CГОСТ 3262-75 труба 32мм оцинк.$102
Catalog Hub кластеризует по свойствам товара
Один и тот же товар
DN32PN16оцинкованнаяГОСТ 3262-756m

После нормализации становится видно: это один и тот же продукт. Три поставщика конкурируют за него.

45%
разброс цен на один и тот же товар
6–12%
экономия на категории при консолидации — по данным Coupa и McKinsey

Что становится возможным

  • Сравнение одинаковых товаров через разных поставщиков
  • Консолидация поставщиков и укрупнение тендера
  • Поиск аналогов и кросс-референсов
  • Сопоставление прайсов с тендерными спецификациями автоматически
  • Аналитика остатков и потребности по нормализованной истории потребления

Границы ответственности

Чёткая граница: что делаем мы, что делаете вы

Мы не претендуем на пространство вашего MDM. Мы поставляем чистые структурированные данные на вход вашей цепочки.

Catalog Hub делает

  • Классификация SKU по справочнику
  • Извлечение свойств из свободного текста
  • Стандартизация значений и единиц измерения
  • Стабильные идентификаторы свойств и значений
  • Идентификация бренда, модели и артикула
  • Обогащение характеристик из каталогов производителей
  • Поиск дублей по нормализованным свойствам
  • Формирование структурированных данных для передачи
  • Расширение справочника новыми категориями

Ваш MDM / ERP делает

  • Утверждение и публикация мастер-справочника
  • Определение обязательных и опциональных атрибутов
  • Правила формирования уникального наименования
  • Генерация артикулов и кодов товара
  • Решение, что считать дублем (политика организации)
  • Жизненный цикл карточки (создание / изменение / архив)
  • Рабочие процессы ERP: согласование, ввод, контроль операторов

Контролируемость

Тот же вход всегда даёт тот же результат

Нестабильность — главная слабость обычных LLM-решений. Catalog Hub: одинаковый вход всегда даёт одинаковый результат.

Нестабильность обычного LLM

Бумага A4 80г белая

Запрос 1

"формат": "A4"
"плотн_гм2": "80"
"цвет_бумаги": "белая"
"листов": 500

Запрос 2

"paper_format": "A4"
"density": 80
"color": "white"
"sheet_count": "500 шт"

Разные ключи · нет ID · единицы плывут

Как мы обеспечиваем повторяемость

  • Реестр свойств с глобальными ID
    Каждое свойство и значение имеет стабильный идентификатор. Схема не меняется между запусками.
  • RAG поверх реестра
    LLM не выдумывает свойства, а выбирает значения из существующих. Если свойства нет, оно сначала добавляется в реестр через отдельный контролируемый процесс.
  • Каноническая форма значений
    Единицы измерения и форматы приводятся к стандарту. «80 г/м²» = «80гсм» = «80 grams per square meter».
  • Контроль качества
    Отдельный агент проверяет результат и помечает аномалии для повторной обработки. На выходе получается производственное качество.

Один вход даёт один и тот же JSON, каждый раз. На этом строится вся последующая автоматизация в работе с данными.

Архитектура

Catalog Hub встраивается в ваш существующий стек

Нормализует данные перед тем, как они попадают в MDM, аналитику затрат и ERP — не заменяет ни одну из этих систем.

Источники

Прайс-листы поставщиков
Тендерные спецификации
Номенклатура для ввода в ERP
Каталоги производителей

Catalog Hub

  • Классификация по справочнику
  • Нормализация свойств
  • Идентификация бренда и модели
  • Обогащение из каталогов
→ Структурированный JSON с глобальными ID

Корпоративный стек

MDM / ERP
мастер-справочник товаров
Аналитика затрат
Sievo, Coupa, GEP, Ivalua
Закупочная система
тендеры, сравнение цен
Склад / WMS
остатки, планирование

Catalog Hub не заменяет MDM, ERP или аналитику затрат — он нормализует данные перед тем, как они попадают туда.

Покрытие и расширение

25 000+ видов товаров сейчас, ваши категории добавляем за пару недель

Промышленная номенклатура часто требует расширения каталога. Это штатная ситуация, не блокер.

25 000+
видов товаров с шаблонами свойств
274 000
нормализованных свойств в реестре
13M+
товаров в международных каталогах автозапчастей и электроники
3M+
тендерных спецификаций в обучающей выборке

Расширение каталога под ваши категории

$5за один вид товара

Промышленная номенклатура часто не пересекается с госзакупками. Расширение каталога под ваши категории идёт по прозрачному тарифу за вид товара.

Видов товараСтоимостьСрок
100$5001–2 недели
1 000$5 0002–4 недели
10 000$50 0001–2 месяца

Без длительных переговоров по объёму работ и неожиданных затрат. Штучная, понятная, быстрая цена.

Цены

Простая тарификация

$50

за 1 000 API-запросов

Один вызов /classify, /normalize, /identify или /enrich = 1 запрос

Первые 500 запросов бесплатно
Получить доступ

Примеры расчёта

10 000запросов

разовая очистка небольшого каталога

$500
50 000запросов

типичный объём пилота

$2 500
200 000запросов

квартальный поток закупочной службы

$10 000

Первый шаг

Первые 500 запросов — бесплатно

Загрузите свои SKU и посмотрите результат сами. 500 запросов хватает на 125–250 позиций через полный цикл — классификация, нормализация, извлечение свойств. Если результат устраивает, просто пополните баланс по тарифу.

Что получаете на выходе

  • Отчёт о покрытии: какой процент ваших SKU попадает в существующий каталог
  • Нормализованные данные по покрытой части: готовая структура для MDM или ERP
  • Анализ пробелов: список категорий для расширения с прозрачной ценой
  • Разница реестра свойств: какие атрибуты мы предлагаем добавить в ваш стандарт
  • Технический отчёт с метриками качества и рекомендациями по интеграции

Критерии принятия

≥ 70%Coverage на ваших ключевых категориях
≥ 90%Точность классификации (пять первых вариантов)
≥ 85%Точность извлечения обязательных свойств
Гарантия

Если хотя бы один критерий не выполнен, возвращаем деньги или продлеваем пилот без доплаты до достижения порога. Решение остаётся на вашей стороне.

Контакт

Запросите пилот или демонстрацию Catalog Hub

Оставьте контакты и коротко опишите задачу. Заявка сразу уйдёт нашей команде, и специалист свяжется с вами для обсуждения пилота или демо.

Заявка уйдёт менеджерам redflags в Telegram.