Учится на реальных данных:
Заточен только под ваши продажи в торговом зале
Не ошибается в произношении сложного: числительные, месяцы и прочее;
Не зависит ни от одного оператора LLM
Не галлюцинирует
AI-киоски могут быть оснащены любым набором оборудования
Микрофон
Сенсорный дисплей
Оплата, эквайринг и иное оборудование
Камера
Имеют широкий и гибкий функционал для установки в оффлайн-магазинах дилеров
Он забирает на себя рутинны продажи, освобождая консультантов для более сложных задач
Киоск окупается за счёт роста продаж и сокращения нагрузки на персонал уже в первые 30 месяцев
Самые часто задаваемы вопросы
Деньги и эффективность
Продавцы болеют, ходят курить, увольняются и не знают 30% ассортимента. Molver работает 24/7, знает 100% номенклатуры и технологических карт. Его задача — полная замена линейного персонала и автоматизация рутины. Вы режете фот и повышаете чек за счет кросс-сейла.
Зависит от трафика, но математика простая: один киоск заменяет минимум 1.5 штатных единицы (с учетом сменности). Плюсом, исключается упущенная выгода, когда клиент ушел, не дождавшись консультанта. Обычно roi становится положительным уже на второй год.
Дешевые решения — это «обёртки» над публичными нейросетями. они тормозят (ответ по 30 секунд) и разоряют вас на токенах. Мы продаем инженерное решение: оптимизированный ансамбль нейросетей, кастомное железо и скорость ответа до 5 секунд (да, мы формируем новый промышленный стандарт).
Качество консультаций
Мы используем rag-технологию (retrieval augmented generation). Molver отвечает строго по вашей базе знаний, техкартам и инструкциям. Он не фантазирует, а ищет факты в ваших документах. Если в вашей инструкции написано «продукт x подходит к продукту y», он скажет именно это. На остальное мы устанавливаем программный запрет.
Он только этим и занимается. Алгоритм агрессивного кросс-сейла может зашиваться прямо в логику.
Мы учим систему понимать контекст и сленг (в бьюти, в стройке, в технике: любой). Если клиент скажет «чем замазать дыру в бетоне», Molver поймет, что нужна шпаклевка, а не скотч, задаст уточняющие вопросы и выведет товар на экран.
Техника и интеграция
Нет. Наше жесткое SLA — релевантный ответ за 4−5 секунд. Мы не шлем все запросы в тяжелую модель. простые вопросы обрабатываются мгновенно, сложные — через мощные сервера. Клиент не будет ждать у полки полминуты, как это бывает с дешевыми чат-ботами.
Да. Причём, с любой. Такая интеграция и сопровождение тоже входят в наши работы.
Базовый вариант — наше защищенное облако (это быстрее и дешевле для старта). Если политика безопасности требует on-premise, мы можем развернуть систему на ваших серверах, но будьте готовы к закупке железа (стоимость серверной стойки под LLM обычно высокая).
Ваши данные. Каталоги, инструкции, pdf с регламентами, сайт. Нам не нужно, чтобы вы размечали датасеты вручную — мы умеем парсить и структурировать «сырую» документацию.
Under the Hood
Нет, это оркестратор (ансамбль моделей). Мы не шлем «сырой» запрос в LLM. Архитектура включает классификаторы, нормализаторы, ранкинг-модели, LLM
Мы не скармливаем модели всю документацию в промпте. Мы используем оптимизированный чанкинг (chunking strategies). Если юзер спрашивает про конкретный артикул, мы подтягиваем только релевантные материалы + метаданные (цена, остаток). Это держит контекстное окно в пределах разумного и снижает стоимость инференса в разы по сравнению с «наивным RAG».
Мы боремся за Time to First Token (TTFT).Прекэширование частых запросов (Redis).Стриминг ответа (пользователь видит текст по мере генерации).Оптимизация промптов (меньше токенов на вход — быстрее генерация).Наше SLA — полный ответ до 5 секунд. Если система понимает, что генерация затянется (сложный расчет), она отдает промежуточный статус («Считаю расх.»), чтобы удержать внимание.
Зависит от RPS (Requests Per Second). Одна карта уровня A100/H100 в одиночку не вытянет высокий конкаренси — запросы встанут в очередь, и latency улетит в минуту. Для нормальной работы локально вам потребуется кластер с GPU-инференсом (минимум 2x A6000 или аналоги) и оркестратор нагрузки (типа vLLM или TGI). Если у вас нет своей ML-инфраструктуры, мы можем дать наше облако.
Нет, мы не занимаемся файн-тюнингом (fine-tuning) модели под каждый новый товар — это дорого и долго. Мы обновляем векторный индекс. Как только у вас в ERP меняется цена или появляется новый товар, наш парсер обновляет эмбеддинги в векторной БД. Бот узнает о новом товаре через 5−10 минут без даунтайма.
REST API / gRPC для обмена данными. WebSockets для стриминга ответов. Мы умеем забирать данные из XML/YML фидов, SQL-баз или через API вашей PIM-системы. На выходе можем отдавать структурированный JSON для вашей кассы (формирование корзины).
Заказать демо
Заполните форму заявки и наш менеджер свяжется с вами для демонстрации продукта
Molver
Molver
Molver
Molver