Saltar al contenido
Retail · enterprise

Asistente de cotizaciones con RAG sobre catálogo interno

Cómo redujimos el tiempo de cotización en un retailer enterprise sin tocar su ERP.

Tamaño
Enterprise · 1000+ empleados
Stack
Llama 3.1 70B · pgvector · LangGraph
Publicado
12 de abril de 2026
Cliente
Demo técnica · ejemplo de implementación

El problema

El equipo comercial tardaba horas en armar cotizaciones para clientes B2B. La información de catálogo vivía en un ERP legacy, los precios en un módulo separado, y los descuentos por cliente en planillas locales. Cada cotización requería abrir tres sistemas distintos y verificar manualmente la disponibilidad.

“Lo que más nos quemaba no era armar la cotización, era el ida y vuelta con stock y precios.” — Gerente comercial, en la primera sesión técnica

Por qué falló lo anterior

Un piloto previo intentó resolverlo con un chatbot conectado por API a SAP. El problema: las respuestas eran lentas porque cada consulta disparaba una llamada al ERP, y el modelo no podía razonar sobre descuentos contextuales sin acceso al histórico.

Lo que construimos

Un agente con RAG sobre tres fuentes:

  1. Catálogo de productos vectorizado con pgvector e ingestión incremental cada 15 min.
  2. Histórico de pedidos indexado por cliente para inferir descuentos y volúmenes recurrentes.
  3. Política de pricing documentada en MDX y embebida con un loader dedicado.

El agente arma un borrador de cotización en segundos. Un humano siempre valida antes de enviar — human-in-the-loop sobre transacción crítica, no opcional.

Stack

  • Modelo: Llama 3.1 70B en GPU on-prem
  • Vector DB: Postgres + pgvector (mismo cluster que el ERP)
  • Orquestación: LangGraph con guardrails sobre cifras
  • Observabilidad: OpenTelemetry → Grafana
  • Privacy: datos nunca salen del datacenter del cliente

Cómo lo desplegamos

  • Semana 1-2: ingestión y QA de calidad de respuesta sobre 500 cotizaciones históricas.
  • Semana 3-4: piloto con 5 vendedores; ajustes de prompts y umbrales de confianza.
  • Semana 5-8: rollout progresivo a toda la fuerza comercial (≈80 personas) con tracking de adopción.
  • Semana 9+: operación con SLA 99.5% y release cadence bisemanal.

Resultados

Cifras ilustrativas basadas en proyectos similares: tiempo de cotización de horas a ~4 minutos, 97% de precisión frente al benchmark humano y 80% de adopción en la fuerza comercial al finalizar el rollout.

Demo técnica · capacidades disponibles, no proyecto bajo NDA
06 — Contacto

Empezamos con una sesión técnica de 45 min.

Sin formulario interminable. Cuéntanos brevemente el desafío y agendamos. Si no encaja, te lo decimos.