Asistente de cotizaciones con RAG sobre catálogo interno

El problema

El equipo comercial tardaba horas en armar cotizaciones para clientes B2B. La información de catálogo vivía en un ERP legacy, los precios en un módulo separado, y los descuentos por cliente en planillas locales. Cada cotización requería abrir tres sistemas distintos y verificar manualmente la disponibilidad.

“Lo que más nos quemaba no era armar la cotización, era el ida y vuelta con stock y precios.” — Gerente comercial, en la primera sesión técnica

Por qué falló lo anterior

Un piloto previo intentó resolverlo con un chatbot conectado por API a SAP. El problema: las respuestas eran lentas porque cada consulta disparaba una llamada al ERP, y el modelo no podía razonar sobre descuentos contextuales sin acceso al histórico.

Lo que construimos

Un agente con RAG sobre tres fuentes:

Catálogo de productos vectorizado con pgvector e ingestión incremental cada 15 min.
Histórico de pedidos indexado por cliente para inferir descuentos y volúmenes recurrentes.
Política de pricing documentada en MDX y embebida con un loader dedicado.

El agente arma un borrador de cotización en segundos. Un humano siempre valida antes de enviar — human-in-the-loop sobre transacción crítica, no opcional.

Stack

Modelo: Llama 3.1 70B en GPU on-prem
Vector DB: Postgres + pgvector (mismo cluster que el ERP)
Orquestación: LangGraph con guardrails sobre cifras
Observabilidad: OpenTelemetry → Grafana
Privacy: datos nunca salen del datacenter del cliente

Cómo lo desplegamos

Semana 1-2: ingestión y QA de calidad de respuesta sobre 500 cotizaciones históricas.
Semana 3-4: piloto con 5 vendedores; ajustes de prompts y umbrales de confianza.
Semana 5-8: rollout progresivo a toda la fuerza comercial (≈80 personas) con tracking de adopción.
Semana 9+: operación con SLA 99.5% y release cadence bisemanal.

Resultados

Cifras ilustrativas basadas en proyectos similares: tiempo de cotización de horas a ~4 minutos, 97% de precisión frente al benchmark humano y 80% de adopción en la fuerza comercial al finalizar el rollout.

Demo técnica · capacidades disponibles, no proyecto bajo NDA