El problema
El equipo comercial tardaba horas en armar cotizaciones para clientes B2B. La información de catálogo vivía en un ERP legacy, los precios en un módulo separado, y los descuentos por cliente en planillas locales. Cada cotización requería abrir tres sistemas distintos y verificar manualmente la disponibilidad.
“Lo que más nos quemaba no era armar la cotización, era el ida y vuelta con stock y precios.” — Gerente comercial, en la primera sesión técnica
Por qué falló lo anterior
Un piloto previo intentó resolverlo con un chatbot conectado por API a SAP. El problema: las respuestas eran lentas porque cada consulta disparaba una llamada al ERP, y el modelo no podía razonar sobre descuentos contextuales sin acceso al histórico.
Lo que construimos
Un agente con RAG sobre tres fuentes:
- Catálogo de productos vectorizado con pgvector e ingestión incremental cada 15 min.
- Histórico de pedidos indexado por cliente para inferir descuentos y volúmenes recurrentes.
- Política de pricing documentada en MDX y embebida con un loader dedicado.
El agente arma un borrador de cotización en segundos. Un humano siempre valida antes de enviar — human-in-the-loop sobre transacción crítica, no opcional.
Stack
- Modelo: Llama 3.1 70B en GPU on-prem
- Vector DB: Postgres + pgvector (mismo cluster que el ERP)
- Orquestación: LangGraph con guardrails sobre cifras
- Observabilidad: OpenTelemetry → Grafana
- Privacy: datos nunca salen del datacenter del cliente
Cómo lo desplegamos
- Semana 1-2: ingestión y QA de calidad de respuesta sobre 500 cotizaciones históricas.
- Semana 3-4: piloto con 5 vendedores; ajustes de prompts y umbrales de confianza.
- Semana 5-8: rollout progresivo a toda la fuerza comercial (≈80 personas) con tracking de adopción.
- Semana 9+: operación con SLA 99.5% y release cadence bisemanal.
Resultados
Cifras ilustrativas basadas en proyectos similares: tiempo de cotización de horas a ~4 minutos, 97% de precisión frente al benchmark humano y 80% de adopción en la fuerza comercial al finalizar el rollout.
Demo técnica · capacidades disponibles, no proyecto bajo NDA