El problema
Una entidad financiera regional recibía miles de tickets por mes en lenguaje libre. El equipo de back-office los clasificaba manualmente para asignar prioridad y routing. Los errores de clasificación disparaban SLAs vencidos y costos regulatorios.
La restricción dura
Nada podía salir del datacenter del cliente. Datos de clientes finales con tratamiento regulado. APIs externas (OpenAI, Anthropic) descartadas desde la primera reunión.
La solución
Un clasificador con LLM local + PII masking automático:
- Modelo: Llama 3.1 8B fine-tuneado con histórico de 18 meses de tickets categorizados.
- PII masking: Microsoft Presidio anonimiza nombres, DNI, emails y CBU antes de cualquier inferencia.
- Routing: clasificación → cola correspondiente → notificación al agente humano asignado.
- Audit log: cada decisión queda registrada para auditoría regulatoria.
Por qué fine-tuning y no solo prompts
El vocabulario interno del cliente (terminología regulatoria local, nombres de productos propios) no estaba bien cubierto por un modelo base. Un fine-tuning corto con datos del cliente subió la precisión por encima del umbral que necesitábamos para confiar en routing automático.
Resultados
Cifras ilustrativas basadas en proyectos similares: routing automatizado del 82% del volumen, con -65% en tiempo de respuesta y -40% en tickets reescalados versus el flujo manual previo. Todo el pipeline corre 100% on-prem.