Clasificador de tickets en servicios financieros — on-prem

El problema

Una entidad financiera regional recibía miles de tickets por mes en lenguaje libre. El equipo de back-office los clasificaba manualmente para asignar prioridad y routing. Los errores de clasificación disparaban SLAs vencidos y costos regulatorios.

La restricción dura

Nada podía salir del datacenter del cliente. Datos de clientes finales con tratamiento regulado. APIs externas (OpenAI, Anthropic) descartadas desde la primera reunión.

La solución

Un clasificador con LLM local + PII masking automático:

Modelo: Llama 3.1 8B fine-tuneado con histórico de 18 meses de tickets categorizados.
PII masking: Microsoft Presidio anonimiza nombres, DNI, emails y CBU antes de cualquier inferencia.
Routing: clasificación → cola correspondiente → notificación al agente humano asignado.
Audit log: cada decisión queda registrada para auditoría regulatoria.

Por qué fine-tuning y no solo prompts

El vocabulario interno del cliente (terminología regulatoria local, nombres de productos propios) no estaba bien cubierto por un modelo base. Un fine-tuning corto con datos del cliente subió la precisión por encima del umbral que necesitábamos para confiar en routing automático.

Resultados

Cifras ilustrativas basadas en proyectos similares: routing automatizado del 82% del volumen, con -65% en tiempo de respuesta y -40% en tickets reescalados versus el flujo manual previo. Todo el pipeline corre 100% on-prem.