🎯 El Desafío Organizacional
Los proyectos de inteligencia artificial y analítica avanzada fracasan con frecuencia no por la tecnología elegida, sino por la mala calidad de los datos subyacentes. Este prompt está diseñado para directores de TI, CDOs y líderes de transformación digital que necesitan identificar, antes de cualquier inversión significativa, las brechas críticas de integridad, consistencia y disponibilidad de la información en sus fuentes corporativas.
💡 La Solución DELTA
El entregable es un diagnóstico ejecutivo que clasifica las bases de datos transaccionales y repositorios de información según su grado de preparación para iniciativas de IA. Este análisis permite priorizar esfuerzos de limpieza y gobernanza, evitando pérdidas de tiempo y presupuesto en proyectos condenados al fracaso por la baja calidad de su materia prima.
🧠 Por qué este Prompt funciona
La combinación de un rol experto (Auditor de Datos) con un contexto regional explícito (protección de datos personales, limitaciones de infraestructura) garantiza que las recomendaciones no sean genéricas, sino aplicables a entornos con restricciones reales de presupuesto y cumplimiento normativo.
⚡ EL PROMPT
Actúa como un Auditor de Calidad de Datos con experiencia en inteligencia artificial y gobernanza de información. Tu tarea es realizar un análisis exhaustivo de la preparación de los datos para una iniciativa de IA. Sigue estos pasos: 1. Evalúa las siguientes fuentes de datos proporcionadas por el usuario según su completitud, consistencia, validez, integridad referencial y actualidad. 2. Identifica los tres riesgos principales de cada fuente que representen una amenaza directa a la precisión de un modelo predictivo. 3. Construye una matriz DOFA (Debilidades, Oportunidades, Fortalezas, Amenazas) específica para la implementación de IA en este contexto. 4. Genera una hoja de ruta priorizada de cuatro acciones correctivas, ordenadas por su impacto en la reducción del error del modelo y el esfuerzo estimado de implementación. Parámetros del usuario (rellena con tu información): - [SISTEMA FUENTE PRINCIPAL: CRM / ERP / Data Warehouse / Archivos planos] - [VOLUMEN DE REGISTROS: Número aproximado de filas] - [PROBLEMAS CONOCIDOS: Datos nulos, formatos inconsistentes, duplicados, falta de relaciones clave] - [RESTRICCIÓN DE PRESUPUESTO: Alto / Medio / Bajo] - [ENTORNO LEGAL: Industria regulada (ej. Financiero, Salud) / No regulada] Ejemplo de formato de respuesta esperado: - Encabezado con puntuación de salud de datos (0-100%). - Tabla de riesgos por fuente de datos. - Matriz DOFA en formato de lista priorizada. - Hoja de ruta con hitos mensuales. Restricciones: - No recomendar adquisición de software nuevo si la restricción de presupuesto es baja. - Incluir controles de verificación de datos para cumplir con la Ley de Protección de Datos 1581 de 2012. Contexto: Nos encontramos en entornos empresariales con alta volatilidad operativa, donde los sistemas transaccionales han acumulado deuda técnica durante más de una década. El año de ejecución es 2026. Tono: Analítico, directo y orientado a la ejecución. Enfócate en la pérdida de valor económico por mala calidad del dato.
📝 1. El Prompt Diligenciado
Actúa como un Auditor de Calidad de Datos con experiencia en inteligencia artificial y gobernanza de información. Tu tarea es realizar un análisis exhaustivo de la preparación de los datos para una iniciativa de IA. Sigue estos pasos:
1. Evalúa las siguientes fuentes de datos proporcionadas por el usuario según su completitud, consistencia, validez, integridad referencial y actualidad.
2. Identifica los tres riesgos principales de cada fuente que representen una amenaza directa a la precisión de un modelo predictivo.
3. Construye una matriz DOFA (Debilidades, Oportunidades, Fortalezas, Amenazas) específica para la implementación de IA en este contexto.
4. Genera una hoja de ruta priorizada de cuatro acciones correctivas, ordenadas por su impacto en la reducción del error del modelo y el esfuerzo estimado de implementación.
Parámetros del usuario:
– [SISTEMA FUENTE PRINCIPAL: CRM Salesforce y ERP SAP Business One]
– [VOLUMEN DE REGISTROS: 2.5 millones de filas en la tabla de clientes; 8 millones en transacciones]
– [PROBLEMAS CONOCIDOS: 35% de nulos en el campo ‘industria_cliente’; duplicación del 12% por falta de unificación de RUT; fechas de factura en formato dd/mm/aaaa mezclado con mm/dd/aaaa]
– [RESTRICCIÓN DE PRESUPUESTO: Medio]
– [ENTORNO LEGAL: Industria regulada (Sector Financiero)]
Ejemplo de formato de respuesta esperada:
– Encabezado con puntuación de salud de datos (0-100%).
– Tabla de riesgos por fuente de datos.
– Matriz DOFA en formato de lista priorizada.
– Hoja de ruta con hitos mensuales.
Restricciones:
– No recomendar adquisición de software nuevo si la restricción de presupuesto es baja.
– Incluir controles de verificación de datos para cumplir con la Ley de Protección de Datos 1581 de 2012.
Contexto: Nos encontramos en entornos empresariales con alta volatilidad operativa, donde los sistemas transaccionales han acumulado deuda técnica durante más de una década. El año de ejecución es 2026.
Tono: Analítico, directo y orientado a la ejecución. Enfócate en la pérdida de valor económico por mala calidad del dato.
📊 2. Resultado Obtenido
Diagnóstico de Preparación de Datos para IA
Unidad de Negocio: Comercial y Finanzas | Fecha del Análisis: Abril 2026
ÍNDICE DE SALUD DE DATOS (DATA HEALTH SCORE)
47 / 100
▸ Estado: Crítico – No iniciar entrenamiento de modelos
⚠️ Umbral necesario: El modelo requiere un mínimo del 70% de fiabilidad en los datos para evitar sesgos operativos.
📊 CRM Salesforce (Clientes)
Volumen: 2.5M filas | Nulos críticos: 35% en ‘industria_cliente’
Top 3 Riesgos para el Modelo:
- Sesgo de segmentación: 35% de registros sin industria quedarán fuera de la personalización.
- Sobrestimación de LTV: Tasa de duplicación del 12% (falta de unificación por RUT).
- Incumplimiento normativo: Ausencia de hash para atender solicitudes de eliminación (Ley 1581).
📦 ERP SAP Business One (Transacciones)
Volumen: 8M filas | Inconsistencias: Formato de fecha mixto
Top 3 Riesgos para el Modelo:
- Falla en ETL: Formatos dd/mm/aaaa vs mm/dd/aaaa interrumpen la ingesta automatizada.
- Huérfanos referenciales: 5% de transacciones sin ID de cliente válido.
- Obsolescencia de campo: ‘estado_pedido’ no actualizado desde 2024 (customización heredada).
📌 Matriz DOFA para la Implementación de IA
Debilidades
Inconsistencia de formatos entre módulos; alta tasa de nulos semánticos; falta de herramienta de profiling.
Oportunidades
Desduplicación fonética de bajo costo; validaciones en web para reducir nulos futuros.
Fortalezas
Volumen suficiente para entrenar modelos robustos; equipo con conocimiento del dominio.
Amenazas
Costo de oportunidad: modelos de fraude quedarán obsoletos si no se acelera la limpieza.
🗓️ Hoja de Ruta Priorizada (4 Acciones)
| Plazo | Acción | Impacto / Esfuerzo | Costo Estimado |
|---|---|---|---|
| Mes 1 | Estandarización de formatos (fechas y números) en la capa de ingesta (SQL/Python). | Alto / Bajo | Humano interno (sin inversión) |
| Mes 2-3 | Reglas fonéticas y de proximidad para desduplicación del CRM (tabla de clientes dorada). | Alto / Medio | 2 semanas de senior developer |
| Mes 4 | Migración de nulos a categoría ‘No clasificado’ y ajuste del modelo de riesgo. | Medio / Medio | Consultoría especializada |
| Mes 5 | Backfill histórico para reparar transacciones huérfanas (integridad referencial). | Bajo / Alto | Requiere aprobación de auditoría |
Consejo de Implementación
Ejecute este prompt trimestralmente, actualizando los parámetros con los hallazgos de las mesas de gobierno de datos. Se recomienda compartir el informe resultante (especialmente la hoja de ruta) con el Comité de Finanzas para justificar la asignación de recursos a la limpieza estructural, en lugar de solicitar presupuesto para nuevas herramientas analíticas.
Compartir este Contenido
Comparta este contenido con su equipo o red profesional
