Data Schema Tracker – Monitorización de la evolución del esquema¶
Módulo impulsado por IA para la observabilidad de metadatos y la calidad de datos – digna Data Schema Tracker
Propósito¶
El Data Schema Tracker te mantiene informado sobre cómo evolucionan las estructuras de tu base de datos.
Supervisa continuamente esquemas de tablas, columnas y tipos de datos para detectar la deriva de esquemas (schema drift) — cambios estructurales intencionados o no que pueden interrumpir pipelines, trabajos ETL o dashboards de BI.
Al garantizar transparencia en la evolución del esquema, digna ayuda a las organizaciones a mantener la confianza en la calidad de los datos, sostener la observabilidad de los sistemas de datos y evitar incidentes de producción costosos provocados por cambios de esquema no detectados.
Descripción técnica¶
Qué supervisa¶
- Columnas añadidas o eliminadas – Detecta columnas recién introducidas, renombradas o eliminadas.
- Modificaciones de tipo de dato – Identifica cambios como
INT → VARCHARoDATE → TIMESTAMP. - Modificaciones de tablas y vistas – Rastrea la creación, el renombrado o la eliminación de tablas y vistas.
- Diferencias entre entornos – Compara versiones de esquema entre los entornos Dev, Test y Production.
Detección y alertas¶
- Escanea metadatos de la base de datos o catálogos del sistema directamente dentro de tu plataforma de datos.
- Compara cada instantánea de esquema con la versión previamente conocida almacenada en el esquema de observabilidad de digna.
- Genera alertas en tiempo real en el dashboard, vía API o a través de canales de notificación externos (email, Slack, webhook).
- Registra cada versión de esquema para seguimiento histórico y preparación para auditorías.
Arquitectura y ejecución¶
- Ejecución dentro de la base de datos: digna se ejecuta completamente dentro de tu entorno, consultando vistas de metadatos sin extraer ningún dato.
- Escaneo ligero: accede solo a información estructural — nunca a datos de usuarios.
- Almacenamiento centralizado: los metadatos de esquema y los registros de deriva se almacenan en el esquema de observabilidad de digna para visualización y análisis.
- Automatización: soporta escaneos programados o basados en eventos mediante digna Core o herramientas de orquestación externas.
Ejemplos de casos de uso¶
| Caso de uso | Descripción |
|---|---|
| Monitoreo de estabilidad de ETL | Detecta cambios en la estructura upstream antes de que las pipelines fallen por incompatibilidades de esquema. |
| Confiabilidad de Business Intelligence | Evita dashboards rotos causados por columnas renombradas o ausentes. |
| Gobernanza del Data Warehouse | Mantén un historial auditable de la evolución del esquema para cumplimiento y análisis de impacto. |
| Supervisión de integraciones | Asegura que los esquemas del data lake y del warehouse permanezcan sincronizados tras actualizaciones estructurales. |
Beneficios¶
| Área | Beneficio |
|---|---|
| Calidad de los datos | Evita la deriva de esquema no detectada que puede corromper o invalidar pipelines de datos. |
| Observabilidad | Añade monitorización estructural a la observabilidad general de los ecosistemas de datos. |
| Cumplimiento | Mantiene un historial versionado de esquemas para auditoría, trazabilidad y control de cambios. |
| Prevención | Detecta problemas estructurales antes de que se conviertan en errores de reporting o de producción. |
Cómo funciona¶
- Captura de instantáneas – digna captura los metadatos del esquema actual.
- Comparación – la nueva instantánea se compara