Tiempo de lectura estimado: 14 minutes
Según Gartner, para 2026, el 80% de las empresas habrá adoptado una arquitectura de plataforma de datos moderna, impulsada principalmente por la necesidad de respaldar la analítica avanzada y las iniciativas de IA. La era de las plataformas tradicionales de Business Intelligence (BI) tal como las conocemos está llegando a su fin. A medida que avanzamos hacia 2025, más allá de dar soporte a otros casos de uso, las organizaciones deben reconceptualizar sus plataformas de datos para dar soporte tanto a la IA como a los sistemas de agentes. Los días de las plataformas centradas en BI están dando paso a plataformas de datos de IA sólidas diseñadas para operaciones inteligentes en tiempo real.
Esta transformación no se trata solo de tecnología, sino que representa un cambio fundamental en la forma en que pensamos, organizamos y utilizamos los datos.
El fin de las plataformas tradicionales centradas en BI
Las plataformas tradicionales de BI, diseñadas principalmente para la elaboración de informes y el análisis, ya no son suficientes. De hecho, se espera que la BI represente menos del 50% del uso de la plataforma de datos en un futuro próximo. El nuevo principio requiere plataformas que puedan manejar tanto datos estructurados como no estructurados casi en tiempo real, con un fuerte énfasis en una capa semántica centralizada y una gestión y observabilidad de datos activas.
5 pilares de las plataformas de datos modernas para la IA y los agentes
Los siguientes capítulos profundizarán en los cinco pilares de las plataformas de datos modernas para la IA y los sistemas de agentes:
1. Capa semántica centralizada
2. Sus datos se convierten en un centro de operaciones
3. El medallón ha muerto. Utilice dominios de datos y productos de datos
4. Pase de la calidad de los datos a la observabilidad de los datos
1. Capa semántica centralizada: la base para la IA y los agentes
La capa semántica ha surgido como la base de las plataformas de datos modernas, especialmente para los agentes de IA y los LLM. La nueva capa semántica traduce universalmente la intención humana y las estructuras de datos, a diferencia de las implementaciones tradicionales de BI que atrapaban las definiciones semánticas dentro de herramientas de visualización específicas.
¿Por qué la capa semántica es fundamental para los agentes de IA?
Los agentes de IA, impulsados por los LLM, interactúan principalmente a través del lenguaje natural. La capa semántica tiende un puente entre estas interacciones basadas en texto y las estructuras de datos subyacentes mediante:
- Proporcionar contexto y relaciones que hacen que los datos sean significativos para los LLM.
- Permitir que las consultas en lenguaje natural se traduzcan con precisión en operaciones de datos.
- Mantener definiciones de negocio coherentes en todas las aplicaciones de IA.
- Garantizar que los agentes comprendan y utilicen los datos de acuerdo con las reglas de negocio.
Acceso universal a los datos a través de la comprensión semántica
La capa semántica supera su papel tradicional en la BI para convertirse en un gráfico de conocimiento universal que conecta los datos a través de los dominios, un repositorio central de lógica de negocio y definiciones de métricas, un intérprete entre el lenguaje natural y las implementaciones técnicas, y un garante de la interpretación coherente de los datos en todas las herramientas y plataformas.
Esta universalidad aplica sistemáticamente la misma comprensión semántica, las reglas de negocio y las relaciones de datos, ya sea que un usuario de negocio acceda a los datos con lenguaje natural, un agente de IA responda a las consultas, un proceso automatizado tome decisiones o un científico de datos construya modelos.
Liberarse de la semántica específica de las herramientas
Históricamente, la incrustación de definiciones semánticas directamente dentro de herramientas específicas como las plataformas de BI creó interpretaciones inconsistentes en diferentes sistemas. Este enfoque condujo a definiciones duplicadas y a la lógica de negocio, dificultó la adopción de la IA y la automatización, y limitó la capacidad de escalar la comprensión de los datos en toda la organización.
La nueva capa semántica resuelve estos desafíos centralizando las definiciones semánticas fuera de cualquier herramienta específica, haciendo que el contexto de negocio esté disponible como un servicio, permitiendo la adaptación dinámica de la comprensión de los datos y soportando la interpretación de datos multi-modal para los sistemas de IA.
2. Convertirse en activo: del almacenamiento pasivo al centro de operaciones
La transformación de las plataformas de BI pasivas a las plataformas de datos modernas operativas activas representa un cambio fundamental en la forma en que las organizaciones aprovechan sus activos de datos. Los lagos de datos tradicionales servían principalmente como repositorios estáticos para el análisis histórico, pero las plataformas modernas deben convertirse en centros de operaciones dinámicos que participen activamente en los procesos de negocio.
Más allá del paradigma de solo análisis
Las plataformas tradicionales de BI se caracterizaban por:
- Flujo de datos unidireccional (de los sistemas operativos al almacén de datos)
- Procesamiento orientado a lotes
- Enfoque en el análisis histórico y la elaboración de informes
- Interacción limitada con los sistemas operativos
Las plataformas de datos activas modernas transforman fundamentalmente el flujo y el procesamiento de datos al romper el paradigma tradicional. Permiten flujos de datos bidireccionales, lo que permite una interacción perfecta entre diferentes sistemas y aplicaciones. Además, soportan el procesamiento de datos en tiempo real, lo que facilita la obtención de información y la toma de decisiones inmediatas.
Además, los lagos de datos activos modernos impulsan directamente las decisiones operativas, proporcionando los datos y el análisis necesarios para informar las acciones de negocio. En última instancia, sirven como un sistema nervioso central para las operaciones de negocio, integrando y orquestando varios procesos para impulsar la eficiencia y la eficacia.
Capacidades y requisitos operativos
El cambio a las plataformas de datos de IA operativas exige:
Procesamiento casi en tiempo real
Las capacidades de procesamiento en streaming o casi en tiempo real son esenciales para manejar flujos de datos de alto volumen y alta velocidad en las operaciones actuales. Esto permite a la plataforma procesar y analizar los datos a medida que llegan, lo que permite obtener información y tomar decisiones de manera oportuna. Las arquitecturas basadas en eventos también pueden ayudar, ya que permiten a la plataforma reaccionar a eventos específicos o cambios en los datos, activando acciones o notificaciones según sea necesario. Las soluciones de CDC o de movimiento de datos (como Fivetran / HVR o Airbyte) pueden ayudar a evitar las operaciones tradicionales de ETL y por lotes.
Integración bidireccional
Las capacidades de Reverse ETL son esenciales para reinyectar los datos en los sistemas operativos, garantizando que la información y el análisis se generen y se actúe sobre ellos en tiempo real. Esta capacidad permite al lago de datos activo consumir datos e influir directamente en los procesos operativos.
Una arquitectura API-first es fundamental porque facilita directamente la interacción entre su lago de datos activo y varios sistemas internos. Este enfoque garantiza que pueda acceder e integrar fácilmente datos y análisis en diferentes aplicaciones y servicios. En última instancia, una estrategia API-first fomenta una cultura de toma de decisiones basada en datos mediante la estandarización y la seguridad del intercambio de datos.
Las organizaciones necesitan mecanismos automatizados de intercambio de datos para agilizar el intercambio de datos entre diferentes sistemas y aplicaciones. La automatización de este proceso permite a las organizaciones reducir los errores de transferencia manual de datos, aumentar la eficiencia y garantizar un intercambio de datos seguro y controlado.
Casos de uso operativos de las plataformas de datos de IA
La integración directa con las aplicaciones orientadas al cliente es un caso de uso clave para los lagos de datos activos. Esta integración permite el intercambio y el análisis de datos en tiempo real, lo que permite a las empresas ofrecer experiencias personalizadas a sus clientes.
Otra aplicación importante son los motores de personalización en tiempo real. Estos motores utilizan datos en tiempo real para adaptar el contenido y las experiencias a los usuarios individuales, aumentando el compromiso y la satisfacción.
La fijación de precios dinámica y la gestión de inventario son casos de uso que se benefician de los datos en tiempo real. Mediante el análisis de las condiciones del mercado y el comportamiento de los clientes en tiempo real, las empresas pueden optimizar los precios y los niveles de inventario para maximizar los ingresos y la satisfacción del cliente.
Impacto en las operaciones empresariales y técnicas
Esta transformación permite actuar de inmediato sobre la información en lugar de respuestas tardías, la toma de decisiones automatizada basada en datos en tiempo real, la integración perfecta entre los procesos analíticos y operativos, la optimización dinámica de los procesos empresariales y la personalización de la experiencia del cliente en tiempo real.
Al hacer que sus plataformas de datos sean más operativas, debe comprender que su plataforma se está convirtiendo en un componente operativo real de sus sistemas de información, lo que requiere una supervisión y vigilancia operativas cuidadosas, como cualquier otro componente activo de su SI. Los equipos de BI tradicionales no están acostumbrados a este nivel de requisitos:
- Un panel de control entregado tardíamente es perjudicial, pero no peligroso.
- Una puntuación o segmentación de clientes obsoleta podría perjudicar realmente sus ventas en línea.
3. Arquitectura basada en dominios: Liberarse de las limitaciones tradicionales
El cambio de las arquitecturas tradicionales de tres niveles/medallón (Bronce/Plata/Oro o Raw/Refined/Curated) a un enfoque basado en dominios representa un replanteamiento fundamental de cómo organizamos y gestionamos las plataformas de datos empresariales. Esta transformación es esencial para habilitar la IA y los sistemas agentic a escala.
Limitaciones de las arquitecturas tradicionales
La arquitectura tradicional de tres niveles crea varios desafíos:
Cuellos de botella organizativos
Los equipos centralizados son propensos a verse desbordados de solicitudes, lo que lleva a una respuesta lenta a las necesidades del negocio. Esto se ve agravado por la limitada experiencia en el dominio dentro de estos equipos centrales, lo que dificulta abordar eficazmente las necesidades únicas de cada dominio empresarial. Además, la coordinación entre las partes interesadas del negocio y de TI se vuelve cada vez más compleja, lo que dificulta la capacidad de responder rápidamente a los requisitos empresariales cambiantes.
Limitaciones técnicas de las plataformas de datos modernas
La arquitectura tradicional se caracteriza por modelos de datos rígidos que son difíciles de evolucionar en respuesta a las necesidades empresariales cambiantes. Las complejas dependencias entre las capas dificultan la modificación o actualización de los componentes individuales sin afectar a todo el sistema. Además, la incapacidad de la arquitectura para optimizar casos de uso específicos da como resultado un enfoque único para la transformación de datos, que puede ser ineficiente e ineficaz.
Problemas de escalabilidad
A medida que la organización crece, los recursos del equipo central se escalan linealmente, lo que lleva a un aumento de los gastos generales de coordinación y a la dificultad para mantener la calidad de los datos a escala. Además, las limitaciones de la arquitectura tradicional dificultan la paralelización del desarrollo, lo que dificulta la capacidad de la organización para escalar de manera eficiente y eficaz.
Enfoque de productos de datos basados en el dominio
El nuevo enfoque organiza los datos en torno a los dominios empresariales, donde cada dominio:
Propiedad y autonomía
La propiedad y la responsabilidad claras del dominio son esenciales, garantizando que cada dominio sea responsable de sus acciones y resultados. Esta autonomía permite que la toma de decisiones dentro de los dominios sea autosuficiente, lo que permite la optimización local adaptada a las necesidades específicas de cada dominio. Este enfoque se alinea directamente con los objetivos empresariales, ya que cada dominio se centra en la consecución de sus objetivos únicos.
Pensamiento de producto de datos
Las organizaciones tratan los datos como un producto, con acuerdos de nivel de servicio (SLA) claros que describen su calidad, disponibilidad y rendimiento. Las interfaces y los contratos bien definidos garantizan una integración y un consumo perfectos de los productos de datos. Los mecanismos integrados de calidad de los datos y de observabilidad garantizan la integridad del producto de datos y facilitan su supervisión. El objetivo principal es comprender las necesidades de los usuarios y los patrones de consumo para garantizar que el producto de datos cumpla su propósito previsto.
Principios de la arquitectura de las plataformas de datos de IA
Esta arquitectura permite la evolución independiente del dominio, permitiendo que cada uno progrese a su propio ritmo, libre de dependencias que lo obstaculicen. Establecemos límites y responsabilidades claros para evitar confusiones o solapamientos. La comunicación estandarizada entre dominios garantiza una interacción perfecta entre los dominios, promoviendo un sistema cohesivo e integrado. La implementación de un modelo de gobernanza federada supervisa todo el sistema, garantizando la coherencia y la coordinación entre los dominios.
Habilitación de la escala a través de la arquitectura de dominio
Este enfoque permite la escalabilidad mediante:
Desarrollo paralelo
Los equipos de dominio independientes trabajan de forma autónoma, reduciendo los gastos generales de coordinación y permitiendo ciclos de iteración más rápidos. Esta autonomía permite la optimización específica del dominio, adaptando cada dominio a sus necesidades y objetivos únicos.
Responsabilidades claras
Los equipos de dominio gestionan sus productos de datos, garantizando la alineación con las necesidades específicas del dominio. Los equipos centrales se centran en el desarrollo de las capacidades de la plataforma, proporcionando una base sobre la que construir los dominios. Las interfaces estandarizadas entre los dominios facilitan una integración perfecta, mientras que un marco de gobernanza compartido garantiza la coherencia en todo el sistema.
Evolución flexible
El enfoque basado en el dominio permite que los dominios evolucionen a diferentes velocidades, lo que permite la elección de tecnología independiente cuando sea apropiado. Esta flexibilidad permite la experimentación dentro de los dominios, fomentando la innovación y la mejora. Esto también facilita una vía de modernización gradual, garantizando que los dominios puedan adaptarse a los requisitos cambiantes sin interrumpir todo el sistema.
Consideraciones de implementación
El éxito con la arquitectura basada en el dominio requiere:
Alineación organizativa
Establezca límites de dominio claros y alinéelos con los objetivos empresariales de su organización para garantizar que cada dominio se centre en las necesidades y los resultados empresariales específicos. Los equipos de dominio empoderados son esenciales, ya que son responsables de tomar decisiones y emprender acciones dentro de sus respectivos dominios. Una distribución equilibrada de las responsabilidades entre los equipos centrales y los de dominio es crucial, garantizando que cada equipo sea responsable de sus acciones y resultados. Establezca canales de comunicación sólidos para facilitar la colaboración y la coordinación entre los equipos, garantizando que la información fluya sin problemas entre los dominios.
Estándares técnicos y herramientas
- Para garantizar una integración y un intercambio de datos perfectos entre los dominios, deben definirse y acordarse contratos de datos compartidos.
- Deben establecerse patrones de integración estándar para simplificar el proceso de integración y reducir la complejidad. Son necesarias métricas de calidad comunes para garantizar que los productos de datos cumplen los estándares requeridos en todos los dominios.
- Un sistema unificado de gestión de metadatos es esencial para mantener una comprensión coherente de los datos en toda la organización.
- La gobernanza de datos moderna ya no se trata solo de reglas y PowerPoint, sino también de herramientas sólidas y de la participación de la plataforma para ayudar a los ingenieros y a los usuarios empresariales a trabajar sin problemas con los datos.
- Los mercados internos de Data Platforms se están convirtiendo cada vez más en un estándar para empaquetar y entregar productos de datos a las partes interesadas internas, como podrían serlo para los usuarios externos.
Marco de gobernanza
Es necesario un modelo de gobernanza federada para supervisar todo el sistema, garantizando la coherencia y la coordinación entre los dominios. Deben definirse derechos de decisión claros para evitar confusiones o solapamientos entre los dominios. Son necesarias medidas de calidad estandarizadas para garantizar que los productos de datos cumplen los estándares requeridos en todos los dominios. Deben establecerse mecanismos de coordinación entre dominios para facilitar la colaboración y garantizar que los dominios trabajen juntos de forma eficaz.
Este enfoque crea una plataforma de datos más resistente, escalable y ágil que puede soportar mejor las diversas necesidades de las empresas modernas, especialmente en el contexto de la implementación de sistemas de IA y agentic.
Mi punto de vista
Quiero dejar claro que la solución no está realmente en la adopción de ninguna técnica de modelado de datos (modelo entidad-relación, esquema de estrella, esquema de copo de nieve y otras bóvedas de datos, que parece que hoy en día traen más problemas que soluciones), sino más bien en la arquitectura de datos que reutiliza el diseño de la plataforma digital, donde los equipos de pizza, las API y la agilidad fueron fundamentales para aportar valor en tiempo real.
4. Plataformas de datos de IA: De la calidad de los datos a la observabilidad de los datos
La creciente prevalencia de los datos casi en tiempo real y los volúmenes masivos ha hecho que los enfoques tradicionales de calidad de los datos sean ineficaces. Para hacer frente a estos retos, las plataformas de datos modernas deben incorporar capacidades avanzadas que garanticen la calidad y la integridad de los datos. En concreto, estas plataformas requieren una visibilidad de extremo a extremo en toda la cadena de valor de los datos, lo que permite rastrear los datos desde su origen hasta su destino final. Esta visibilidad es crucial para identificar y abordar los problemas de calidad de los datos con prontitud.
Las pruebas de calidad automatizadas y la detección de anomalías también son componentes esenciales de las Modern Data Platforms. Estas características permiten identificar problemas de calidad de los datos en tiempo real, lo que permite tomar medidas correctivas rápidas. Además, se necesitan capacidades de supervisión avanzadas para identificar de forma proactiva los posibles problemas antes de que afecten al canal de datos. Este enfoque proactivo garantiza que los problemas de calidad de los datos se aborden antes de que afecten a las aplicaciones o a los usuarios posteriores.
El linaje integral y el análisis de impacto también son componentes críticos de las Modern Data Platforms. Estas capacidades proporcionan una comprensión detallada de cómo fluyen los datos a través del sistema, lo que permite identificar la causa raíz de los problemas de calidad de los datos y su impacto en las aplicaciones posteriores. Esta comprensión es esencial para tomar decisiones informadas sobre la calidad de los datos y para optimizar los flujos de trabajo de procesamiento de datos con el fin de garantizar los más altos niveles de integridad de los datos.
Si realmente quieres saber más sobre la observabilidad de los datos, echa un vistazo a los jugadores puros como Sifflet Data (mi favorito, sí, es francés) o Monte Carlo Data.
5. Tus datos no estructurados son solo… datos
En la era de la IA y los sistemas agentic, la distinción entre datos estructurados y no estructurados es cada vez más irrelevante. Los agentes de IA, con sus capacidades avanzadas, pueden procesar y analizar sin problemas ambos tipos de datos, extrayendo información valiosa y tomando decisiones informadas. Por lo tanto, las organizaciones deben adoptar un enfoque unificado para la gestión de datos, tratando los datos no estructurados con el mismo nivel de importancia y rigor que los datos estructurados. La reciente adquisición de Datavolo por parte de Snowflake muestra cómo las plataformas se están preparando para este enfoque.
¿Por qué unificar la gestión de datos?
Los agentes de IA son agnósticos a las estructuras de datos. Pueden aprovechar técnicas avanzadas como el procesamiento del lenguaje natural (PNL) y el aprendizaje automático (AA) para extraer significado y valor tanto de los datos estructurados como de los no estructurados. Al unificar la gestión de datos, las organizaciones pueden desbloquear todo el potencial de sus activos de datos, lo que permite a los agentes de IA aprovechar toda la información disponible para la toma de decisiones.
¿Cómo lograr una gestión de datos unificada?
- Plataformas de datos unificadas: las organizaciones deben aprovechar las Modern Data Platforms que pueden gestionar sin problemas tanto los datos estructurados como los no estructurados. Estas plataformas deben proporcionar una visión unificada de todos los activos de datos, independientemente de su estructura, lo que permite a los agentes de IA acceder y analizar los datos desde una única fuente.
- Modelos operativos unificados: los mismos protocolos de seguridad, políticas de gobernanza de datos y procesos operativos deben aplicarse tanto a los datos estructurados como a los no estructurados. Esto garantiza la coherencia y el cumplimiento en todos los activos de datos, independientemente de su estructura.
- Gestión de datos integrada: cuando se utilizan componentes especializados como las bases de datos vectoriales para datos no estructurados, su gestión debe integrarse en la plataforma de datos general. Esto garantiza que todos los activos de datos se gestionen de forma coordinada y coherente.
Al adoptar un enfoque unificado para la gestión de datos, las organizaciones pueden capacitar a sus agentes de IA para que aprovechen todo el espectro de sus activos de datos, impulsando la innovación y desbloqueando nuevas oportunidades de crecimiento.
Preparación para la IA y los sistemas agentic
Requisitos de infraestructura
Almacenamiento universal: la plataforma de datos de 2025 debe gestionar de forma eficiente tanto los datos estructurados como los no estructurados. Esto es esencial para dar cabida a los diversos tipos de datos y fuentes con los que tratan las empresas modernas.
Para un formato estructurado, 2025 sin duda verá a Iceberg convertirse en el nuevo estándar abierto de facto para el almacenamiento de datos estructurados multi/híbrido en la nube.
Solo las Data Platforms avanzadas pueden garantizar un almacenamiento de datos universal y siempre gobernado tanto para datos estructurados como no estructurados.
Procesamiento casi en tiempo real: la capacidad de acceder y procesar datos casi en tiempo real es un requisito fundamental para la plataforma de datos de 2025. Esta capacidad permite a las organizaciones tomar decisiones oportunas e informadas basadas en los datos más actuales.
Comprensión semántica: la plataforma de datos de 2025 debe poseer capacidades avanzadas de comprensión semántica. Esto incluye la capacidad de comprender el contexto y las relaciones entre los diferentes elementos de datos. Esta comprensión es crucial para permitir un procesamiento de datos más inteligente y consciente del contexto.
Evolución de la gobernanza
El modelo de gobernanza está evolucionando de un modelo centralizado a uno federado, donde:
El departamento de TI es responsable de la gestión de la infraestructura de la plataforma, garantizando su estabilidad y escalabilidad.
A los dominios individuales se les concede un alto grado de autonomía, lo que les permite tomar decisiones que se adaptan mejor a sus necesidades y objetivos específicos. Se establecen normas de gobernanza compartidas para garantizar la coherencia y la alineación en todos los dominios, promoviendo un sistema cohesionado e integrado. Se exige la catalogación de datos obligatoria y la presentación de informes de calidad, lo que garantiza que todos los productos de datos cumplan las normas exigidas y estén bien documentados.
Se establecen contratos de datos claros entre los dominios, lo que garantiza que los datos se intercambien de forma estandarizada y segura.
Para garantizar que la gobernanza moderna no sea solo reglas y presentaciones de PowerPoint, debe aplicarse en el núcleo de su plataforma de datos. Esto se llama Gobernanza computacional federada, que incluye:
- Estándar como código
- Políticas como código
- Pruebas automatizadas
- Supervisión automatizada
Plataformas de datos de IA: el camino a seguir
Para resumir lo que acabamos de ver, las organizaciones deben centrarse en varias áreas clave para preparar sus Data Platforms para la IA y los sistemas agentic:
Industrialización
- Integración completa de CI/CD
- Gestión automatizada de la infraestructura
- Procesos de implementación estandarizados
- Gobernanza computacional federada
Sincronización de datos
- Ir más allá del ETL tradicional
- Implementar la sincronización de datos en tiempo real
- Aprovechar las soluciones de ingesta nativas de la nube
Accesibilidad
- Capa semántica dentro de la plataforma de datos
- Implementar capacidades de “chatear con sus datos”
- Habilitar consultas en lenguaje natural
- Admitir la funcionalidad de texto a SQL
Una transición a las plataformas de datos modernas
La transición a las Data Platforms preparadas para la IA y los sistemas agentic representa un cambio fundamental en la arquitectura de datos empresariales. El éxito requiere que las organizaciones vayan más allá del pensamiento tradicional centrado en la inteligencia empresarial y adopten un enfoque más dinámico, interconectado y semánticamente rico para la gestión de datos. Las plataformas de 2025 no solo almacenarán y analizarán datos, sino que participarán activamente en el ecosistema de IA y agentic de la organización, lo que permitirá nuevos niveles de automatización, conocimiento e innovación.

¿Listo para transformar sus datos en un activo estratégico para el análisis, la IA y el éxito empresarial sostenido?
Construya una base de datos preparada para el futuro con Devoteam, el socio consultor de datos número 1 en EMEA.
- Aproveche nuestros más de 1000 expertos certificados,
- capacidades integrales probadas en estrategia, gobernanza y plataformas de nube modernas (AWS, Azure, GCP, Snowflake, Databricks), y
- nuestro enfoque implacable en convertir los conocimientos de datos en un impacto empresarial medible
