Azure Purview es el servicio de gobernanza de datos unificados que ofrece Azure para la administración y control de datos almacenados localmente, en la nube o procedentes de aplicaciones SaaS.
Con este servicio se pueden crear mapas holísticos actualizados de los datos de las organizaciones mediante la detección automatizada de los datos, clasificación de datos confidenciales y linaje de datos de extremo a extremo. De esta manera, los consumidores de datos pueden encontrar datos valiosos y confiables.
Las funcionalidades de Azure Purview se consiguen mediante la unificación de las funcionalidades de Azure Purview Data Map y Azure Purview Data Catalog dentro de Azure Purview Studio.
· Azure Purview Data Map: Es un servicio PaaS que proporciona la base para la detección de datos y una gobernanza eficaz de los datos. Este servicio captura los metadatos de los datos empresariales presentes en los sistemas operacionales y análisis locales y en la nube.
· Azure Purview Data Catalog: Servicio que permite a todos los usuarios (tanto técnicos como empresariales) encontrar fácilmente los datos relevantes mediante su búsqueda con filtros que trabajan desde diferentes enfoques como términos del glosario empresarial, clasificaciones o etiquetas de confidencialidad.
Purview Catalog permite a los administradores de datos administrar el glosario empresarial y la capacidad de la automatización del etiquetado de los recursos de datos con los términos del glosario. Por otro lado, el servicio permite a los consumidores y productores de datos realizar un seguimiento visual del linaje de los datos desde su origen hasta su consumo pasando por las transformaciones que se le aplican.
Descargar manual completo en español gratuito (con caso de uso práctico)
Para el caso de uso se creó un grupo de recursos en Azure Active Directory donde se agregaron los recursos “Azure Purview”, “Azure data Factory” y “Azure SQL Database”.
Para la creación de la instancia de Azure Purview se siguió el procedimiento propuesto por la Microsoft en su documentación.
El recurso “Azure SQL Database” fue utilizado para el almacenamiento del conjunto de datos de ejemplo del caso de uso. Para que el caso de uso fuese completo, se utilizó el recurso “Azure data Factory” para la simulación de la utilización de procesos ETL y su interpretación por parte de Azure Purview.
Actualmente los orígenes de datos disponibles para el análisis de datos y la clasificación de metadatos son:
Propios de Azure |
Ajenos
a Azure |
Azure Blob Storage |
Power BI |
Azure Synapse Analytivs (SQL DW) |
SQL Server |
Azure Cosmo DB |
Teradata (próxima incorporación) |
Instancia administrada de Azure SQL |
SAP ECC (próxima incorporación) |
Explorador de datos de Azure |
SAP S/4 HANA (próxima
incorporación) |
Azure Data Lake Storage Gen1 |
Hive Metastore (próxima
incorporación) |
Azure Data Lake Storage Gen2 |
-- |
Azure Files |
-- |
Azure SQL Database |
-- |