DataCleaner
es una herramienta que sirve para analizar la calidad de los datos obtenidos, con capacidad para encontrar patrones y supervisar los valores de los datos.
Está construida para poder manejar pequeñas y grandes cantidades de datos. Es posible diseñar nuestras propias reglas de limpieza de datos y componerlas en múltiples escenarios distintos o bases de datos objetivo, dichas reglas pueden ser: reglas de búsqueda y/o reemplazo, expresiones regulares, coincidencia de patrones (pattern matching) o transformaciones totalmente personalizadas.
Ofrece también un ecosistema de integraciones de extensiones de aplicaciones impulsadas por la comunidad, contenido compartido, etc. Es posible hacer que DataCleaner funcione Hadoop y Apache Spark, además es viable integrarlo en otras aplicaciones como Pentaho Data Integration