TodoBI - Business Intelligence, Big Data, ML y AI TodoBI - Business Intelligence, Big Data, ML y AI

Comparativa de Algortimos de herramientas Data Mining


El Data Mining , consiste en la extracción no trivial de información que reside de manera implícita en los datos. Dicha información era previamente desconocida y podrá resultar útil para algún proceso. En otras palabras, la minería de datos prepara, sondea y explora los datos para sacar la información oculta en ellos.
Bajo el nombre de minería de datos se engloba todo un conjunto de técnicas encaminadas a la extracción de conocimiento procesable, implícito en las bases de datos. Está fuertemente ligado con la supervisión de procesos industriales ya que resulta muy útil para aprovechar los datos almacenados en las bases de datos.
Las bases de la minería de datos se encuentran en la inteligencia artificial y en el análisis estadístico. Mediante los modelos extraídos utilizando técnicas de minería de datos se aborda la solución a problemas de predicción, clasificación y segmentación.
Ver info en Wikipedia .
Desde TodoBI, hemos llevado a cabo un estudio y creado un documento de diferentes herramientas de data mining, algunas open source como weka , otras gratuitas como k-nime o Rapidminer (que también dispone de versión de pago) y otras sobradamente conocidas de pago como SPSS Clementine (llamada PASW desde su adquisición por IBM en enero).
Descargar Comparativa
Comparativa_DM

Dada la gran cantidad de información disponible para casi todas las herramientas seleccionadas, se ha optado por realizar la comparativa solamente de los distintos algoritmos de datamining que integran, dejando a un lado las opciones de pretratamiento, post-procesado y visualización disponibles. Posiblemente ampliemos el documento realizado con esta información más adelante.
A la vista de los resultados obtenidos nos hemos decantado por Weka , ya que además de ser gratuita y de tener el más amplio abanico de algoritmos, se integra perfectamente con pdi (antes kettle), por lo que será sencillo incorporarlo a nuestras soluciones integrales de Bussiness Intelligence.