En este documento estudiaremos posibles campos de actuación de algunos algoritmos de Machine Learning (ML). Buscamos estudiar la implementación de los algoritmos en Vertica y la librería Vertica-ML-Python con casos sencillos y comprobamos su rendimiento con las implementaciones en Python y R.
Enumeremos los algoritmos ML disponibles en Vertica:
1. KMEANS
2. REGRESIÓN LINEAL
3. CLASIFICACIÓN RANDOM FOREST
4. REGRESIÓN RANDOM FOREST
5. CLASIFICADOR SVM
6. REGRESOR SVM
7. NAIVE_BAYES
Que mejor que ver el contenido del paper gratuito en el Indice:
Descargar Paper (son unas 40 páginas de contenido técnico)
1 Introducción.. 3
2 INTRODUCCIÓN A LA LIBRERÍA VERTICA-ML-PYTHON.. 3
2.1 CONEXIÓN A BASE DE DATOS.. 4
2.2 VDATAFRAME Y VCOLUMN... 4
2.3 MODELOS MACHINE LEARNING... 4
3 Detalles de la DATABASE. 5
3.1 Dw_ft_ventas (indicaciones) 5
4 KMEANS VERTICA.. 5
4.1 INTRODUCCIÓN... 6
4.2 SINTAXIS EN VERTICA... 6
4.3 EJEMPLO KMEANS (1) 7
4.4 EJEMPLO KMEANS (2) 9
4.5 EJEMPLO KMEANS (2) EN R... 11
4.6 EJEMPLO KMEANS (2) EN PYTHON Y VERTICA-ML-PYTHON... 13
4.7 CONTRASTE EJEMPLO KMEANS (2) 14
4.8 KMEANS + PCA... 16
5 Regresión lineal. 17
5.1 SINTAXIS.. 17
5.2 CONTRASTANDO RESULTADOS Y RENDIMIENTO CON R... 18
5.3 EJEMPLO REGRESIÓN LINEAL EN PYTHON... 21
5.4 CONTRASTE EJEMPLO REGRESIÓN LINEAL.. 22
6 RANDOM FOREST CLASIFICACIÓN: RIESGO CREDITICIO.. 23
6.1 SINTAXIS.. 23
6.2 EJEMPLO EN R: RIESGO CREDITICIO... 24
6.3 EJEMPLO EN VERTICA 9.2: RIESGO CREDITICIO... 31
6.4 EJEMPLO RANDOM FOREST EN PYTHON... 34
6.5 CONTRASTE EJEMPLO RANDOM FOREST 35