TodoBI - Business Intelligence, Big Data, ML y AI TodoBI - Business Intelligence, Big Data, ML y AI

Algunos campos de actuación de Machine Learning (Vertica, R, Python)

En este documento estudiaremos posibles campos de actuación de algunos algoritmos de Machine Learning (ML). Buscamos estudiar la implementación de los algoritmos en Vertica y la librería Vertica-ML-Python con casos sencillos y comprobamos su rendimiento con las implementaciones en Python y R.

Enumeremos los algoritmos ML disponibles en Vertica:

1.       KMEANS

2.       REGRESIÓN LINEAL

3.       CLASIFICACIÓN RANDOM FOREST

4.       REGRESIÓN RANDOM FOREST

5.       CLASIFICADOR SVM

6.       REGRESOR SVM

7.       NAIVE_BAYES

Que mejor que ver el contenido del paper gratuito en el Indice:

Descargar Paper (son unas 40 páginas de contenido técnico)

1      Introducción.. 3

2      INTRODUCCIÓN A LA LIBRERÍA VERTICA-ML-PYTHON.. 3

2.1        CONEXIÓN A BASE DE DATOS.. 4

2.2        VDATAFRAME Y VCOLUMN... 4

2.3        MODELOS MACHINE LEARNING... 4

3      Detalles de la DATABASE. 5

3.1        Dw_ft_ventas (indicaciones) 5

4      KMEANS VERTICA.. 5

4.1        INTRODUCCIÓN... 6

4.2        SINTAXIS EN VERTICA... 6

4.3        EJEMPLO KMEANS (1) 7

4.4        EJEMPLO KMEANS (2) 9

4.5        EJEMPLO KMEANS (2) EN R... 11

4.6        EJEMPLO KMEANS (2) EN PYTHON Y VERTICA-ML-PYTHON... 13

4.7        CONTRASTE EJEMPLO KMEANS (2) 14

4.8        KMEANS + PCA... 16

5      Regresión lineal. 17

5.1        SINTAXIS.. 17

5.2        CONTRASTANDO RESULTADOS Y RENDIMIENTO CON R... 18

5.3        EJEMPLO REGRESIÓN LINEAL EN PYTHON... 21

5.4        CONTRASTE EJEMPLO REGRESIÓN LINEAL.. 22

6      RANDOM FOREST CLASIFICACIÓN: RIESGO CREDITICIO.. 23

6.1        SINTAXIS.. 23

6.2        EJEMPLO EN R: RIESGO CREDITICIO... 24

6.3        EJEMPLO EN VERTICA 9.2: RIESGO CREDITICIO... 31

6.4        EJEMPLO RANDOM FOREST EN PYTHON... 34

6.5          CONTRASTE EJEMPLO RANDOM FOREST  35