TodoBI - Business Intelligence, Big Data, ML y AI TodoBI - Business Intelligence, Big Data, ML y AI

Machine Learning en Power BI usando PyCaret open source

Os presentamos PyCaret, una biblioteca de Machine Learning de código abierto en Python que entrena y despliega modelos de Machine Learning en un entorno de código bajo.

En comparación con las otras bibliotecas de Machine Learning de código abierto, PyCaret es una biblioteca alternativa de bajo código que puede utilizarse para reemplazar cientos de líneas de código con pocas palabras solamente. Esto hace que los experimentos sean exponencialmente rápidos y eficientes. PyCaret es esencialmente un envoltorio de Python alrededor de varias bibliotecas y marcos de aprendizaje automático como scikit-learn, XGBoost, Microsoft LightGBM, spaCy, y muchos más.

PyCaret es simple y fácil de usar. Todas las operaciones realizadas en PyCaret se almacenan secuencialmente en un Pipeline totalmente orquestado para su despliegue. Ya sea imputando valores perdidos, transformando datos categóricos, ingeniería de características o incluso ajuste de hiperparámetros, PyCaret lo automatiza todo. Para aprender más sobre PyCaret, vea este video de 1 minuto.

En este post se explica un tutorial paso a paso sobre cómo PyCaret puede ser integrado dentro de Power BI, permitiendo así a los analistas y científicos de datos añadir una capa de aprendizaje automático a sus cuadros de mando e informes sin ningún coste adicional de licencia o software. PyCaret es una biblioteca de código abierto y de uso libre que viene con una amplia gama de funciones que están construidas exclusivamente para trabajar dentro de Power BI.

Clustering - Agrupar puntos de datos con características similares.
Detección de anomalías - Identificar observaciones raras / valores atípicos en los datos.
Procesamiento de Lenguaje Natural - Analizar datos de texto a través del modelado de temas.
Minería de Reglas de Asociación - Encontrar relaciones interesantes en los datos.
Clasificación - Predice etiquetas de clase categóricas que son binarias (1 o 0).
Regresión - Predice el valor continuo como ventas, precio, etc.

PyCaret está democratizando el aprendizaje automático y el uso de la analítica avanzada al proporcionar una solución de aprendizaje automático gratuita, de código abierto y de bajo código para los analistas de negocios, expertos en dominios, científicos de datos ciudadanos y científicos de datos experimentados

Saber más:

Alternativas para crear Dashboards con Python
En la mayoría de ocasiones, después de hacer un cálculo, queremos mostrar de forma sencilla algún resultado de tal forma que cualquiera lo pueda visualizar. Sin embargo, a veces el resultado no es algo sencillo y queremos proporcionar herramientas para que otros puedan “juguetear” los datos y que …
Introduccion a spaCy (Industrial-Strength Natural Language Processing en Python)
spaCy [https://spacy.io/] es una librería de Python que permite construir aplicaciones de procesamiento de lenguaje natural (NLP). spaCy proporciona modelos preentrenados de diferentes lenguajes, lo cual junto a una sintaxis clara hace que sea ideal para principiantes en el campo de la NLP. Además…
Que algoritmo de Machine Learning elegir para cada problema?
Dado que existen muchos algoritmos, como hemos venido contando ultimamente [/tag/machine%20learning], os vamos a dar/ unas pistas para ayudaros: 1. Cuando usar Machine Learning Lo primero que tenemos que tener en cuenta es que, aunque hablar y usar Machine Learning es una tendencia y es ‘cool’, deb…
Que es Xarray? Si trabajas con Python te interesa
En el mundo de ciencia de datos, en Python son indispensables dos librerías que introducen las estructuras fundamentales para representar y manipular los datos: numpy con su array N-dimensional y pandas con su Series y DataFrame. Son la base de cualquier software científico y de análisis de datos, c…
Glosario de Inteligencia Artificial (AI)
Red neuronal artificial (RNA) Un algoritmo que intenta imitar al cerebro humano, con capas de “neuronas” conectadas que se envían información entre sí. Algoritmos de caja negra Cuando el proceso de toma de decisiones o la salida de un algoritmo no puede ser fácilmente explicado por el ordenador o el…
Por que muchos Data Scientist estan dejando sus trabajos?
Muy revelador lo que nos cuentan en este articulo del Towards Data Science [https://towardsdatascience.com/why-so-many-data-scientists-are-leaving-their-jobs-a1f0329d7ea4] , y que coincide con muchas situaciones y casos reales que conocemos y que se están produciendo. La frustración con el día a día…
Top Jupyter Notebooks
En esta página tenéis una colección de Jupyter [https://jupyter.org/]/IPython notebooks destacables. No dudéis en añadir Table of Contents 1. Entire books or other large collections of notebooks on a topic [https://github.com/jupyter/jupyter/wiki/A-gallery-of-interesting-Jupyter-Notebooks#entire-books-or-other-large-collections-of-notebooks-on-a-topic…
Free Machine Learning Tutorial – All the Essential Concepts in Single Tutorial
Tutorial de aprendizaje de Machine Learning para principiantes. Como es un tutorial de iniciación es bastante sencillo, pero también completo. Ver Tutorial [https://data-flair.training/blogs/machine-learning-tutorial/] ¿Alguna vez has ido a hacer la compra? ¿Qué haces antes de ir al mercado? Siemp…