En Stratebi , líderes en Business Intelligence, Big Data y Machine Learning y creadores de la plataforma LinceBI están buscando apasionados por estas áreas, con muchas ganas de aprender, crecer profesionalmente y liderar el desarrollo de la mejor plataforma Big Data Analytics en grandes proyectos.
"Nos gustaría que tuvierais los siguientes skills. Como es complicado tenerlos todos, con varios de ellos y muchas ganas de aprender, también sería factible. Escríbenos
Echa un vistazo a nuestros entornos Lab en Big Data y Business Intelligence "
- DATA SCIENTIST
- Recomendable:
- Teoría de analítica de datos (estadística descriptiva, análisis de correlacion, reduccion de la dimensionalidad (PCA), regresión, etc.) , series temporales (estacionalidad, tendencia, predicciones, modelo ARIMA, etc.) y regresión (regresión lineal, algoritmos basados en árboles, etc.). También se valoraran conocimiento en técnicas de clasificación, clústering y sistemas de recomendación.
- Conocimientos matemáticos y estadísticos que permitan interpretar e implementar con facilidad los algoritmos anteriores.
- Experiencia demostrable en el uso de una o más de las siguientes tecnologías:
- R desde RStudio, Jupyter, …
- Python con Pandas, Scikit, TensorFlow….
- Spark (en Scala o Python) con MLIB, R,…
- Conocimiento medios de bases de datos y del lenguaje SQL:
- Consultas analíticas con group by, joins, funciones de resumen (ej. Sum, count,…)
- Consultas de creación de tablas y carga/actualización de los datos de las mismas (INSERT, UPDATE…)
- Experiencia en el uso de alguna base de datos conocida (MySQL, PostgreSQL , SQLServer, Oracle,…)
- Modelado relacional. (interpretación de esquemas de bases de datos)
- Conocimiento de programación en alguna de las siguientes tecnologías
- Scala
- Python
- Otras tecnologías de programación también se valoraran.
- Deseable. Además de lo anterior se valoraran:
- Conocimientos de Business Intelligence
- Data Warehousing
- Modelos de datos multidimensionales (esquemas estrella o copo de nieve)
- Conocimientos teorico-prácticos de Big Data y el entorno Hadoop. Se valoraran conocimientos en:
- Spark (Spark SQL, RDD, streaming, mlib, R,…)
- Hive
- Zeppelin
- Sqoop
- Kafka
- Otros: HDFS, Map Reduce, Flink, Elasctic-Search,….
- Conocimiento de herramientas de Business Intelligence:
- Servidor BI: Power BI, Pentaho, Tableau, Microstrategy,…
- Procesos ETL: Pentaho, Talend, SSIS…
- Experiencia en empresa en las habilidades y herramientas anteriores.
- BIG DATA ENGINEER
- Recomendable:
- Conocimientos de Business Intelligence
- Data Warehousing
- Modelos de datos multidimensionales (esquemas estrella o copo de nieve)
- Procesos de extracción, transformación y carga de datos (ETL)
- Experiencia demostrable en Big Data y el entorno Hadoop. Especialmente en las siguientes tecnologías:
- Hive o Impala
- Spark (Spark SQL, Streaming,..)
- Gestión del clúster (Ambari, Cloudera Manager, configuración manual Hive, Spark, Hadoop…)
- Otros que también se valoraran : HDFS, Map Reduce, HBase, Kafka, Kylin, Druid, Flink, Elasctic-Search ….
- Manejo de una o más herramientas de Business Intelligence:
- Servidor BI: Power BI, Pentaho, Tableau, Microstrategy,…
- Procesos ETL: Pentaho, Talend, SSIS…
- Conocimiento de bases de datos y del lenguaje SQL:
- Consultas analíticas con group by, joins, funciones de resumen (ej. Sum, count,…)
- Consultas de creación de tablas y carga/actualización de los datos de las mismas (INSERT, UPDATE…)
- Experiencia en el uso de alguna base de datos conocida (MySQL, PostgreSQL , SQLServer, Oracle,…)
- Modelado relacional. (interpretación de esquemas de bases de datos)
- Experiencia en empresa en las habilidades y herramientas anteriores.
- Deseable. Además de lo anterior se valoraran:
- Teoría de machine learning (técnicas regresión, clasificación, clustering, …)
- Conocimientos matemáticos y estadísticos que permitan interpretar e implementar con facilidad los algoritmos anteriores.
- Conocimiento teórico prácticos en el uso de una o más de las siguientes tecnologías:
- R desde RStudio, Jupyter, …
- Python con Pandas, Scikit, TensorFlow….
- Spark (en Scala o Python) con MLIB, R,…
- Conocimientos de programación en alguna de las siguientes tecnologías
- Scala
- Python
- Otras tecnologías de programación también se valoraran.