TodoBI - Business Intelligence, Big Data, ML y AI TodoBI - Business Intelligence, Big Data, ML y AI

Resumen del 3º Pentaho Developers en Portugal


Como ya os habíamos adelantado hace unos días (donde incluimos un resumen de tips&tricks de Pentaho), se iba a celebrar este pasado fin de semana en Cascais (Portugal) la tercera edición del Pentaho Developers, y que como en las dos ocasiones anteriores ( Mainz y Barcelona ), ibamos a acudir. Definitivamente, hemos sido la única empresa española que ha estado en las tres ediciones.

Así fué, y os dejamos un extracto de lo más interesante que allí pasó. Viendo la agenda y los ponentes, la cosa pintaba muy bien:
Este año ha sido el año de la comunidad. Si bien el año pasado fué el año de los nuevos desarrollos de pentaho este ha sido el de las aportaciones de la comunidad y como nosotros trabajamos con pentaho.
Las estrellas indudablemente han sido Kettle y el ecosistema que aporta webdetais con su CDF, CDA, CDE y CCC

El evento empezó a las 10h15 con Dough Moran presentando el evento, a nuestros anfitriones, webdetails y ofreciendonos un recuerdo en forma de camiseta del acontecimiento.

A continuació habló WebDetaeils sobre el Comunity Data Acces. Funcionalidades y características. Un desarrollo muy interesante y recomendable a todos aquellos que utilizeis CDF ya que devuelve las conexiones y las consultas al lado del servidor.
Posteriormente vino Julian Hyde , recordando lo que fué el evento del año pasado y las novedades mas importantes que vienen este. Olap4j 1.0 y La transición y novedades de Mondrian 4.
Orientación a atributos, cubos con múltiples tablas de hechos, validación de los esquemas, y write back is comming!!!
As far as transition to Mondrian 4.0 is concerned, Julian says it won't be easy, but Mondrian will remain backwards compatible towards version 3. Workbench will need a rework due to the modifications in Mondrian, that is if Pentaho wants to keep workbench. But there are other options. Agile BI or the Metadata Editor might be extended to serve the purpose.
The decision hasn't been made yet. A long beta process is foreseen.


Tras eso vino Matt Casters .
11h39 - Matt Casters - Dynamic ETL / Metadata Injection

Y si digo que ha sido el año de kettle no es sólo por las novedades que ha aportado Matt sinó por el número de ponencias que se hicieron alrededor de kettle.
Además Matt también estaba presente como colaborador de algunos de los proyectos de los que hablaremos después.
A continuación vino 12h00 - Aaron Philips (@phytodata)
Desarrollador de Pentaho que nos estuvo explicando la orientación que está dando al servidor BI de Pentaho y que se traduce en que el servidor está convirtiendose en una especie de servidor de aplicaciones mas que en una aplicación monolítica permitiendo así añadir tantos plug-ins como queramos CDA,CDF, incluso ha desarrollado un plugin que pemite utilizar
GROOVY en vez de xactions como disparador.
Muy muy interesante y muy lleno de contenido que requiere que tengamos que leernos la presentación que hizo atentamente para no perdernos nada.

A continuación, otra vez Webdetails y un CD...
12h30 - Nelson Sousa - CDE (Community Dashboard Editor)
Me muero por poner mis manos sobre el CDE nuevo!!!!!
Muy interesante la presentación de la nueva versión del CDE. Presentan un Editor de cuadros de mandos, aunque con un marcado carácter técnico, muy útil y funciona. Ciertamente un gran avance.
Además el CDE agrupa y hace uso de todos los demás proyectos de Webdetails (CDF,CDA,CCC)

14h30 - Tom Barber and Paul Stoellberger - PAT (Pentaho Analysis Tool)
A continuación vinienron Tom y Paul.

Paul comenta que PAT 1.0 está CASI listo. Hace tiempo que han dejado de implementar nuevas funcionalidades y en la actualizad tan sólo está arreglando bugs. Este proyecto tan prometedor y tan esperado por la comunidad está ya en proceso de consolidación para poder entrar en
producción como proyecto estable. Una pena para los que lo esperamos con impaciencia. Por eso os animamos a problarlo y a informar de vuestras experiencias. A informar de todos los bugs que encontreis.
http://prezi.com/bjk1vpidxwgl/pat/
Tras Paul Tom propuso una discusión sobre BI colaborativo.
After Paul concluded, Tom presented PAT ideas on modular and collaborative BI with OSGI. The original idea was to work around collaborative BI only, but the ideas have expanded, ... and remain mostly only ideas for now. However the baseline idea is that currently
Pentaho doesn't support collaboration in any way. The CDF has the possibility to insert some comments, and of course you can mail report links etc, but that is about where it ends. So the idea is to build this in using OSGI, a module system for Java allowing you to install new
modules without stopping or rebooting the server. Next thing Tom starts of a demo on some of the basic features of making 'PAT RESTfull'.


Jan Aertsen and Matt Casters - KFF (Kettle Kitchen Factory)
http://www.kjube.be/presentations/PCG10_JanAertsen.pdf
Una de las presentaciones mas interesantes. Ciertamente es algo que vamos a integrar INMEDIATAMENTE.

Y de que hablaron? pues de que, los procesos ETL son todos mas o menos iguales y en todos se debe integrar un sistema de registro. Por lo que han desarrollado un plugin para kettle que automatiza ese proceso de registro y nos proporciona un entorno de trabajo ya pre-configurado.
Además de incluir soporte para metadados de proyecto para múltiples proyectos. Ciertamente MUY MUY útil e interesante.
Además viene con una sexy azafata!!!!!

Nuno Moreira - Pentaho Dashboards, breaking barriers
Hablando de cosas sexy... Nuno hizo la mas sexy de las presentaciones.
Una exposición de intenciones de lo que debería ser un dashboard magnífica.


Tras eso Otra demostración de la fantasitca organización que hicieron Pedro y webdetails. Café y Madalenas corporativas del evento.

Jos van Dongen (aka Jos von Dongen, aka Grumpy) - Data mining
Presentó el dataminig de una forma muy interesante y entendible.
Realmente útil para acercarse a weka sin miedo.


16h30 - André Simões - PDI job/transformation framework
André Simões, aka ITXpander, aka 'The useless guy on IRC', talks about an ETL framework including ETL chaining, ETL scheduling, building in check points and making self-contained ETL processes to ensure restartability, etc. Great stuff. A merger between this and KFF has been decided on the spot. A clear indication that there is a need for this kind of utilities.
Presentó su "entorno de desarrollo de kettle" se solapó un poco con kettle fanchaising y quedó un poco deslucido por esto mismo, pero confirma que todos tenemos los mismos problemas y los afrontamos de formas parecidas.
Estuvieron hablando después que hacer un merge de proyectos. Quien sabe.
Puede ser interesante.


17h00 - Pedro Alves - CCC (Community Charting Components)
Pedro explored 20 charting libraries to see which one was the best to add to Pentaho as the existing charting is crap. He toyed with the idea to write a charting metadata layer allowing to plug-in all existing charting layers, but that idea was quickly tossed aside as it would add
to much layers of complexity.
So he backed out and thought about what users want. Users don't care about the library you use for charting, they just want that you can create the visualizations they need. So he looked for a visualization library rather than a charting library, being protovis. On top of this, Pedro started developing CCC (Community Charting Components), a charting library based on protovis. This allows you to always go back to the visualization library and make/adjust your chart as you want.

Muy interesante. Otra vez mas demuestran su buen hacer. Sólo falta que funcione en IE correctamente pero todo el mundo confia en que funcionará.


17h30 - Roland Bouman - Kettle Cookbook [presentation]
Roland elaborates on dominant users, positive eating experiences, having the guts, communism and Mao's manual which brings him straight to the kettle-cookbook.
Otra vez mas sobre kettle, otra vez mas algo que vamos a adoptar
IMMEDIATAMENTE. Documenta! Documenta! Documenta!.
Roland nos proporciona una utilidad para documentar nuestros procesos etl de marera excepcionalmente simple y útil.
Si no documentas es porque no quieres.


Para ver más fotos del evento .
Seguimiento (en inglés) de Jan Aertsen .