Por nuestra experiencia, es mucho más habitual la implementación y uso del resto de módulos de Pentaho: ETL, Mondrian, Report Desginer, Pentaho Metadata, Dashboards que el uso de la minería de datos. Sin embargo, su potencial es enorme y su integración con Kettle cada vez mayor. En otras ocasiones ocurre que las organizaciones indican necesitar Data Mining, cuando realmente, la necesidad suele estar centrada en Segmentaciones, comparativas, etc... que se pueden resolver con tecnología OLAP.
Por ello, el documento que os podéis descargar desde aquí , que muestra un update de la tecnología de Weka es realmente recomendable.
También podéis ver la documentación de la última versión de weka.