Documento de Seth Grimes sobre Text Analytics
Text Analytics es una area de la Información empresarial no muy tenida en cuenta hasta hace poco. Sin embargo, desde aquí consideremos que los nuevos desarrollos tecnológicos hacen que podamos considerar el Text analytics, como una parte de la Inteligencia de Negocio.
Basicamente, se trata de un proceso de extracción de información de fuentes no estructuradas (como pueden ser documentos, webs, etc...) y ponerlas a disponsición de sistemas estructurados e integrados de análisis de la información. Lo que podría ser un Data Warehouse.
La dificultad de escanear grandes cantidades de documentos e información, utilizando un lenguaje natural y ponerlo a disposición de Bases de Datos estructurados es el gran desafío de estas tecnologías.
Por este motivo, TodoBI , ha decidido sponsorizar y ser Portal Oficial del European Text Anlytics Summit 2007 , que se celebrará próximanente en Amsterdam (26 y 27 de Abril)
Como aperitivo, mas que interesante del mismo, os dejo con un documento que ha escrito en exclusiva Seth Grimes (Altaplana) , uno de los grandes gurús en esto del Business Intelligence, que os podéis descargar gratuitamente desde aquí .
No os olvidéis de echar un ojo a la Agenda , muy enfocada a las experiencias de usuarios a lo largo de toda Europa.
Mas informacion sobre Text Analytics (links interesantes):
http://www.itl.nist.gov/iaui/894.02/related_projects/muc/ MUC
http://projects.ldc.upenn.edu/ace/ ACE (LDC)
http://www.itl.nist.gov/iad/894.01/tests/ace/ ACE (NIST)