spaCy es una librería de Python que permite construir aplicaciones de procesamiento de lenguaje natural (NLP). spaCy proporciona modelos preentrenados de diferentes lenguajes, lo cual junto a una sintaxis clara hace que sea ideal para principiantes en el campo de la NLP.
Además, permite crear modelos nuevos o reentrenar los modelos que proporciona con datos propios para entrenar los modelos en campos específicos. spaCy está orientado al uso de producción, proporcionando un framework para construir aplicaciones completas que requieran de procesamiento de lenguaje natural, a diferencia de otras librerías como TensorFlow que permiten experimentar con diferentes arquitecturas de redes neuronales o implementar los últimos modelos desarrollados. Además, spaCy es eficiente en CPU pese a utilizar modelos de redes neuronales. La velocidad y precisión de los modelos de spaCy son de los mejores en el mercado.
En este documento gratuito en español, que puedes descargar directamente, tienes toda la información para conocer los puntos claves de spaCy
Los modelos de spaCy de procesamiento de lenguaje natural permiten analizar un texto y extraer información tanto del texto como de las predicciones del modelo sobre su significado por el contexto. Son útiles por ejemplo para el análisis de artículos, de tweets, de páginas web… spaCy permite mucha personalización tanto en el entrenamiento de modelos como el añadir información al análisis del texto para crear aplicaciones a medida.