- Introducción
- Niveles del lenguaje.
- Tareas de Procesamiento de Lenguaje y Recuperacion de información
- Paradigmas de PLN : lingüistico, estadístico.
- Modelos de representación de la informacion no estructurada:
- Corpora y esquemas de anotación.
- TF-IDF, BM-25, modelos de lenguaje, n-gramas.
- Clasificación y clustering de textos.
- Nociones prácticas de buscadores, crawling y scraping.
- Extracción de información:
- Extraccion de entidades
- Extracción de relaciones y eventos
- Linked Data
- Análisis de sentimiento.
- Visualización de información textual.
Distribución en sesiones: SESION 1: 1, 2, 3 + ejercico práctico clasificación de texto SESION 2 : 4, 5 + ejercicio práctico de extracción e indexación de contenido SESION 3 : 6, 7 + ejercicio práctico de análisis de sentimiento y visualización