Organizadores:
UNED
Tipo de actividad:
Curso
Fecha límite de solicitud:
Viernes, 30 diciembre, 2016
Descripción: 

El objetivo del curso es dotar a los investigadores de humanidades de los conocimientos básicos para realizar investigaciones de minería de textos (text mining), problemas de atribución de autoría, lingüística forense, procesamiento de lenguaje natural, modelado de temas (topic modelling) por medio de un lenguaje de programación libre y gratuito ampliamente empleado por la comunidad científica en diversos campos y materias, desde la estadística a la lingüística forense pasando por la filogénesis, bioestadística, análisis político, marketing… Este sistema permite el procesamiento automatizado de grandes cantidades de texto por ordenador, arrojando interesantes datos, que pueden representarse visualmente sobre cuestiones tan relevantes como las distintas manos o autores que intervienen sobre una obra, o la frecuencia de un determinado tipo de palabras o recursos estilísticos para tratar determinados temas. Se trata, sin duda, de una revolucionaria aproximación con enormes perspectivas dentro de la investigación en el ámbito hispánico de las humanidades que no se había planteado hasta hoy como reto.


Programa


- Introducción a R (instalación y primeros pasos)

- Calcular la frecuencia de palabras de un texto

- Análisis de la distribución de tokens en un texto

- Análisis de correlación

- Medir la variedad y riqueza léxica de un texto

- Cálculo de hapax

- Calidad del texto, variedad de textos y el XML

- Análisis de grupos (clustering)

- Clasificación

- Modelado de temas (topic modelling)


Ciudad: 
Madrid
País: 
España
Fecha de inicio: 
Sábado, 9 enero, 2016
Fecha de finalización: 
Miércoles, 31 mayo, 2017
Dirección postal completa: 
Curso en línea
Correo electrónico: 
29/09/2016 Congresos y cursos