Sabina en corpus presente (I): creación

Esta es la primera parte de un artículo sobre la creación y análisis básico de un corpus de letras de canciones. El artículo está planteado desde un punto de vista no técnico para un grupo de lectores amplio. La segunda parte aún no está publicada.

El pasado viernes me desperté con ganas de trastear un poco con corpus. Sin más razón que encontrármelo en los trending topic de Twitter, la pieza elegida para el despiece fueron las letras de la discografía de Sabina: en esta entrada explico el proceso de caza y los pasos que seguí hasta tener al mito preparado para ser abierto en canal.

Continuar leyendo “Sabina en corpus presente (I): creación”

El Corpus Escolar Sincrónico de Madrid (CESM)

El Corpus Escolar Sincrónico de Madrid (CESM) nace del trabajo final de la asignatura Herramientas Informáticas Orientadas al Conocimiento y Enseñanza del Español, impartida en el curso 2015/2016 como parte del programa de grado de Filología Hispánica en la Universidad Complutense de Madrid por Irene Gil Laforga.

Yo he venido a hablar de mi libro, que diría aquel (y, quince días después, ya iba siendo hora). Esta entrada es una breve introducción al mío. Se llama CESM, y pretende ir un poco más allá: al menos, tanto como dure la paciencia.

Continuar leyendo “El Corpus Escolar Sincrónico de Madrid (CESM)”

Humanidades digitales: ¿qué son y cuál es su situación en España?

En los últimos meses he escuchado no pocas veces la misma pregunta: ¿Qué son las humanidades digitales? La duda parece la continuación natural de aquella otra que todo filólogo ha escuchado alguna vez: ¿Y eso que estudias, para qué sirve?

La vacilación es comprensible: en el día a día no pensamos cómo la informática podría ayudar a comprender un óleo de principios del siglo XVI, la expansión histórica de una ciudad o la construcción de una catedral. No se nos educa para ello y, sin embargo, hacemos uso de herramientas parecidas con normalidad.

Continuar leyendo “Humanidades digitales: ¿qué son y cuál es su situación en España?”

print (“¡Hola, blog! Otra vez.”);

Tengo el saludo menos original del mundo.

Bienvenidos:

Este espacio nace para documentar el proceso de diseño, construcción y análisis de un corpus lingüístico digital. Pretendo, durante los meses que dure el proyecto, recoger y compartir por aquí toda la información que me resulte útil, e ir elaborando con ello una referencia que facilite programar y explotar un corpus sin tener los conocimientos técnicos que se esperan en la poquísima bibliografía actual.

Continuar leyendo “print (“¡Hola, blog! Otra vez.”);”