Sabina en corpus presente (I): creación

Esta es la primera parte de un artículo sobre la creación y análisis básico de un corpus de letras de canciones. El artículo está planteado desde un punto de vista no técnico para un grupo de lectores amplio. La segunda parte aún no está publicada.

El pasado viernes me desperté con ganas de trastear un poco con corpus. Sin más razón que encontrármelo en los trending topic de Twitter, la pieza elegida para el despiece fueron las letras de la discografía de Sabina: en esta entrada explico el proceso de caza y los pasos que seguí hasta tener al mito preparado para ser abierto en canal.

Continuar leyendo “Sabina en corpus presente (I): creación”