Sabina en corpus presente (I): creación

Esta es la primera parte de un artículo sobre la creación y análisis básico de un corpus de letras de canciones. El artículo está planteado desde un punto de vista no técnico para un grupo de lectores amplio. La segunda parte aún no está publicada.

El pasado viernes me desperté con ganas de trastear un poco con corpus. Sin más razón que encontrármelo en los trending topic de Twitter, la pieza elegida para el despiece fueron las letras de la discografía de Sabina: en esta entrada explico el proceso de caza y los pasos que seguí hasta tener al mito preparado para ser abierto en canal.

Continuar leyendo “Sabina en corpus presente (I): creación”

Mehrabian y la regla del 7%-38%-55%

Quien más y quien menos todos nos hemos cruzado en algún momento con una gráfica de colores vivos sobre la «regla», sobada hasta la saciedad, del 7%-38%-55%. Basados en dos estudios de Albert Mehrabian de 1967 sobre comunicación no verbal, estos dibujos tan resultones (casi siempre hechos con el asistente de Word) defienden que solo un 7% de la comunicación cara a cara corresponde a las palabras pronunciadas, un 38% a la voz o al tono empleado y un 55% al lenguaje corporal.

Las dos publicaciones de Mehrabian son, probablemente, las más citadas —que no leídas— en el mundo de la comunicación. Desde que tener un blog es gratis e Internet se ha convertido en las aguas internacionales de Marketing SchoolsBusiness Communication Consultants, SEO Experts y blogs personales de Leadership and Rethoric Masters que se roban el contenido entre sí, las banderas piratas ya no tienen calaveras sino gráficos de sectores con el 7%-38%-55% que esconden artículos clónicos sobre la importancia de mover las manos y jugar con el tono para captar la atención del auditorio. Total, da igual lo que digas, el ¡93%! del éxito en tu comunicación viene determinado por elementos no gramaticales independientes del idioma que utilices. Seguro que interpretando un mantra budista con el tono correcto y una expresión corporal adecuada puedes explicar todas tus movidas sobre Product Placement. De hecho, es probable que un mimo lo hiciera mejor que tú

Continuar leyendo “Mehrabian y la regla del 7%-38%-55%”

El Corpus Escolar Sincrónico de Madrid (CESM)

El Corpus Escolar Sincrónico de Madrid (CESM) nace del trabajo final de la asignatura Herramientas Informáticas Orientadas al Conocimiento y Enseñanza del Español, impartida en el curso 2015/2016 como parte del programa de grado de Filología Hispánica en la Universidad Complutense de Madrid por Irene Gil Laforga.

Yo he venido a hablar de mi libro, que diría aquel (y, quince días después, ya iba siendo hora). Esta entrada es una breve introducción al mío. Se llama CESM, y pretende ir un poco más allá: al menos, tanto como dure la paciencia.

Continuar leyendo “El Corpus Escolar Sincrónico de Madrid (CESM)”

Humanidades digitales: ¿qué son y cuál es su situación en España?

En los últimos meses he escuchado no pocas veces la misma pregunta: ¿Qué son las humanidades digitales? La duda parece la continuación natural de aquella otra que todo filólogo ha escuchado alguna vez: ¿Y eso que estudias, para qué sirve?

La vacilación es comprensible: en el día a día no pensamos cómo la informática podría ayudar a comprender un óleo de principios del siglo XVI, la expansión histórica de una ciudad o la construcción de una catedral. No se nos educa para ello y, sin embargo, hacemos uso de herramientas parecidas con normalidad.

Continuar leyendo “Humanidades digitales: ¿qué son y cuál es su situación en España?”

print (“¡Hola, blog! Otra vez.”);

Tengo el saludo menos original del mundo.

Bienvenidos:

Este espacio nace para documentar el proceso de diseño, construcción y análisis de un corpus lingüístico digital. Pretendo, durante los meses que dure el proyecto, recoger y compartir por aquí toda la información que me resulte útil, e ir elaborando con ello una referencia que facilite programar y explotar un corpus sin tener los conocimientos técnicos que se esperan en la poquísima bibliografía actual.

Continuar leyendo “print (“¡Hola, blog! Otra vez.”);”