El lenguaje es la mayor tecnología social desarrollada por la humanidad, capaz de reflejar en la mente el contenido de las historias que los propios hombres y mujeres elaboran y cuentan. El efecto de los idiomas en la configuración de los pensamientos ha sido durante mucho tiempo un tema controvertido. En 1969, Boucher y Osgood formularon la hipótesis de Pollyanna, que propone la existencia de un sesgo hacia la positividad en la comunicación humana.
Casi cinco décadas después, un equipo de investigadores de Estados Unidos y Australia ha podido confirmar esta hipótesis. En un trabajo publicado en la revista PNAS, han evaluado 100.000 palabras repartidas en 24 corpus de 10 idiomas diferentes en origen y cultura: español de México, francés, alemán, portugués de Brasil, coreano, chino, ruso, indonesio y árabe.
Las fuentes de estos corpus de palabras han sido varias: libros de Google Books, medios de comunicación como The New York Times, la red social Twitter, páginas web, subtítulos de televisión y de cine y letras de canciones musicales. Y en todos ellos se ha comprobado que las palabras alegres priman sobre las tristes.
Los investigadores, encabezados por Peter Sheridan Dodds de la Universidad de Vermont (Estados Unidos), apuntan que los resultados obtenidos prueban “una profunda huella de sociabilidad humana en el lenguaje”, lo que se refleja en que “las palabras del lenguaje humano natural poseen un sesgo hacia la positividad universal, en que el contenido emocional estimado de las palabras es consistente entre las lenguas bajo traducción, y en que este sesgo de positividad es independiente de la frecuencia de uso de las palabras”.
A partir de técnicas de minería de datos, el equipo de científicos localizó las 10.000 palabras más utilizadas en cada uno de los diez idiomas y seleccionó a nativos para que puntuaran en una escala de 1 a 9 puntos cada una de las palabras en función del optimismo que reflejaran, dando menos puntuación a las palabras negativas –como desgracia, muerte o cáncer– y más a las positivas –como cumpleaños, vida o sorpresa–.
En todos los corpus de palabras analizados se encontró un sesgo hacia lo positivo, aunque las mayores tasas se identificaron en las páginas web en español, los Google Books en español y Twitter en español, seguidas de las páginas web en portugués y Twitter en portugués. Las tasas más bajas se registraron, por el contrario, en las letras de las canciones en inglés, los subtítulos de las películas en coreano y los Google Books en chino.
A través de este método, los investigadores han desarrollado un hedonímetro, un sistema capaz de estimar la felicidad contenida en un texto escrito. El próximo objetivo será aplicar este método en otros lenguajes y en diferentes grupos demográficos.
En el trabajo han colaborado varios grupos de investigadores de la Universidad de Vermont (Estados Unidos), el Instituto Tecnológico de Massachusetts (Estados Unidos), la Universidad de Adelaide (Australia), la Universidad de Washington (Estados Unidos), la Universidad Cornell (Estados Unidos) y la Corporación MITRE (Estados Unidos).
Con información de la agencia Sinc.
A partir de técnicas de minería de datos se localizaron las 10.000 palabras más utilizadas en diez idiomas
Las fuentes de las palabras han sido Google Books, medios, Twitter, webs, subtítulos y letras de canciones