¿Cómo inventar palabras?

Teclado

Ayer vi un video que me ha hecho reflexionar (es decir, más de lo habitual) sobre las palabras. De acuerdo con ese video de Michael Stevens, casi en cualquier texto y en todos los idiomas: la segunda palabra más usada se utiliza la mitad de veces que la más utilizada, la tercera 1/3 de veces respecto de la más frecuente y así sucesivamente[1] (fenómeno conocido como ley de Zipf). Por ello, el 18% de las palabras más usadas aparece un 80% de ocasiones [2]; una distribución que no ocurre únicamente en el lenguaje, sino en una gran cantidad de situaciones y circunstancias. [3]

Una distribución según la ley de Zipf (/ˈzɪf/) es una distribución probabilística discreta [4] que pretendió explicar, para el caso del lenguaje, el lingüista estadounidense George Kingsley Zipf (de ahí el nombre) en su libro “El comportamiento humano y la ley del mínimo esfuerzo”. Aquí es debido puntualizar que la ley de Zipf es más compleja que como se menciona aquí.

Siguiendo la reflexión del video, por otra parte, puede fabricarse una mayor cantidad de palabras largas que cortas. Entre más letras se utilizan, hay más opciones para formar una nueva palabra.

En español hay 27 letras:

1a, 2b, 3c, 4. d, 5. e, 6. f, 7. g, 8. h, 9. i, 10. j, 11. k, 12. l, 13. m, 14. n, 15. ñ, 16. o, 17. p, 18. q, 19. r, 20. s, 21. t, 22. u, 23. v, 24. w, 25. x, 26. y, 27. z.

Así que, podría haber veintisiete palabras de una sola letra pero 27×27  palabras de dos letras y 27x27x27 (27³) palabras de tres letras. Aún así, las palabras cortas son más frecuentes que las largas, ¿por qué? Una posible explicación puede ser una tendencia natural a buscar el menor esfuerzo (como postuló Zipf), pero otra posibilidad (especialmente para el caso del lenguaje) podría ser, como menciona Michael Stevens en el video, simplemente por azar (postulado de Benoît Mandelbrot). ¿El lenguaje (en general) ha sido inventado asignando combinaciones de sonidos y letras a sus significados al azar, o es fruto del esfuerzo —hasta cierto punto— consiente por parte de hablantes y oyentes y escritores y lectores por encontrar un sistema que implique el menor esfuerzo posible para todos? Tal vez sea un poco de las dos y quizás nunca lo sepamos.

Algo de diversión

¿Que tanto se utiliza la palabra «ventisca»? Según lexicoon, aparece en el lugar número 23.533 de los términos más usados y se emplea principalmente en España y Perú (tiene sentido). Mientras que «palabra» se utiliza mucho más frecuentemente y ocupa el lugar 767. La palabra «de», desde luego, se ocupa con aún mayor frecuencia: ocupa el 8° lugar en la lista confeccionada por lexicoon.

En la literatura

El tema de la construcción y de la cantidad de palabras y letras en el lenguaje no sólo es objeto de estudios académicos, también ha sido una fuente de inspiración para la literatura. Una muestra: el cuento La Biblioteca de Babel de Jorge Luis Borges.

En su cuento, Borges imagina una biblioteca interminable que contiene un sinnúmero de libros, cada uno con cuatrocientas diez páginas de unas 3200 letras cada una. En esa vasta biblioteca ningún libro era igual a otro, por lo que la biblioteca contendría absolutamente toda ficción posible, al igual que toda crónica de la realidad, pero alrededor de una enorme cantidad de libros con sinsentidos resultado del azar (o, tal vez, coherentes en un idioma que nadie conoce o no se ha inventado aún).

Libros
Libros – Archivo Municipal de Burgos.

La creatividad de Borges y su inventiva para crear mundos que deleitan la imaginación y el intelecto era asombrosa. De hecho aquél relato no fue el único en el que disertó con ingenio y genio literario sobre el lenguaje y la formación de palabras (o mundos creados por palabras) como en Tlön, Uqbar, Orbis Tertius.

Jorge Luis Borges, L'Hôtel (París).
Borges, L’Hôtel

El filólogo y sus hablantes

Hay alguien más cuya prosa giró alrededor de la creación de palabras. Incluso sus personajes fueron inventados nada más para que sus lenguas tuvieran hablantes (aunque no fuesen reales). De hecho, alrededor de algo más que únicamente nuevas palabras: inventar lenguas.

Hablo, evidentemente, de J. R. R. Tolkien. Genio del lenguaje que no sólo inventó nuevas palabras, sino además idiomas nuevos -como el quenya (o kwenya) y el sindarín-. Las lenguas que inventó son elegantes y asombra que sean el resultado del trabajo de un sólo hombre; en tan solo casi medio siglo.

Ai laurie lantar lassi súrinen Yéni únótime ve rámar aldaron!
Dos primeras líneas del poema “Namárië” de J.R.R. Tolkien, usando las fuentes Tengwar Telcontar y Bitstream Vera Sans. Autor: TigerTjäder.

Tolkien afirmó más de una vez que la similitud de muchas de sus palabras con otras de idiomas reales, era fruto de coincidencias. A todas las palabras que inventó les otorgó un significado sin tomar nunca como referencia palabras existentes, en ningún idioma o dialecto. Pero los sonidos, y sus combinaciones para formar voces nuevas, son limitados; así que era de esperar que aparecieran similitudes casuales.

De esto podemos conjeturar una primera regla para la invención de palabras: debe partirse de fonemas básicos y difícilmente podrán evitarse sonidos y combinaciones que ya sean frecuentes en alguna lengua.

Nota: no pretendo enumerar reglas imprescindibles para la invención de palabras y desconozco si alguien ha intentado seriamente una empresa así. Simplemente expondré algunas pautas que, he llegado a suponer, son parte del quehacer de quien inventa palabras nuevas, sea cual sea su finalidad.

Pero por ahora ya es suficiente. Aunque el tema da para mucho más.

Tanto sobre Tolkien, como acerca de Borges, Zipf (y su  ley y más), Benoît Mandelbrot, el conteo de palabras (y su frecuencia en un texto),… etc. hay material suficiente para escribir —y de hecho ya se han escrito—  muchísimos libros. Baste por el momento la promesa de retomar el (los) tema(s) posteriormente en otras entradas.

Dejo aquí el video:

Palabras finales

Si creyeron que dejaría así está entrada, ¡se equivocaron! He aprovechado una herramienta en línea (y el editor de WordPress) para contar las palabras que aparecen aquí, ¿el resultado? 1167 palabras, [5] según el contador de WordPress. Como era de esperarse la palabra que más usé fue «de» (66 veces), seguida por «y» (35 veces) y «el» (34 veces). ¿Una distribución Zipf? ¡espero sus respuestas en los comentarios!


[1] Es decir, las palabras aparecen 1/el rango de frecuencia. O más exacta y  formalmente: P (k) ∝ 1/k^s (fórmula tomada de “¡Otra vez la ley de Zipf!”, Materia Blanda, Ángel Garcimartín Montero. Disponible en:
http://www.investigacionyciencia.es/blogs/fisica-y-quimica/9/posts/otra-vez-la-ley-de-zipf-10196 Consulta: 27/10/2015). El símbolo  significa

[2] Al menos en inglés: The Zipf Mystery, Vsauce (min. 4): https://youtu.be/fCn8zs912OE?t=4m51s. (Consulta: 26/10/2015).

[3] ¡Hasta en las partidas de ajedrez y la distribución de las ciudades! A) Bernd Blasius y Ralf Tönjes, noviembre 16, 2009, Phys. Rev. Lett., 103, 218701 (disponible en http://physics.aps.org/viewpoint-for/10.1103/PhysRevLett.103.218701 Consulta: 27/10/2015) B) Josep Roca Cladera y Blanca Arellano Ramos, “La distribución del tamaño de las ciudades, la ley de Zipf revisitada”, ACE, Año VI, núm.16, junio 2011. Disponible en http://upcommons.upc.edu/bitstream/handle/2099/10540/ACE_16_SE_27.pdf?sequence=9&isAllowed=y (consulta: 27/10/2015).

[4] Un poco más sobre esto: Distribuciones discretas de probabilidad, Ditutor, 2015. Disponible en http://www.ditutor.com/distribucion_binomial/distribuciones_discretas.html (consulta (10/10/2015).

[5] No tomé en cuenta las notas ni pies de foto (excepto en la cuenta total). Tomándolas en cuenta, en esta entrada «de» (77 veces) sigue siendo la más frecuente, e «y» (42) se utilizó más que «el» (37).

Anuncios

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s