¿Cómo inventar palabras?

Teclado

Ayer vi un video que me ha hecho reflexionar (es decir, más de lo habitual) sobre las palabras. De acuerdo con ese video de Michael Stevens, casi en cualquier texto y en todos los idiomas: la segunda palabra más usada se utiliza la mitad de veces que la más utilizada, la tercera 1/3 de veces respecto de la más frecuente y así sucesivamente[1] (fenómeno conocido como ley de Zipf). Por ello, el 18% de las palabras más usadas aparece un 80% de ocasiones [2]; una distribución que no ocurre únicamente en el lenguaje, sino en una gran cantidad de situaciones y circunstancias. [3]

Una distribución según la ley de Zipf (/ˈzɪf/) es una distribución probabilística discreta [4] que pretendió explicar, para el caso del lenguaje, el lingüista estadounidense George Kingsley Zipf (de ahí el nombre) en su libro “El comportamiento humano y la ley del mínimo esfuerzo”. Aquí es debido puntualizar que la ley de Zipf es más compleja que como se menciona aquí.

Siguiendo la reflexión del video, por otra parte, puede fabricarse una mayor cantidad de palabras largas que cortas. Entre más letras se utilizan, hay más opciones para formar una nueva palabra.

En español hay 27 letras:

1a, 2b, 3c, 4. d, 5. e, 6. f, 7. g, 8. h, 9. i, 10. j, 11. k, 12. l, 13. m, 14. n, 15. ñ, 16. o, 17. p, 18. q, 19. r, 20. s, 21. t, 22. u, 23. v, 24. w, 25. x, 26. y, 27. z.

Así que, podría haber veintisiete palabras de una sola letra pero 27×27  palabras de dos letras y 27x27x27 (27³) palabras de tres letras. Aún así, las palabras cortas son más frecuentes que las largas, ¿por qué? Una posible explicación puede ser una tendencia natural a buscar el menor esfuerzo (como postuló Zipf), pero otra posibilidad (especialmente para el caso del lenguaje) podría ser, como menciona Michael Stevens en el video, simplemente por azar (postulado de Benoît Mandelbrot). ¿El lenguaje (en general) ha sido inventado asignando combinaciones de sonidos y letras a sus significados al azar, o es fruto del esfuerzo —hasta cierto punto— consiente por parte de hablantes y oyentes y escritores y lectores por encontrar un sistema que implique el menor esfuerzo posible para todos? Tal vez sea un poco de las dos y quizás nunca lo sepamos.

Algo de diversión

¿Que tanto se utiliza la palabra «ventisca»? Según lexicoon, aparece en el lugar número 23.533 de los términos más usados y se emplea principalmente en España y Perú (tiene sentido). Mientras que «palabra» se utiliza mucho más frecuentemente y ocupa el lugar 767. La palabra «de», desde luego, se ocupa con aún mayor frecuencia: ocupa el 8° lugar en la lista confeccionada por lexicoon.

En la literatura

El tema de la construcción y de la cantidad de palabras y letras en el lenguaje no sólo es objeto de estudios académicos, también ha sido una fuente de inspiración para la literatura. Una muestra: el cuento La Biblioteca de Babel de Jorge Luis Borges.

En su cuento, Continúa leyendo ¿Cómo inventar palabras?