Los signos de puntuación en la literatura de los principales idiomas son algo curiosamente matemático.

Este artículo ha sido revisado de acuerdo con Science X’s proceso de edición
Y Políticas.
editores Resalta los siguientes atributos mientras aseguras la credibilidad del contenido:

Las funciones de riesgo representan la probabilidad de usar un signo de puntuación en función de la longitud de la secuencia sin estos signos. En cuanto a la puntuación, el idioma más transversal es el alemán (gráfico verde). Fuente: FIP PAN

Un momento de vacilación… Sí, deténgase aquí, pero ¿no debería haber una coma? ¿O sería mejor un guión? La puntuación puede ser una molestia; A menudo simplemente se descuida. ¡error! Los últimos análisis estadísticos pintan una imagen diferente: los signos de puntuación parecen «crecer» a partir de exponentes comunes a todos los idiomas (examinados), y sus peculiaridades están lejos de ser triviales.

Para muchos, la puntuación parece un mal necesario y debe ignorarse felizmente siempre que sea posible. Los análisis recientes de la literatura escrita en los principales idiomas actuales del mundo exigen un cambio de opinión. De hecho, las mismas características estadísticas de los patrones de uso de la puntuación se observan en varios cientos de obras escritas en siete idiomas, en su mayoría idiomas occidentales.

La puntuación, todo lo cual se encuentra en el prefacio de este texto, resulta ser un complemento universal e indispensable para la perfección matemática de cada idioma estudiado. Esta fascinante conclusión sobre el papel de las simples comas, los signos de exclamación o los puntos completos proviene de un artículo de científicos del Instituto de Física Nuclear de la Academia de Ciencias de Polonia (IFJ PAN) en Cracovia, publicado en la revista Nuclear Physics. Caos, solitones y fractales.

«Los análisis actuales son una extensión de nuestros hallazgos previos sobre las características de varias comas en la variación de la longitud de las oraciones en las obras de la literatura mundial. Después de todo, ¿qué es la longitud de las oraciones? No es más que la distancia hasta el siguiente signo de puntuación específico: todo el punto”, dice el profesor Stanislaw Drozdz (IFJ PAN, University of Krakow Tech).

Se estudiaron dos conjuntos de textos. Los principales análisis relacionados con la puntuación en cada idioma se realizaron en 240 obras literarias populares escritas en siete idiomas occidentales principales: inglés (44), alemán (34), francés (32), italiano (32), español (32), polaco (34). ), y ruso (32). . Esta selección específica de idiomas se basó en un criterio: los investigadores asumieron que al menos 50 millones de personas debían hablar el idioma en cuestión, y las obras escritas en él deberían haber recibido al menos cinco premios Nobel de Literatura.

READ  India falla en el desafío de datos de salud

Además, para la verificación estadística de los resultados de búsqueda, cada libro debe contener al menos 1.500 palabras consecutivas separadas por signos de puntuación. Se creó un grupo separado para monitorear la estabilidad de la puntuación en la traducción. Contenía 14 obras, cada una de las cuales estaba disponible en cada uno de los idiomas estudiados (sin embargo, se omitieron dos versiones de los 98 idiomas por falta de disponibilidad).

En total, los autores de ambos grupos incluyeron escritores como Conrad, Dickens, Doyle, Hemingway, Kipling, Orwell, Salinger, Wolf, Grasse, Kafka, Mann, Nietzsche, Goethe, La Fayette, Dumas, Hugo, Proust, Verne, Eco, Cervantes O Cinquewitch o Remont.

La atención de los investigadores de Cracovia se centró principalmente en la distribución estadística del espacio entre los signos de puntuación consecutivos. Pronto se hizo evidente que en todos los idiomas estudiados, se describía mejor mediante una de las variantes estrictamente definidas de la distribución de Weibull.

Una curva de este tipo tiene una forma característica: crece rápidamente al principio y luego, después de alcanzar un valor máximo, decrece algo más lentamente hasta un cierto valor crítico, por debajo del cual llega a cero con una dinámica pequeña y constantemente decreciente. La distribución de Weibull se usa generalmente para describir fenómenos de supervivencia (como la población en función de la edad), pero también varios procesos físicos, como el aumento del estrés material.

«El ajuste entre la distribución de las longitudes de las secuencias de palabras entre los signos de puntuación y la forma funcional de la distribución de Weibull fue mejor cuantos más tipos de signos de puntuación incluimos en los análisis; para todos los signos se encontró que el ajuste era casi perfecto. Al mismo tiempo, tiempo, aparecen algunas diferencias en las distribuciones entre idiomas Sin embargo, esto no es más que una elección de valores ligeramente diferentes de los parámetros de distribución, específicos del idioma en cuestión.La puntuación parece ser una parte integral de todos los idiomas estudiados», señala el Prof. Drozdz.

READ  Los científicos dicen que los rayos de neutrones pueden ayudar a revelar la desconcertante "quinta fuerza" de la naturaleza

Después de un momento, lo agrega con cierta diversión: «… y dado que la distribución de Weibull se ocupa de fenómenos como la supervivencia, se puede decir sin muchas palabras en la mejilla que la puntuación, por su propia naturaleza, implica una lucha real por la supervivencia. »

La siguiente etapa de los análisis consistió en identificar la función de riesgo. En el caso de la puntuación, describe cómo cambia la probabilidad condicional de éxito, es decir, la probabilidad del siguiente signo de puntuación, si no aparece tal marca en la secuencia analizada.

Los resultados aquí son claros: el idioma con menor tendencia a utilizar signos de puntuación es el inglés, no muy lejos del español; Las lenguas eslavas demostraron ser las más dependientes de los signos de puntuación. Las curvas de función de riesgo para los signos de puntuación en los seis idiomas estudiados parecen seguir un patrón similar, se diferencian principalmente en el desplazamiento vertical.

El alemán resultó ser la excepción. Su peligrosa función es la única que cruza la mayoría de las curvas diseñadas para otros lenguajes. Por lo tanto, la puntuación alemana parece combinar características de los signos de puntuación de muchos idiomas, lo que la convierte en un tipo de puntuación en esperanto.

La observación anterior es consistente con el siguiente análisis, que fue para ver si las características de puntuación de las obras literarias originales se pueden ver en sus traducciones. Como era de esperar, el idioma más fiel a la hora de cambiar los signos de puntuación del idioma original al idioma de destino resultó ser el alemán.

En la comunicación hablada, las pausas pueden estar justificadas por la fisiología humana, como la necesidad de recuperar el aliento o tomarse el tiempo para estructurar lo que se dirá a continuación en la mente. ¿Y en la comunicación escrita?

READ  Acabamos de obtener una mirada sin precedentes a los detalles de la división celular: ScienceAlert

«Crear una oración agregando una palabra tras otra mientras se asegura de que el mensaje sea claro y sin ambigüedades es un poco como tensar la cuerda de un arco: es fácil al principio, pero se vuelve más exigente con cada momento que pasa. Si no hay elementos de orden en el texto (es decir, el papel de la puntuación), la dificultad de interpretación aumenta cuanto más larga es la cadena de palabras. Un paréntesis demasiado estrecho puede romperse, y una oración demasiado larga puede volverse incomprensible. Usted se enfrenta a la necesidad de «liberar la flecha”, es decir, cerrar un pasaje de texto con algún tipo de signo de puntuación. Esta nota se aplica a todos los idiomas analizados, por lo que estamos ante lo que podríamos llamar una ley lingüística”, dice el Dr. Tomasz Stanisz (IFJ PAN), primer autor del artículo en cuestión.

Finalmente, cabe señalar que la invención de los signos de puntuación es relativamente reciente: los signos de puntuación no aparecían en absoluto en los textos antiguos. La aparición de patrones de puntuación óptimos en las lenguas escritas modernas puede explicarse, por tanto, como resultado de su desarrollo evolutivo. Sin embargo, una necesidad excesiva de puntuación no es necesariamente un signo de esta complejidad.

A la luz de los estudios anteriores, el inglés y el español, los dos idiomas más universales, parecen menos estrictos en cuanto a la frecuencia de puntuación. Es probable que estos idiomas se formalicen en términos de sintaxis para que haya menos espacio para que la ambigüedad se resuelva con la puntuación.

más información:
Tomasz Stanisz et al., Características universales versus específicas del sistema de patrones de uso de puntuación en los principales idiomas occidentales, Caos, solitones y fractales (2023). DOI: 10.1016/j.chaos.2023.113183

Proporcionado por el Instituto Henryk Niewodniczanski de Física Nuclear y la Academia de Ciencias de Polonia

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *