Математична досконалість. Польські вчені виявили дивовижні подібності в різних мовах

Математична досконалість. Польські вчені виявили дивовижні подібності в різних мовах

Тексти німецькою, англійською, польською, російською, французькою, іспанською та італійською мають дещо спільне (Фото:Kiwar/Depositphotos)

Дослідники з Польської академії наук з’ясували, що розділові знаки в текстах англійською, німецькою, французькою, італійською, іспанською, польською та російською мовами розташовуються відповідно до розподілу Вейбулла.

.

Вибір мов був невипадковим. Учені підбирали ті з них, якими розмовляє щонайменше 50 млн осіб, а написані ними літературні твори мають отримати щонайменше п’ять Нобелівських премій.

Визначившись із мовами, науковці приступили до відбору літератури. Головним критерієм стало те, що книжка має містити щонайменше 1500 послідовностей слів, розділених розділовими знаками.

.

У результаті було відібрано твори Конрада, Діккенса, Дойля, Хемінгуея, Кіплінга, Орвелла, Селінджера, Вульф, Грасса, Кафки, Манна, Ніцше, Ґете, Лафайєта, Дюма, Гюго, Пруста, Верна, Еко, Сервантеса, Сенкевича.

Проаналізувавши їхні тексти, вчені виявили послідовність у розташуванні розділових знаків. Вони створили її модель і з’ясували, що вона описується кривою Вейбулла.

Розподіл Вейбулла в теорії ймовірностей — двопараметричне сімейство абсолютно безперервних розподілів. Цю функцію застосовують у безлічі галузей науки: статистиці, інженерії, електротехніці, метеорології, гідралогії та інших.

Дослідники були здивовані своїм відкриттям, оскільки не очікували, що відповідність відомої математичної функції буде такою точною для різних мов. Вони продовжили своє дослідження, щоб з’ясувати, наскільки сильний вплив на сенс написаного має пунктуація.

Виявилося, що найменш залежною від розділових знаків була англійська мова. Лінгвістів це не надто здивує. Як і те, що слідом за нею йде іспанська, для якої велика кількість крапок і тире теж нехарактерна.

.

Найбільш залежними від розділових знаків виявилися слов’янські мови: російська та польська.

.