Математики створили метод аналізу літературних стилів

3 травня 2012, 10:17
💬 0
👁 79

Математики створили метод аналізу літературних стилів і склали схему взаємного впливу письменників на основі вживання ними службових слів.

Виявилося, що різноманітність стилів із часом зростає із швидкістю, що збільшується. Робота опублікована в журналі Proceedings of the National Academy of Sciences, її короткий зміст наводить New Scientist.

Тексти 537 англійських авторів, що жили, починаючи з 1550 року і створили як мінімум п'ять творів, дослідники почерпнули в електронній бібліотеці "Гутенберг".

У якості маркера літературного стилю математики використовували характерні особливості вживання письменниками службових слів. Ці слова (такі як to, than, it, if, but, do, be і так далі) служать для граматичного зв’язку речень і включають в себе артиклі, прийменники, допоміжні дієслова. Використання тільки службових слів в аналізі дозволило порівнювати між собою твори різних жанрів, які сильно відрізняються між собою лексично.

Всього було проаналізовано вживання 307 слів. При цьому автори не враховували контекст, до того ж не розділяли різні слова з однаковим написанням.

Для кожного письменника дослідники виділяли найбільш статистично значущі подібності в стилі між певним  автором та його колегами, і будували графу взаємних впливів.

Як дослідники й очікували, виявилося, що на літературний стиль авторів текстів найбільше впливав стиль їх безпосередніх попередників. Несподіваним було те, що різноманітність індивідуальних стилів  збільшується із часом стрімкими темпами.

Дослідники пояснюють це тим, що раніше кількість текстів була порівняно невеликою, і велика частина з них прочитувалася всіма членами літературного цеху, таким чином, розміщуючи письменників в єдине "стилістичне поле". У міру того, як число творів збільшувалася, літераторам доводилося вибирати для читання окремі тексти, які складали все меншу частку від загального обсягу, що викликало фрагментацію літератури, яка розширяється стилістично.

Нещодавно за допомогою подібних методів статистичного аналізу лінгвісти встановили, що, незважаючи на активний словотвір, викликаний настанням епохи інтернету, загальний обсяг сучасних мов скорочується. Це відбувається через те, що поява нових слів не встигає компенсувати втрату старих.

Раніше вчені з Корнельського університету сформулювали кілька відмінних ознак популярних цитат із фільмів. У рамках дослідження вчені взяли 1000 відомих цитат із фільмів. Після цього вони підібрали схожі за довжиною фрази персонажів і провели серед добровольців тест, в якому пропонували вгадати, яка із фраз − відома, а яка − проста цитата з кіно. У 75 відсотках випадків учасники експерименту вгадували відому фразу.

ТЕГИ: наука математика література книги