Аналіз 5 мільйонів книжок дозволив Гарварду і Google дослідити феномен слави і мовні зміни за 200 років

Гарвард і Google заяляють, що вони розробили спосіб виявлення культурних тенденцій за останні 200 років, використовуючи базу даних у 5 мільйонів оцифрованих книг

Скільки слів в англійській мові не потрапили до словників? Як змінювалася природа слави  за останні 200 років? Як порівняти вплив науковців і акторів на масову культуру?

Такими є лише деякі з питань, які дослідники та представники громадськості можуть тепер розв’язати, використовуючи новий онлайн інструмент, розроблений Google за допомогою науковців Гарвардського університету. Величезна база даних, що її зібрав Google, підноситься як ключ до нової ери наукових досліджень в гуманітарних науках, лінгвістиці та соціології.

База даних налічує більше 5 млн. книжок – як художніх та науково-популярні – опублікованих у період між 1800 і 2000, що становить близько 4% всіх коли-небудь надрукованих видань. Д-р Жан-Батист Мішель і Д-р Ерез Ліберман Ейден з Гарвардського університету розробили пошуковий інструмент, який дасть дослідникам можливість дослідити кількісно величезний спектр культурних тенденцій в історії.

В результаті першого аналізу бази даних, вчені виявили, що близько 8500 нових слів з’являються у англійській мові щороку, і лексикон виріс на 70% між 1950 і 2000 роками. Але більшість з цих слів не з’являються в словниках. “За нашими оцінками, 52% англійського лексикону – більшість слів, що використовуються в англійських книгах – складаються з лексичної “темної матерії” незареєстрованих у словниках” – зазначили вони у журналі  “Сайєнс”

Команда також досліджували зміни природи слави протягом останніх двох століть. Дивлячись на частоту згадки імен відомих людей у літературі, вони показали, що знаменитості, які народилися в середині 20-го століття, як правило, досягли більшої відомості і у молодшому віці, ніж у 19-му столітті, але їхня слава тривала протягом коротшого періоду часу. До 1950 року, знаменитості досягали слави, в середньому, у 29 років, у порівнянні з 43-ма роками для знаменитостей ЗЩКоманда також досліджували зміни природи слави протягом останніх двох століть. Дивлячись на частоті імен відомих людей у літературі, вони показали, що знаменитості народилися в середині 20-го століття, як правило, молодший і більш відомим, ніж у 19-го століття, але їхня слава тривала протягом більш короткого періоду часу. До 1950 року, знаменитості були досягнення слави, в середньому, коли вони склали 29, у порівнянні з 43 для знаменитостей близько 1800 року. “Люди стають все більш знаменитим, ніж коли-небудь раніше”, пишуть дослідники, “але в даний час забутий швидше, ніж будь-коли.”

Ґардіан