Google доплачує науковцям, що використовують його цифрову бібліотеку і пропонує новий інструмент для лінгвістів

Влітку компанія Google оголосила про те, що буде надавати фінансову підтримку фахівцям, які планують використовувати у своїй дослідницькій роботі оцифровані в рамках Google Books видання. Результати одного з подібних досліджень, яким займалися співробітники Гарвардського університету, було представлено в середині грудня. Подробиці описані в статті, опублікованій в журналі Science, а сервіс Ngram Viewer запропонований для використання всіма бажаючими.

Як повідомляють дослідники, базою для розробки нового сервісу стали 5,2 мільйона книг, написаних англійською, французькою, іспанською, німецькою, китайською та російською мовами та виданих починаючи з 1500 до 2008 року. Це приблизно третина всієї електронної бібліотеки Google і близько 4% з коли-небудь опублікованих книг. Вчені склали підбірку всіх використаних у цих виданнях слів (близько 500 мільярдів) і допрацювали алгоритм аналізу цього матеріалу на основі пошукової системи Google.

Тепер за допомогою Ngram Viewer будь-який бажаючий може з’ясувати популярність різних слів і фраз, які зустрічалися в книгах за останні 500 з лишком років. Інформація буде подана у вигляді графіків, а видання, в яких зустрілося шукане слово, в хронологічному порядку відстежуються безпосередньо по базі книг Google Books. Фрагменти в текстах будуть виділені, як і при традиційному пошуку по цій електронній бібліотеці. Область пошуку можна обмежити певним історичним періодом і конкретним мовою.

Автори та їх колеги вважають, що новий інструмент стане гарною підмогою для серйозних лінгвістичних досліджень. Однак широку інтернет-аудиторію нова «іграшка», як варто було очікувати, теж вельми зацікавила.

ПроБукс