Применение количественного анализа к классической литературе |
- Statistics
- Participants
- Translate into Russian
- Translation result
- Translation complete.
If you do not want to register an account, you can sign in with OpenID.
Applying Quantitative Analysis to Classic Lit | Применение количественного анализа к классической литературе | |
If Google has its way, all of English literature will one day exist as searchable digital text. Franco Moretti, a Stanford English professor, wants to be ready for the deluge with new kinds of questions and new tools to answer them — things like computational linguistics, data mining, computer modeling, and network theory. Moretti is already famous in bookish circles for his data-centric approach to novels, which he graphs, maps, and charts. Until recently, though, he’s been able to crunch only a few novels at a time, doing all that quantitative stuff by hand. Now he’s going digital, building searchable databases of old books, working to write software that can mine for patterns. Instead of diving deep into a few beloved titles, Moretti aims to zip across the creative output of entire eras. He calls it distant reading, and if his new methods catch on, they could change the way we look at literary history. | Если Гугл продолжит в том же духе, в один прекрасный день вся английская литература станет доступна для поиска в цифровом виде. Франко Моретти, профессор английского языка в Стэнфорде, хочет подготовиться к этому потопу, имея в запасе новые вопросы и новые способы ответа на них — такие, как вычислительная лингвистика, анализ данных, компьютерное моделирование и теория сетей. Моретти уже известен в книжных кругах своим аналитическим подходом к романам, которые он представляет в виде графов, карт и диаграм. Однако, до недавнего времени, он имел возможность обрабатывать только несколько романов за раз, делаю всю эту вычислительную работу собственными руками. Теперь он переходит к цифровой работе, создавая базы данных старых книг с поиском по ним и работая над созданием программ, которые позволят ему находить взаимосвязи. Вместо глубокого погружения в несколько любимых книг, Моретти хочет просканировать всю литературу с начала времен. Он называет это удаленным чтением, и если его новые методы сработают, они могут изменить наш взгляд на историю литературы. | |
Take one experiment. Moretti decided to test the idea that Victorian writers, through their choice of adjectives, might reveal their belief that moral qualities were indivisible from reality itself and that physical traits reflected a person’s virtue. So he assembled a database of 250 novels and sent the file to computer scientists at IBM’s Visual Communications Lab, who turned the books into a series of word clouds. “Boom! There were exactly the adjectives I had hoped would pop up!” he says. “Adjectives like strong, bright, fair, in which the physical and the moral blend.” | Проведем эксперимент. Моретти решил проверить гипотезу о том, что выбор прилагательных викторианскими писателями может выявить их веру в то, что моральные качества были неотделимы от реальности как таковой и добродетели человека отражались в его внешнем виде. Итак, он собрал базу данных из 250 романов и послал файл ученым-компьютерщикам из Лаборатории визуальной коммуникации IBM, которые преобразовали тексты книг в облака слов. «Бинго! Всплыли именно те прилагательные, на которые я рассчитывал», — говорит он. «Прилагательные типа „сильный“, „яркий“, „чистый“, в которых физическое сочетается с моральным». | |
For another project, he looked at the titles of 7,000 books in 18th- and 19th-century England and discovered a correlation between shorter titles and the growth of the book publishing industry. (Moretti theorizes that more concise titles made books easier to promote in a crowded marketplace.) He is also working with a programmer to test new software that can “read” terabytes of obscure, mostly unread fiction and classify the books by genre. | Для другого проекта он исследовал названия 7 000 английских книг XVIII и XIX веков и обнаружил взаимозависимость между более короткими названиями и ростом издательской индустрии. (Моретти предположил, что более краткие заголовки делают книгу легче продаваемой на насыщенном рынке). Он также работает с программистом над тестированием новой программы, которая может «читать» терабайты невразумительных и в большинстве своём нечитаемых художественных произведений и классифицировать книги по жанрам. | |
“In 19th-century Britain, maybe 30,000 novels were published,” Moretti says. He is dying to analyze them all. It will be like peering through the first telescope, he says — surveying more literature at a glance than he could read in a lifetime. “We will get a sense,” he says, “of a much wider universe.” | «В Британии XIX века, было издано порядка 30 000 романов», — говорит Моретти. Он намерен проанализировать их все. «Это будет похоже на использование первого телескопа, — говорит он, — за раз можно изучить больше книг, чем прочитать за всю жизнь». По его словам, — «это даст нам ощущение ещё более бескрайней вселенной». | Comment was deleted |
© Wired.com © 2009 Condé Nast Digital.

Comment was deleted