Нездоровые сенсации и неприличное слово

И ещё мало про Гугл, что имеется отечественное всё. В недрах Гугл Labs на свет появился замечательный сервис NGram, что выбирает громадную базу оцифрованных книг Гугл и разрешает распознать частоту фраз и употребления слов в книгах в различные исторические периоды. Хороший инструмент для критиков, нужно подметить.

Как в том месте было у Пушкина в “Онегине”?

“Но панталоны, фрак, жилет,
Всех этих слов на русском нет…”

Вот и давайте посмотрим, в то время, когда слово “жилет” употреблялось в русском языке (по версии Гугл) активнее всего:

График частоты потребления слова »жилет» в русском языке в течение последних двух столетий.

И что мы видим? Слово по большому счету входит в потребление лишь где-то в середине 1820-х годов. Сокращённый график прямо показывает на 1825-й, то есть в том году вышла в свет первая глава “Евгения Онегина”. Разумеется, неслучайное совпадение.

Ну, а сейчас о курьёзе, произошедшем с этим сервисом. Английские (да и не только) весёлые начали контролировать, в то время, когда и как довольно часто употреблялись различные нецензурные словеса. Особенно, конечно, известное четырёхбуквенное ругательство, начинающееся на букву f.

И вот тут произошло “исследователям” озадачиться: обнаружилось, что на XVII век приходится какой-то ужасный всплеск матершиныупотребления этого слова в английской литературе. Извольте видеть сами.

Казалось бы, в самый раз лингвистам и историкам приняться за вдумчивые изучения… Но достаточно скоро стало известно, что это неприятность не лингвистов и не историков, а программистов, разрабатывавших для Гугл инструментарий для распознавания текстов. Потому что они не учли ещё одного, древнего написания латинской буквы s в английском:

Предположительно фрагмент из некоего труда по медицине, говорящего о младенцах. В таком написании ‘s’ вправду легко спутать с ‘f’, особенно компьютерной программе.

Так s писалась лишь в начале либо в середине слова. В случае, если слово заканчивалось на эту букву, то она писалась привычным для современных людей образом. В Wikipedia имеется статья об этом.

Вот сборник статей, откуда забран фрагмент о кормлении грудных детей (на скриншоте), изобилующий словом suck (“сосать”), ошибочно принятый за совсем второе.

Так появляются нездоровые сенсации (c) Стругацкие.

Случайное видео:


Интересные записи: