Knigionline.co » Компьютеры » Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры

Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры - Эйден Эрец (2013)

Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры
  • Год:
    2013
  • Название:
    Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры
  • Автор:
  • Жанр:
  • Серия:
  • Язык:
    Русский
  • Перевел:
    Павел Миронов
  • Издательство:
    АСТ
  • Страниц:
    31
  • ISBN:
    978-5-17-088935-8
  • Рейтинг:
    0 (0 голос)
  • Ваша оценка:
Насколько бывают масштабны на самом деле «большие данные» – громадные массивы информации, о коих столько много ведутся обсуждения в последнее время? Вот наглядный пример: если выписать в одну линейку все цифры 0 и 1, из которых состоит один терабайт информации (вполне себе обыкновенная емкость для передового жесткого диска), то цепочка цифр окажется в пятьдесят раз длиннее, чем расстояние от нашей планеты до Сатурна! Однако, на «большие данные» абсолютно возможно взглянуть в человеческом измерении. Жан-Батист Мишель и Эрец Эйден это – языковеды и компьютерные таланты, разработчики обслуживания Гугл Ngram Viewer и термина «культуромика», демонстрируют, каким образом анализирование «больших данных» может помочь изучать сложные трудности языка, ситуации и культуры.

Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры - Эйден Эрец читать онлайн бесплатно полную версию книги

В древнеанглийском языке все 177 глаголов изначально были неправильными. К началу Средневековья, через четыре столетия, выжило лишь 145 неправильных форм; остальные 32 были приведены в соответствие с новыми нормами. В современном английском языке неправильными остались лишь 98. Остальные 79 глаголов до сих пор присутствуют в языке, однако, подобно глаголу melt («таять»), они изменили форму. При этом был заметен довольно примечательный дисбаланс. Из 12 наиболее часто встречающихся глаголов в нашем списке ни один не стал правильным – им удалось на протяжении 12 столетий сопротивляться давлению со стороны правила – ed. Нарушение пропорций шло и с другой стороны. Из 12 наименее часто использовавшихся глаголов в списке 11 стали правильными, в том числе bide («пребывать») и wreak («причинять»). Единственным выжившим неправильным глаголом с низкой частотой оказался slink («красться») – глагол, который как раз четко описывает этот тихий процесс исчезновения[66].

Данные показали: на человеческую культуру влияло нечто похожее на естественный отбор, оставляя следы в мире глаголов. Частота употребления была серьезнейшим фактором выживания глаголов – именно она приводила к тому, что некоторые прежние формы глаголов умирали и мы начинали их оплакивать (mourn – mourned), а другие приспособились (fit – fit) выживать.

Выживание наиболее приспособленных

В биологии проще показать сам факт естественного отбора, чем измерить степень родства между определенными признаками и степенью эволюционной приспособленности (легко сказать, что на улице ветрено, но куда сложнее определить, насколько сильно дует ветер). Не имея возможности рассчитать степень приспосабливаемости, мы можем лишь предположить, какие изменения будут успешными с точки зрения эволюции, но мы совершенно не представляем себе, сколько времени потребуется, чтобы эти изменения произошли.

Однако случай неправильных глаголов не очень характерен для биологической эволюции. В биологии для определения степени приспосабливаемости отдельного организма принимаются во внимание тысячи или даже миллионы признаков. Что же касается неправильных глаголов, было ясно, что их выживаемость в значительной степени определяется единственным признаком – частотой употребления. И это значительно упростило работу. Это значило, что мы сможем с довольно большой долей точности рассчитать, насколько быстро исчезнут неправильные формы глаголов.

Однако перед тем как заняться этим вопросом более основательно, позвольте напомнить о самом известном в науке примере исчезновения. Мы имеем в виду теорию радиоактивного излучения.

Радиоактивные материалы используются в массе устройств – от энергетических реакторов до медицинских сканирующих систем и бомб. Эти материалы постоянно находятся в процессе исчезновения, поскольку с течением времени атомы радиоактивного вещества превращаются в стабильные нерадиоактивные атомы. Этот распад высвобождает энергию, часто в форме радиоволн.

Именно поэтому радиоактивные вещества и получили свое название.

Самое важное свойство радиоактивного элемента – это его период полураспада, то есть период времени, в среднем требующийся для распада половины атомов в образце элемента[67]. Предположим, что у вас имеется вещество, период полураспада которого составляет один год. Если сначала у вас есть миллиард атомов этого вещества, то через год останется лишь половина миллиарда – другая половина миллиарда распадется на что-то другое. После двух лет у вас останется лишь четверть миллиарда атомов (половина от половины). Через три года останется одна восьмая и так далее.

Перейти
Наш сайт автоматически запоминает страницу, где вы остановились, вы можете продолжить чтение в любой момент
Оставить комментарий