Knigionline.co » Компьютеры » BIG DATA. Вся технология в одной книге

BIG DATA. Вся технология в одной книге - Андреас Вайгенд (2017)

BIG DATA. Вся технология в одной книге
Информация, в принципе, делается самым значимым сектором экономики, и базы данных понимают о любом определенном человеке более, чем ведомо ему самому. Чем больше информации о любом из нас попадает в базы данных, что в наименьшей степени мы присутствуем.

BIG DATA. Вся технология в одной книге - Андреас Вайгенд читать онлайн бесплатно полную версию книги

Теперь посмотрим на социальные данные, которыми обычно располагает инфопереработчик. Представление о том, что человека нельзя идентифицировать по его цифровому следу, рассыпалось в пух и прах после того, как два крупнейших инфопереработчика поделились «обезличенными» социальными данными с учеными. Сначала интернет-провайдер AOL предоставил для исследовательских целей историю поиска 658 000 пользователей за трехмесячный период. Однако по чьей-то оплошности эти данные оказались в сети, и двум журналистам из газеты «Нью-Йорк таймс» удалось установить личности нескольких человек по их поисковым запросам[94]. Это оказалось довольно просто, поскольку люди любят искать информацию о самих себе или своих родственниках или прокладывать маршруты от своего домашнего адреса. Затем интернет-видеосервис Netflix устроил конкурс на самый точный прогноз оценки, которую зритель поставит фильму, на основе анализа предыдущих оценок других пользователей. Для построения алгоритмов участникам нужны были данные, и компания предоставила «100 миллионов оценок, поставленных 480 000 клиентами, с датой каждой оценки»[95]. Имена клиентов не раскрывались, но двум ученым из Университета штата Техас в Остине, Арвинду Нараяну и Виталию Шматикову, удалось деанонимизировать людей из базы данных путем сопоставления обезличенной информации с рецензиями, опубликованными на сайте IMDB.com[96]. В чем, собственно, проблема, если эти рецензии уже были достоянием гласности? А в том, что клиенты Netflix не выкладывают отзывы о всех фильмах, которые смотрят, и некоторые из репертуара «тайно любимых» ими фильмов были весьма показательными. По крайней мере, так утверждала истица, чье имя не разглашается, подавшая на Netflix в суд. У нее возникли опасения, что теперь каждый из 50 000 ученых, получивших доступ к базе данных конкурса, знает, что она лесбиянка.

Даже если вы спокойно отнесетесь к тому, что список просмотренных вами фильмов выложат на всеобщее обозрение, вам вряд ли понравится, если будет обнародована вся история ваших поисковых запросов в интернете. Если вы не отличаетесь от подавляющего большинства людей, то чаще всего вводите в Google Maps свой домашний адрес. Ваше место жительства, посещаемые места, покупки, люди, которыми вы интересуетесь, и проблемы, которые вас беспокоят, относятся к наиболее интимным подробностям жизни. Поисковые запросы отражают и то, что в данный момент волнует общество, и Google предлагает получить представление об этом с помощью обработанной информации на Google Trends. Многие считают, что в Trends преобладают новости, но там можно узнать и о том, что в последние пару лет возрос интерес людей к таким проблемам, как интернет-травля и трансгендер. В то же время поисков по словам «приватность» и «транссексуал» стало меньше[97].

Теперь представьте, что у вас есть возможность видеть чей-то поиск в режиме реального времени. В 1990-х я навещал своего приятеля из Стэнфордского университета, который работал в стартапе в области поисковых систем. Я мог следить за поступающим потоком запросов. Один из них привлек мое внимание: кто-то только что искал «как совершить самоубийство»[98]. Что делать в таком случае? Отследить пользователя по его IP-адресу через сервис-провайдера и позвонить на «горячую линию» предотвращения самоубийств? А не будет ли это вторжением в личную жизнь? Может быть, сначала попробовать внимательно изучить историю поиска этого пользователя, чтобы попробовать понять его мотивацию и более точно оценить вероятность события, которое сразу же приходит в голову при виде такого запроса? А может быть, это писатель, собирающий материал, у которого и в мыслях нет причинить себе вред? Но затем появляется следующий запрос этого человека – «мост Золотые Ворота», где покончили с жизнью более 1600 человек[99]. И после этого вы спокойно отвернетесь от монитора и вернетесь к своей работе по улучшению качества поиска, забыв о том, что человек в опасности? Простого ответа на подобные вопросы не существует.

Перейти
Наш сайт автоматически запоминает страницу, где вы остановились, вы можете продолжить чтение в любой момент
Оставить комментарий