Почему - Саманта Клейнберг (2017)

Почему
Книга Почему полная версия читать онлайн бесплатно и без регистрации

Автор показывает, что такое причинно-следственная связь, поясняет, почему в ее определении мы часто ошибаемся, как можно принимать верные решения. Благодаря этой книге вы научитесь анализировать информацию, выявлять причинно-следственные связи, объединять прошлое, предсказывать будущее.
Книга будет интересна философам, аналитикам, экономистам, медикам, юристам, начинающим ученым.

Почему - Саманта Клейнберг читать онлайн бесплатно полную версию книги

Здесь возможен тест на зависимость между производством яиц в определенный год и популяцией кур в предыдущий год, два и т. д. Для каждого года производства яиц и популяции кур существует коэффициент, показывающий, насколько значение текущего года зависит от показателя предыдущего. Нулевой коэффициент означает отсутствие зависимости вообще. Итак, если коэффициенты производства яиц в уравнении для яиц отличны от нуля в некоем временном интервале, тогда куры – это грэнджеровская причина яиц (если значение для предыдущего года – два, это значит, что яйца в два раза превышают популяцию кур за предыдущий год).

Чаще всего увеличение интервалов означает повышение сложности, также может устанавливаться практический предел для тестирования, помимо ограничений, связанных с данными, например количество точек данных и детализация измерений.

Вернемся в наш аэропорт. Скажем, при прогнозировании продаж кофе мы возьмем в качестве переменных погоду, задержки вылетов и предыдущие значения продаж кофе. Это будет многомерная причинность по Грэнджеру, когда мы включаем в каждый тест все имеющиеся переменные. Нет возможности принять во внимание все сведения в мире, но нетрудно проверить, будет ли информативна некоторая переменная, если учтены все остальные, оказавшиеся в нашем распоряжении. Скажем, истинная зависимость такова: погода вызывает задержки рейсов, а задержки рейсов вызывают рост продаж кофе, потому что людям приходится ждать в аэропорту. Тогда, после включения в кофейное уравнение задержки, погода не сможет дать никакой новой информации, и ее коэффициент будет стремиться к нулю (а значит, не повлияет на прогнозирование объема продаж кофе). Нельзя утверждать, что наблюдается причинная взаимосвязь, поскольку коэффициенты все же отличны от нуля, однако нетрудно провести тесты и проверить статистическую значимость этого отличия от нуля.

Здесь мы подходим ближе к причинности, но нет гарантии, что наши выводы истинны. Что еще важнее, даже если многомерная форма гораздо сильнее и точнее, она применяется намного реже, поскольку требует слишком интенсивных вычислений[263].

И что теперь

Возможно, вы носите «умные часы», которые месяцами регистрируют данные о вашем сне и физической активности; или у вас есть данные полицейских отчетов по своему району, и вы хотите найти причину преступлений; а возможно, вы прочли, что некто вывел локальные тренды заболеваемости гриппом из постов в соцсетях. Как будете справляться с анализом собственных сведений?

Главное, что следует осознать, – нет какого-то единственного способа решения всех проблем с причинными зависимостями. Ни один из существующих подходов не дает возможности в каждом случае безошибочно определить причины (что оставляет широкий простор действий ученым). Некоторые позволяют сделать более общие выводы, чем другие, но все зависит от допущений, которые в реальности не истинны. Вместо того чтобы досконально освоить один метод и использовать его для решения всех проблем, нужен набор инструментов. Большинство методов можно адаптировать под основную массу ситуаций, но это не будет простейшим или самым эффективным подходом.

С учетом того, что ни один метод не совершенен, возможно, самая важная вещь – осознать пределы каждого. К примеру, если ваши логические выводы базируются на двумерной причинности по Грэнджеру, не забывайте, что вы ищете своего рода направленную корреляцию и учитываете многомерный подход. Байесовская сеть может быть неплохим выбором, когда каузальная структура (связи между переменными) уже известна и вы хотите вывести ее параметры (вероятностные распределения) из некоторых данных. Но, если для решения проблемы важно время, динамические байесовские сети (или методы для нахождения временных паттернов причинных зависимостей на основе данных) могут оказаться более приемлемыми.

Перейти
Наш сайт автоматически запоминает страницу, где вы остановились, вы можете продолжить чтение в любой момент
Оставить комментарий