0:12
На примере мы увидели, что наличие
инструментальной переменной z позволяет спасти ситуацию,
а именно позволяет получить состоятельные оценки в той ситуации,
когда у нас имеет место корреляция между xi и ошибкой εi.
Возникает естественный вопрос: как же определить,
является ли какая-нибудь переменная инструментальной и подходит ли она нам в
качестве подходящего инструмента?
Еще раз подчеркну, что инструментальная переменная zi,
она влияет на зависимую переменную yi, но влияет исключительно через
регрессор xi и ни в коем случае через ошибку εi.
То есть, корреляция между zi и xi не должна равняться нулю, а корреляция
между инструментальной переменной zi и случайной ошибкой должна равняться нулю.
На картинке эту ситуацию можно изобразить, например,
стрелочками следующим образом: случайная ошибка εi влияет на xi,
на регрессор, и влияет на yi, ну, поскольку входит в формулу,
поскольку в формуле yi = β1 + β2xi + εi.
И, конечно, сам xi влияет на yi, поскольку тоже входит в формулу для yi.
В этой ситуации мы видим, что есть связь xi-εi, и именно эта связь мешает нам
состоятельно с помощью метода наименьших квадратов оценить коэффициент β2.
Соответственно, как на этой схеме расположены инструментальные
переменные zi?
Инструментальная переменная zi должна влиять на xi,
но не должна влиять на εi, и εi не должно влиять на zi.
Вот в такой ситуации мы можем сказать,
что zi является инструментальной переменной для регрессора xi, использовать
двухшаговый метод наименьших квадратов и элементы инструментальных переменных, и,
соответственно, получить состоятельные оценки.
В эконометрике очень важную роль занимает вопрос связи между
статистической взаимосвязью, которую можно выявить,
например, посчитав ковариацию и кореляцию, и причинно-следственной взаимосвязью.
И, конечно, мы должны четко осознавать, что наличие статистической взаимосвязи
никак не означает наличие причинно-следственной взаимосвязи.
Давайте для примера попытаемся ответить на такой очень важный
вопрос: влияет ли тот факт,
что я беру с собой зонтик, на вероятность появления дождя?
И для ответа на этот вопрос нам, естественно,
нужны какие-то реальные данные.
И вот здесь нужно четко сказать, что эконометристы работают, вообще говоря,
с двумя типами данных: с экспериментальными данными,
данными экспериментов, и с данными наблюдений.
Что собой представляют эти два типа данных?
Чаще всего исследователю приходится сталкиваться в социальных
науках с данными наблюдений.
Ну, это означает, что исследователь может, скажем, каждое утро выходить на балкон и
смотреть, идут ли люди с зонтиками и идет ли дождь в это время.
Сам он при этом никак ни на чей выбор не участвует,
никого брать зонтик не подговаривает, а просто тихо, спокойно стоит и записывает.
Вот в первый день людей с зонтами он не увидел, а дождь увидел.
Во второй день увидел людей с зонтами и увидел дождь.
Соответственно, по данным наблюдений никакой
возможности определить направление причинно-следственной связи нету.
Если представить себе какого-нибудь инопланетянина,
который не разбирается в земных реалиях и не знает, как связаны зонтики и дождь,
то по таким данным инопланетянин не сможет проверить гипотезу о том,
что появление, взятие зонта с собой увеличивает вероятность дождя,
ответить на этот вопрос по данным наблюдений – невозможно.
Гораздо более удобны в этом плане данные экспериментов.
Если представить себе, то каждое утро я подкидываю монетку и сам выбираю,
брать ли мне зонт или не зонт, то есть я провожу некий эксперимент,
и в соответствии с этим экспериментом я выбираю значение регрессора,
значение объясняющей переменной xi.
Если выпадет орел, я, скажем, не беру зонт, а если выпадет решка, скажем,
я беру зонт.
Соответственно, у меня получаются уже данные экспериментальные.
Казалось бы, те же самые две переменные, "был ли я с зонтом", "был ли дождь",
однако здесь уже переменная "был ли я с зонтом"
получена экспериментальным способом.
Соответственно, в первый день, скажем, я не взял зонт, потому что выпал орел,
а дождь был, во второй день, скажем, выпала решка,
поэтому я взял зонт и дождь был, и так далее.
Соответственно, этих данных уже хватает, чтобы проверить гипотезу о том,
что взятие с собой зонта повышает вероятность дождя.
Здесь нам достаточно просто посчитать обычную корреляцию, скажем,
или построить регрессию, и мы можем тем самым определить,
повышает ли вероятность дождя взятие с собой зонта.
То, что мы представили себе только что, это называется искусственным
экспериментом: мы сами, сознательно выбирали,
брать или не брать зонт в зависимости от результата подбрасывания монетки.
Но, к сожалению, в социальных науках такие эксперименты трудно провести.
Ну, вряд ли Центробанк или кто-нибудь еще может экспериментировать
и произвольно для того, чтобы что-то узнать, выбрать, а не назначить ли очень
большую процентную ставку или не назначить ли очень маленькую процентную ставку.
Поэтому в реальности в социальных
науках искусственные экспериментальные данные недоступны, как правило.
Зато можно иногда в реальности обнаружить так называемые естественные эксперименты.
Что собой может представлять естественный эксперимент?
В нашем примере, когда мы пытаемся изучать зависимость того,
влияет ли взятие зонта на, повышает ли взятие зонта вероятность того,
что пойдет дождь, мы можем себе представить некий город, где есть,
ежегодно проводится конкурс самых красивых зонтиков, и, соответственно,
на этот, в этот день на конкурс самых красивых зонтиков все люди берут зонты и,
соответственно, идут с зонтами вне зависимости от того, будет дождь или нет.
У нас появился этот естественный эксперимент,
который нам позволяет проверить, не обладая данными искусственного
эксперимента, просто обладая данными фактических наблюдений,
но в которых присутствует этот самый естественный эксперимент.
Мы также смотрим за людьми на улице, также никак ничего им не подсказываем,
никому не говорим, брать ли зонт или не брать,
однако теперь по этим данным мы снова можем проверить гипотезу о том,
влияет ли взятие зонта, повышает ли оно вероятность дождя.
А именно, мы просто посмотрим частоту дождя в
день на конкурсе самого красивого зонтика и в остальные дни.
И если, соответственно, частота дождей во время конкурса самого красивого зонтика
будет выше, то при прочих равных, если у нас, там,
не меняются сезоны и так далее, опять же, с кучей оговорок, мы получили
возможность проверить интересующую нас гипотезу по данным наблюдений,
в которых присутствует естественный эксперимент.