Одним из частых преобразований при построении модели является логарифмирование. Иногда логарифмируют объясняющую переменную, иногда логарифмируют зависимую переменную y. Соответственно, возникает, в принципе, четыре группы моделей. Две самые популярные, это когда либо ни то, ни то не логарифмируют, то есть y_i = β₁ + β₂ x_i + ε_i. Второй популярный вариант — это когда обе переменных очень часто так поступают, когда обе переменных принимают только положительные значения, обе их логарифмируют. Соответственно, логарифм y считают, что он линейно зависит β₁ + β₂ ln (x_i) + ε_i. Ну, и бывают смешанные модели, когда скажем, у логарифмируют или наоборот, х логарифмируют, а у не логарифмируют. Сейчас мы разберемся, как правильно интерпретировать коэффициент β₂ в каждой из этих четырех моделей. Рассмотрим четыре варианта комбинации нелогарифмированной переменной и логарифмированной переменной. Первый вариант самый простой y_i = β₁ + β₂ x_i + ε_i. Второй вариант, когда обе переменные с логарифмами: логарифм y_i = β₁ + β₂ ln (x_i) + ε_i. И третий, четвертый вариант смешаны, когда одна переменная логарифмирована, а регрессор нет. Или наоборот, когда y_i нелогарифмировано, а x_i логарифмировано. Как интерпретируется коэффициент β₂ в каждом из этих четырех случаев. Рассмотрим самый простой. Первый совершенно очевиден, поскольку здесь производная y_i по x_i в первом случае равна β₂, то это означает, что при росте х на единичку, y растет на β₂. Примерно естественно, потому что производная показывает мгновенный рост, но поскольку у нас β₂ постоянна, то у нас такая зависимость есть всегда. Приходим ко второй ситуации. Здесь я могу сказать, что производная логарифма y_i по логарифму x_i равна β₂. Но с другой стороны, по правилам дифференцирования: что такое дифференциал логарифма? Это есть производная логарифма помножить на дифференциал y. Соответственно, мы получим следующий результат, что в числителе находится dy_i, деленное на y_i, а в знаменателе находится dx_i, деленное на x_i. И это есть не что иное, как β₂. А эту величину можно тоже проинтепретировать. Что такое примерно dy_i делить на y_i? Это, примерно, изменение y, деленное на y_i. Дельта — это изменение y_i, y_i — это сам y_i. Соответственно, если взять эту величину, скажем, помножить на 100, здесь написать 100 и здесь написать 100, то получится, что эта величина — это изменение, изменение y_i в процентах. Дельта y было бы в абсолютных единицах, но если изменение в абсолютных единицах поделить на саму величину, то получится изменение в процентах, в долях, а еще на 100, то в процентах. Соответственно, домножая просто так на 100 в числителе и в знаменателе, мы можем сделать это совершенно бесплатно, мы получаем следующую интерпретацию β₂ в модели с логарифмами. β₂ показывает на сколько процентов, на сколько процентов изменится y при росте x на 1 %. Переходим к третьей модели. В третьей модели интерпретация практически совершенно аналогичная. Мы замечаем,что производная логарифма y по x равна β₂. Пользуясь теми же правилами дифференцирования, получаем, что dy, деленное на y_i, деленное на dx_i, равно β₂. Домножим на 100, чтобы в числителе получить изменение в процентах, тут знаменатель, к сожалению, в абсолютных единицах, поэтому придется на 100 домножить β₂. Получаем, что 100 помножить на dy_i, делить на y_i, делить на dx_i равно 100 β₂. Отсюда мы получаем следующую интерпретацию: в знаменателе у нас изменение х в абсолютных единицах, а в числителе - изменение y в процентах. Соответственно, если х меняется на одну единичку, то есть знаменатель равен одному, тогда 100 β₂ как раз покажет изменение y в процентах. Соответственно, мы получаем, что 100 β₂ это изменение, изменение y в процентах при росте x на единицу в абсолютном выражении. И последняя четвертая модель. Мы получаем, что dy_i по dln x_i равно β₂. Опять применяем правило дифференцирования, получаем, что dy_i делить на dx_i, на x_i равняется β₂. На этот раз мы поделим на 100, чтобы в знаменателе было изменение в процентах. Получим, что dy_i равняется 100 dx_i, деленное на x_i, и поскольку я 100 написал в знаменателе, то это деление на 100 соответствует β₂, деленному на 100. И получается, что если x поменялся на 1 %, тогда в знаменателе будет стоять единичка. Таким образом, β₂ на 100 показывает примерно изменение, изменение y в абсолютных единицах при росте x на 1 %. И таким образом, мы получаем четыре разных интерпретации в зависимости от того, логарифмируется у нас зависимая и объясняющая переменная или нет. Итак, мы с вами выяснили, что в двух самых популярных версиях, когда ни y, ни x не логарифмированы, β₂ интерпретируется следующим образом. С ростом x на единицу, y растет на β₂ единиц. В логарифмах интерпретация состоит, что с ростом x на 1 %, y растет на β %. В двух менее популярных полулогарифмических моделях интерпретация следующая: если логарифм берется от y, то с ростом x на 1, y растет на 100 помножить на β процентов, и если логарифмирован только x, то с ростом x на 1 %, y растет на 0.01 помножить на β₂ единиц.