0:00
[МУЗЫКА]
[МУЗЫКА] Сейчас
давайте рассмотрим более универсальные критерии
для сопоставления среднего значения каким-то числом,
а именно одновыборочный t-критерий Стьюдента, или,
иногда он еще называется, одновыборочный t-тест.
Применяется этот критерий чаще всего на выборках с распределением
метрической переменной, которая не вполне соответствует нормальному виду,
имеет собственную форму распределения.
Но при этом распределение по t-критерию Стьюдента похоже на нормальное,
то есть симметричное,
рассчитывать среднее значение мы вправе для этого распределения.
Также применяется в тех случаях,
когда выборки у нас недостаточно большие, например меньше 100 случаев.
И, кроме того, используется в тех случаях,
когда просто применять z-критерий у нас нет возможности.
Если мы внимательно посмотрим сейчас на расчетную формулу,
которую видите на экране, мы увидим, что расчет t-критерия Стьюдента,
он практически идентичен Z-критерию.
Отличие только состоит в том, что в качестве числа, с которым
будем сравнивать среднее значение по выборке, можем выбрать любое число,
а не только предполагаемое среднее значение по генеральной совокупности.
Кроме того, мы видим, что здесь применяется дополнительная расчетная
формула, обозначенная буквами df — это число степеней свободы.
Поскольку определение по уровню вероятности для t-критериев
и для многих других статистических критериев отличается от принципа,
который применяется в z-критерии, то,
соответственно, используется дополнительный расчет.
Что такое число степеней свободы?
Число степеней свободы применяется чаще всего в тех случаях,
когда мы рассматриваем формулы,
в которые включены дополнительные расчеты параметра по нашей выборке.
В частности, сейчас мы видим,
что в формулу t-критерия Стьюдента включается расчет среднего выборочного.
За счет того, что в эту формулу включается дополнительный расчет этого параметра,
нам нужно исключить из объемов нашей выборки всей один получающийся
неслучайный элемент, который мы можем с вами рассчитать,
зная информацию о рассчитанном среднем значении по выборке.
Рассмотрим вариант применения t-критерия Стьюдента.
Сейчас на экранах вы видите задачу, я вам ее зачитаю.
«Школьный психолог задался целью изучить успеваемость школьников и подсчитал
средний балл по выборке из 15 человек.
Нормальность распределения соблюдается, проверьте гипотезу о том,
что успеваемость школьников в среднем хуже, чем значение, равное 4 баллам».
Также нам известно, что в условии задачи установлено
пороговое значение ошибки α первого рода — 0.5.
Итак, объем выборки — 15 случаев, мы можем приступать
к расчету t-критерия Стьюдента и начинаем с расчета среднего значения по выборке.
Гипотезы статистические вы можете видеть на экране,
и результаты расчетов параметров распределения вы также можете
видеть сейчас на экране, я не буду их озвучивать.
Что мы видим?
Мы видим, что наше среднее значение, которое мы рассчитали только что,
действительно меньше 4 баллов,
то есть в целом с точки зрения логики нашего исследования пока что гипотеза,
которую мы установили ранее, похожа на, действительно, результаты измерения.
Но насколько достоверна эта разница?
Нам обязательно нужно оценить, поскольку мы видим,
что разница между средним значением по нашей выборке и установленным
неким правилом числом все-таки не очень большая.
Как раз таки для этого мы с вами и рассчитаем значение t-критерия и p-уровень
значимости для этого критерия, для того чтобы принять решение: какую гипотезу,
нулевую или альтернативную, мы в итоге примем, а какую отвергнем.
Сейчас на экранах вы можете видеть результаты подсчетов t-критерия Стьюдента.
Кроме того, обратите внимание, что p-уровень значимости для
каждого из рассчитанных критериев — и t-критерия Стьюдента, и для других,
которые мы будем считать в дальнейшем — вы можете либо посчитать самостоятельно,
воспользовавшись калькулятором или таблицами электронным,
либо можете воспользоваться уже имеющимися,
рассчитанными таблицами так называемых критических значений.
Обратите внимание, что критические значения рассчитываются для тех точек,
которые соответствуют числу степеней свободы и наиболее используемым
ошибкам α первого рода: 0.05, 0.01 и 0.001.
Следующая наша задача — это найти точки
пересечения для столбца с числом степеней свободы по нашей выборке.
По нашей выборке число степеней свободы — это n − 1, мы это помним.
15 − 1 — не случайный объект, всего 14.
Соответствующую строку нам обязательно нужно искать в таблице.
А по столбцам мы видим с вами вероятности, или,
другими словами, те критические точки, от которых мы будем отталкиваться при
сопоставлении нашего эмпирического критерия, который мы уже подсчитали,
и рассчитанных критических значений нашего критерия.
Помним, что в данном случае в условии задачи указана направленная гипотеза,
то есть нам явно дали указание на то,
чтобы найти различие или конкретно даже увидеть,
действительно ли наше среднее значение меньше указанного числа.
Поэтому нас не интересует вторая область
возможного распределения, то есть не интересует область,
которая описывает среднее значение больше этого установленного числа.
Поэтому при использовании, при поиске вероятности, при поиске p-уровня
значимости применяйте соответствующие таблицы критических значений.
Нам необходима таблица с критическими значениями для
направленной гипотезы или для одностороннего критерия t.
Итак, давайте обратимся к результатам.
Мы видим, что в нашем примере t-критерий для критической точки 0.05 = 1.761.
t-критерий для критической точки
0.01 = 2.625.
Пришло время, для того чтобы сопоставить эти критические
значения критерия с нашим рассчитанным эмпирическим значением.
В нашем случае значение эмпирического критерия, к сожалению,
не превышает значение критических точек.
Другими словами,
если мы будем ориентироваться на p-уровень значимости нашего эмпирического критерия,
то он будет больше, чем установленная нами ошибка α первого рода в 0.05.
А если наш p-уровень значимости критерия не является меньше,
чем ошибка α, которую мы установили заранее, то, к сожалению,
мы не можем отказаться от сформулированной ранее нулевой статистической гипотезы.
Другими словами, мы не можем сказать о том, что среднее значение по нашей выборке
отличается достоверно от числа в 4 балла.
Другими словами, хоть мы и увидели, что подсчитанное среднее
значение на 0.1 отличается, но эта разница оказалась недостоверной.
По нашей выборке мы не смогли подтвердить достоверность этой разницы, этих различий.
Давайте сформулируем выводы.
Вы сейчас на экране можете видеть два варианта выводов.
Первый вывод — это краткий вывод, который содержит только
цифровой вывод о расчетах, которые мы с вами произвели.
Значение t-критерия Стьюдента, p-уровень значимости, уровень ошибки α,
рассчитанные средние значения и другие параметры может включать этот вывод.
Второе, что мы здесь видим — это содержательный вывод,
то есть это в буквальном смысле ответ на вопрос,
который содержится в вашей задаче, или это ответ на ту исследовательскую гипотезу,
которую вы сами сформулируете в своих исследованиях.
В нашей задаче вывод этот таков: «Подтвердить гипотезу о том, что
успеваемость школьников в среднем хуже, чем значение, равное 4 баллам, не удалось.
Отличие среднего значения по выборке от числа 4 статистически недостоверно».
Для полноты картины в полный содержательный вывод обязательно нужно
включать краткий вывод, то есть цифровые данные.
Во всех отчетах, которые вы будете делать,
во всех собственных исследованиях, в статьях, которые вы будете писать,
обязательно вслед за содержательным выводами, интерпретациями,
нужно обязательно включать цифровое обозначение тех расчетов,
которые вы делали: это критерий, который вы применяли, и его значение,
это уровень значимости этого критерия и это те параметры, которые вы,
собственно говоря, сопоставляли или которые вы искали.
Обязательно обращайте на это свое внимание.