0:00
[МУЗЫКА]
[МУЗЫКА] Сейчас
нашей задачей будет рассмотреть несколько
интересных мер центральной тенденции и мер положения.
Меры центральной тенденции позволяют нам описать типичную
выраженность признака нашего распределения.
Мы будем рассматривать наиболее часто встречающиеся меры центральной тенденции,
а это именно мода, медиана, среднее значение.
И наиболее часто встречающиеся меры положения — расположение наших конкретных
признаков относительно других вариантов измерений в нашем распределении.
К ним относятся процентили, квантили, квартели.
В данный момент на экране вы можете видеть варианты измерений
вычислений конкретных мер центральной тенденции и мер
положения в разных переменных, измеренных разными шкалами.
В частности, мы можем видеть,
что номинативные переменные — для них мы можем измерять только моду.
Для других переменных, измеренных в других типах шкал,
которые являются более информативными, мы можем вычислить более сложные
и более осмысленные меры центральной тенденции и меры положения.
Рассмотрим такую распространенную меру центральной тенденции, как мода.
По определению мода — это конкретное значение выраженности признака
нашей переменной, которая встречается в распределении наиболее часто.
Постоянно применяют моду, расчет этой моды,
определение его, для номинальных переменных — наиболее часто можем
встретить именно расчет моды для этого типа переменных.
В частности, если вы посмотрите сейчас на экран, вы увидите там вариант расчета
моды для нашей номинальной переменной, которая называется специальность.
И если внимательно посмотреть на таблицу частот, внимательно посмотреть
на частотную диаграмму, мы увидим, что такая специальность,
как «инженеры», такая группа, такая градация этой номинальной переменной,
как инженеры, встречаются в нашей выборке наиболее часто.
Следующим примером определения моды, расчета моды — мы сможем с
вами посмотреть вариант расчета моды на метрической переменной.
Сейчас на экране можете видеть вариант определения моды для такой метрической
переменной, как количество решенных задач.
И в таблице, и в гистограмме вы можете увидеть,
что встречается целых пять случаев решения задачи, которое равно 3.
То есть наиболее часто в нашей выборке испытуемые решали три задачи.
Больше или меньше задач решались значительно реже.
Также на этом слайде вы можете видеть варианты вычисления моды,
определения ее с помощью функций,
которые вы можете найти в электронных таблицах Microsoft Excel.
Это довольно-таки удобно и быстро, особенно для тех случаев,
когда нужно определить моду, рассчитать ее, для больших выборок.
Не нужно строить диаграммы, не нужно вычислять частотные таблицы.
Пользоваться электронными таблицами Excel просто и увлекательно.
Следующая мера центральной тенденции — это медиана.
По своему определению медиана есть середина упорядоченного ряда.
То есть для того чтобы определить медиану нашего распределения,
нам нужно выбрать все варианты измерения в нашем распределении,
упорядочить их по убыванию или возрастанию их значений.
И после этого найти середину этого упорядоченного ряда.
На экране вы видите пример подобного рода расчетов, и там сразу заметно,
выделено специально, что середина нашего упорядоченного ряда равно 6,5.
В данном случае заметно, что применялась та специальная шкала порядков,
то есть каждому нашему испытуемому присваивался определенный ранг,
при этом для некоторых испытуемых ранг присвоен один и тот же.
В частности, ранг, равный 6,5.
Давайте разберемся, почему это происходит.
Скорее всего, наши испытуемые показали примерно одинаковый результат.
Точность нашего измерения была не очень высока.
И мы были вынуждены присвоить этим испытуемым одинаковый ранг,
то есть поставить их на одно и то же место.
Поскольку выполнили они задачу одинаковым образом,
мы не можем их поставить на разные места, то есть присвоить разные ранги.
С этой целью рассчитывается специальный средний ранг.
То есть все наши испытуемые, претендующие на этот средний ранг — определяются их
возможные места — в частности это места № 4,
5, 6, 7, 8 и 9, — суммируются эти возможные ранги,
которые они могли бы занять, если бы у них были разные результаты.
И усредняются — то есть высчитывается средний ранг, равный 6,5.
И все эти испытуемые получают одинаковый ранг.
Результат подобного рода расчетов не очень оптимален для
дальнейшего статистического анализа,
поскольку некоторые статистические методы довольно-таки требовательны к
тем расчетам, которые вы производите — к тем измерениям, которые вы осуществляете.
И если вы хотите, чтобы ваши расчеты были достаточно точными,
старайтесь применять настолько хорошо отлаженный инструмент измерения,
чтобы у вас в вашем распределении не появлялись
такие вот средние ранги или их было как можно меньше.
Возвращаясь к медиане, следует сказать,
что медиана также является 50-м процентилем, вторым квартилем,
или квантилем 0,5 доли того распределения, которое вы используете.
Другими словами, медиана может выступать в роли меры положения.
В частности, если медиана делит наше распределение на две равные части,
то процентили делят наше распределение на 100 равных частей.
И в этом отношении 50-й процентиль совпадает с медианой.
Квартили делят наше распределение на четыре равные части,
и в этом случае второй квартиль совпадает с медианой.
Как осуществляется расчет квантилей остается на самостоятельную работу.
Попробуйте это сделать сами.
Также хочу заметить,
что на экране вы видите варианты использования функции для расчета медианы,
квартилей, квантилей и процентилей для Microsoft Excel.
Это также довольно-таки быстро и эффективно делать,
а особенно в тех случаях, если объемы ваших распределений достаточно большие.
Аналогичным образом медиану, процентили,
квантили и квартили можно рассчитать и по метрическим переменным,
то есть для измерений, осуществляемых в интервальных или абсолютных шкалах.
Напомню, что для измерений, осуществленных в номинальных шкалах,
медиану рассчитывать нельзя.
Обратимся сейчас к тому примеру, который представлен на экране.
Мы видим: представлен результат измерения в метрической переменной,
и упорядоченный ряд этих измерений позволяет
нам найти медиану — она равно 212 миллисекундам.
Хочу отметить, что медиана применяется довольно-таки часто в измерениях, довольно
часто в анализе данных, и в некоторых случаях она даже предпочтительней,
чем вариант расчета среднего значения, о котором мы будем говорить далее.
Поскольку медиана достаточно устойчива к выбросам, то есть к нетипичным,
крайне большим или крайне малым значениям выборки, это позволяет нам в некоторых
случаях не использовать среднее значение, а вместо него применять медиану.
Самым распространенным средством визуализации медианы
является специализированный график, который называется boxplot,
или в русскоязычной транскрипции — это «ящик с усами».
Рассчитывается он, строится в специализированных пакетах.
С 2016 года его можно построить и в электронных таблицах
Microsoft Excel, но также его можно построить и вручную.
Сейчас на экране вы можете видеть схематичное
изображение этого графика — boxplota.
И в этом графике красной линией внутри ящика отмечена медиана.
Сам ящик снизу и сверху ограничен первым и третьим квартилем нашего распределения.
Наконец, третья мера центральной тенденции,
которую мы будем с вами применять на наших занятиях,
которую будем рассчитывать — это среднее значение, среднее арифметическое значение.
Рассчитывать эту меру центральной тенденции можно на
метрических шкалах — напомню, что это интервальные и абсолютные шкалы,
— и нельзя рассчитывать на неметрических шкалах — это,
соответственно, номинальная шкала и порядковая шкала.
Стоит отметить, что для абсолютных шкал применяются специализированные меры.
Но мы применять их не будем,
поскольку нам будет достаточно расчета среднего арифметического значения.
На экране вы можете видеть формулу расчета среднего арифметического значения.
И видно, что расчеты при использовании этой формулы немножко более сложные,
чем те, которые мы использовали до этого при определении моды и медианы.
Расчет среднего значения требует немного больших усилий,
для того чтобы получить этот параметр.
Для визуализации результатов измерения среднего значения
применяется стандартная столбиковая диаграмма.
В частности,
сейчас на экране вы можете видеть вариант отображения этой столбиковой диаграммы.
Там представлено среднее значение по нашей выборке — 212 миллисекунд.
Также на экране можете видеть варианты расчетов формул в
Microsoft Excel для определения или для быстрого расчета среднего значения,
что значительно удобней, чем расчеты среднего значения вручную.
[БЕЗ_ЗВУКА]