[МУЗЫКА] [МУЗЫКА] [МУЗЫКА] Итак, запускаем пакет. Первым делом перед нами открывается стартовое окно, где мы можем получить сразу же быстрый доступ к файлам, с которыми работали ранее, создать новый файл, получить справку. Но поскольку мы в первый раз с вами вместе обращаемся к данному пакету, здесь мы пока ничего не будем делать, закроем это окно и сразу перейдем к основному окну пакета SPSS, который напоминает чем-то по своей структуре таблицу Excel. Но здесь есть определенные нюансы, давайте попробуем с ними разобраться. Во-первых, как ввести данные, которые нам необходимо обработать? Существует несколько разных способов. Мы можем вводить данные непосредственно в этом окне, набирая в соответствующих ячейках нужные нам величины. Если же у нас уже имеется файл с данными, мы можем либо скопировать и вставить их через буфер обмена, либо можем импортировать данные непосредственно из внешнего файла. Поскольку у нас уже заготовлен файл, мы сейчас с вами будем импортировать вот эту таблицу из файла таблицы Excel. Как это можно сделать? Заходим в файл, «Открыть», и у нас есть различные способы. Что мы можем открыть здесь? Мы можем открыть готовый проект, но сейчас у нас пока нет проекта, созданного в данном пакете SPSS. Мы будем импортировать данные из внешнего файла, поэтому мы выбираем только строку «Данные». Необходимо указать путь, где хранится наш файл. В моем случае он лежит на диске C в папке R, где мы работали ранее. Но пока указанный тип файла — это внутренний формат пакета SPSS. Соответственно нам нужно получить доступ к файлам таблицы Excel. Вот они в выпадающем меню у нас появляются. Выбираем и видим, что у нас появился интересующий нас файл в списке. Выбираем его и открываем. Появляется еще одно промежуточное окно, где мы должны указать соответствующие настройки. Во-первых, как вы помните, в первой строке у нас содержатся имена переменных. Соответственно мы должны читать имена переменных из первой строки. Далее мы берем весь диапазон имеющихся данных, то есть у нас 90 наблюдений плюс первая строка заголовка, итого 91 строка и соответственно пять столбцов. Весь этот диапазон с первого листа мы выбираем и импортируем в пакет. Обратите внимание, что произошло при импорте? Если мы посмотрим, какие у нас сейчас открыты окна пакета, мы видим, что у нас появилось сразу несколько окон. Одно окно — это собственно таблица, содержащая данные. А второе окно — это журнал действий, которые мы будем выполнять. То есть когда мы в основном окне в графическом интерфейсе выбираем какие-то пункты меню и выполняем либо импорт данных, либо какой-то анализ, каждому действию соответствует какая-то команда внутреннего языка. И эти команды будут прописаны в журнале действий, и соответственно здесь же будут выводиться результаты этих действий. Для начала поработаем с таблицей. Посмотрим, что у нас у нас здесь, какие переменные импортированы и как пакет их видит. В таблице данных у нас также имеется два окна: одно рабочее окно с исходными данными, а второе окно с описанием переменных. Мы можем вот таким вот образом переключаться между ними, и для начала нам нужно разобраться, с какой же информацией мы будем работать, для того чтобы анализ, который мы будем выполнять, был выполнен корректно. У нас пять переменных. Первая переменная — пол, которая содержит всего две величины f и m, соответственно для девочек и мальчиков. Рост — это величина количественная, соответственно ее тип числовой, точно так же, как и у всех остальных переменных. Пакет это определил автоматически по содержимому ячеек, которые были импортированы. Ширина также подбирается автоматически в зависимости от типа определенной переменной и количества знаков. Далее. Если мы внимательно посмотрим на нашу таблицу, у нас есть указание роста, но рост указан в сантиметрах, то есть у нас вообще-то изначально в исходной таблице Excel все данные были представлены целыми числами. Соответственно, нам нет необходимости указывать дробную часть и значение после запятой. Если мы хотим это убрать, то в представлении данных, в представлении наших переменных, вот здесь вот в столбце «Знаки» мы можем указать значение ноль. В принципе, это можно сделать для каждой переменной, и мы видим, что теперь наша таблица больше похожа на те данные, которые мы импортировали из Excel, то есть они все представлены целыми числами. Далее идет определенная информация по формату данных, метки, мы сейчас пока не будем про все это говорить. Еще один важный для нас столбец, на который мы будем регулярно обращать внимание, это мера, то есть та шкала, в которой измеряются наши данные. Первая переменная является у нас величиной текстовой, ее тип текстовый. Соответственно, она может измеряться либо в номинальной шкале, как в нашем случае, указывая пол, либо в принципе это может быть порядковая шкала, например, если у нас какие-то величины указаны в алфавитном порядке. Автоматически тип был определен как номинальный, и нас в данном контексте это полностью устраивает и соответствует типу данной переменной. Все остальные переменные являются числовыми, то есть они несут в себе полную количественную информацию, они не являются порядковыми. Соответственно, мы можем их измерять в обычной стандартной количественной шкале. Вот здесь иконка в виде линейки указывает нам как раз на это, то есть мы можем работать с ней как с величиной количественной. Все они представлены таким образом. Дело в том, что даже если исходная величина у нас была числовой, в принципе, это может быть и номинальная величина, например, номер паспорта, номер группы, номер автомобиля. То есть изначально программа может воспринять эту информацию как количественную, хотя реально она, конечно же, таковой не является. В этом случае шкалу необходимо будет поправить. У нас сейчас всё в полном порядке и действительно соответствует нашим исходным данным. Теперь рассмотрим, как можно в пакете выполнить предварительную обработку данных. В частности, мы рассмотрим, как в пакете SPSS рассчитываются основные числовые характеристики и какие графики мы можем построить на этапе предварительной обработки данных. Все основные пункты анализа содержатся в разделе меню «Анализ». Заходим сюда. Для того чтобы вычислить основные числовые характеристики, мы выбираем пункт «Описательные статистики». У нас выпадает окошко «Описательные». Выбираем его. И далее нам нужно задать переменные, для которых мы хотим выполнить соответствующие расчеты. Описательные статистики, такие как выборочное среднее, выборочная дисперсия, среднеквадратическое отклонение, мода, медиана и так далее у нас рассчитываются для количественных величин, которые выражаются числом. Соответственно, мы в нашем списке видим только те переменные, для которых шкала указана количественная. Наша переменная пол в данный список автоматически не входит. Для нее не могут быть вычислены данные характеристики. Эти все переменные мы можем указать все, либо выбирая их поочередно в списке и стрелочкой отправляя их в список рабочих переменных, либо находясь в этом окне выбора, мы можем выделить все переменные например, сочетанием клавиш Ctrl + A, если таких переменных много, и перенести их все в список анализируемых переменных. Далее мы можем нажать на кнопку «Параметры», чтобы выбрать, какие именно характеристики нас интересуют. В данном окне предлагается список основных числовых характеристик, которые могут быть вычислены для указанных величин. Какие-то из них будут рассчитаны автоматически, какие-то изначально не предлагаются. Но устанавливая галочку в соответствующей графе, мы можем добавить эти характеристики к расчету. В частности, мы сейчас с вами вычислим среднее арифметическое значение для каждой включенной в список переменной, стандартное отклонение, то есть корень из дисперсии, саму дисперсию, максимальное и минимальное значения, а также для примерной предварительной информации о виде распределения мы можем включить также коэффициент асимметрии и коэффициент эксцесса, чтобы посмотреть форму и структуру нашего распределения. Выполним «Продолжить» и теперь выведем результаты. Нажимаем кнопку OK, и как вы видите, перед нами открывается тот самый журнал, в котором выполняются команды и в котором выводятся основные результаты. Во-первых, можно обратить внимание, что вот здесь вот, в синтаксисе языка, у нас наша команда была прописана на внутреннем языке пакета. То есть мы сейчас вычисляем с вами описательные статистики для вот этих четырех переменных, а далее перечислены, какие именно характеристики были указаны. То есть вместо того чтобы идти в пункт меню «Анализ» и выбирать кнопкой в графическом меню соответствующие пункты, мы могли с вами сразу же в журнале записать вот такую команду. Итак, что мы получили? Для наших характеристик мы видим, что каждая выборка содержит n наблюдений. Мы видим их минимальные и максимальные значения. Для каждой переменной мы можем посмотреть средние значения, вот они здесь: средний рост, средний вес нашей группы и так далее. Далее, среднеквадратическое отклонение, дисперсию, коэффициент асимметрии и коэффициент эксцесса. [МУЗЫКА] [МУЗЫКА]