- Услуги
- Цена и срок
- О компании
- Контакты
- Способы оплаты
- Гарантии
- Отзывы
- Вакансии
- Блог
- Справочник
- Заказать консультацию
Существует еще одна характеристика распределения данных, полученных по непрерывным шкалам, которую исследователь тоже должен обязательно учитывать. Это форма распределения.
Данные распределения старшеклассников по возрасту являются примером нормального распределения. Нормальным является такое распределение, при котором кри-вая построенного по его данным графика представляет собой колоколообразную симметричную кривую.Например, если мы построим график по данным распределения старшеклассников по возрасту, то получим соответствующую колоколообразную кривую. Если же мы построим график по массиву третьеклассников и учителей, опрошенных в одной школе, мы получим две кривые.
Нормальное распределение — это теоретическая кривая. Практически любые эмпирические данные в той или иной степени отклоняются от нормального распределения вероятностей, закону которого подчиняются распределения случайных величин.
Но поскольку все расчеты, включающие значение среднего арифметического и “стандартного отклонения, основаны на теории вероятности, в аналитическую задачу исследователя входит оценка (по крайней мере, приблизительная) того, насколько правомерно использовать данный тип анализа к полученным результатам.
Поэтому даже на уровне описания (не говоря уже о множественном анализе), прежде чем приводить данные по их средним значениям (среднее арифметическое и стандартное отклонение), необходимо оценить характер формы распределения — в какой степени она приближается к нормальному распределению.
Для этого используют показатели скоса (ассиметрии, skewness) и эксцесса (kunosis). В скобках указываются термины, которые обычно у разных авторов используются для обозначения одних и тех же понятий. В частности, здесь при¬ведены англоязычные обозначения рассматриваемых характеристик, которые приводятся в компьютерной программе обработки и анализа социологических данных — SPSS. Показатель скоса (skewness) позволяет оценить степень и направленность ассиметрии кривой распределения.
В случае идеального нормального распределения ассиметрия равна нулю.
В эмпирической социологии идеальные нормальные распределения практически не встречаются. Но существуют методы оценки степени приближения полученного распределения к нормальному. Коэффициент скоса имеет числовое значение и знак, указывающий направленность скоса.
Чем больше величина отличается от нуля, тем большая асимметрия у полученного распределения, и, соответственно, большая погрешность может проявиться при применении коэффициентов статистического анализа, формула которых включает значения стандартного отклонения.
Существуют специальные процедуры оценки степени допустимости такой погрешности, а также искусственной нормализации шкалы. Исследователь может, при необходимости, осуществлять преобразование данных.
С различными способами преобразования данных можно ознакомиться в специальной справочной и учебной литературе, но исследователю необходимо обязательно оценить степень асимметрии. (Простейшим косвенным показателем, указывающим на асимметрию, является расхождение между значениями среднего арифметического, моды и медианы; при идеальном нормальном распределении все три показателя равны).
Показатель эксцесса (kurtosis) показывает, в какой степени «крутизна» полученной кривой приближается к нормальному распределению.
Таким образом, на первом этапе анализа (описания данных), представляя данные, полученные с помощью не-прерывных шкал (метрических и интервальных), исследователь должен руководствоваться следующими правилами.
Допустим, если автор анализа приводит данные по средней заработной плате различных групп населения, то эти параметры позволят не только сравнить — насколько различается средняя заработная плата “у каких-либо двух категорий работников, представленных в таблице, но и оценить — является ли это различие статистически значимым (с какой степенью вероятности мы получим то же самое различие при повторных исследованиях на других аналогичных выборках).
Такое представление данных позволяет переходить на следующий уровень анализа — объяснение и интерпретация полученных данных.