- Услуги
- Цена и срок
- О компании
- Контакты
- Способы оплаты
- Гарантии
- Отзывы
- Вакансии
- Блог
- Справочник
- Заказать консультацию
Центральное значение, или расположение распределения, — первое, что надо знать о группе данных. Следующая величина, которая представляет интерес, — это изменчивость данных, или «ширина» относительно центрального значения. Мы назовем значение центральной тенденции первым моментом распределения.
Изменчивость точек данных относительно центральной тенденции называется вто- рым моментом распределения. Следовательно, второй момент измеряет разброс распределения относительно первого момента.
Как и в случае с центральной тенденцией, существует много способов изме- рения разброса. Далее мы рассмотрим семь из них, начиная с наименее распро- страненных вариантов и заканчивая самыми распространенными.
Широта (range) распределения — это просто разность между самым высоким и самым низким значением распределения. Таким же образом широта перценти- ля 10–90 является разностью между 90-й и 10-й точками. Эти первые две величи- ны измеряют разброс по крайним точкам. Остальные пять измеряют отклонение от центральной тенденции (т. е. измеряют половину разброса).
Семиинтерквартильная широта (sem–interquartile range), или квартильное откло- нение (quartile deviation), равна половине расстояния между первым и третьим квартилями (25-й и 75-й перцентили). В отличие от широты перцентиля 10–90 здесь широта делится на два.
Полуширина (half–width) является наиболее распространенным способом изме- рения разброса. Сначала надо найти высоту распределения в его пике (моде), затем найти точку в середине высоты и провести через нее горизонтальную линию перпендикулярно вертикальной линии. Горизонтальная линия пересечет кривую распределения в одной точке слева и в одной точке справа. Расстояние между этими двумя точками называется полушириной.Среднее абсолютное отклонение (mean absolute deviation), или просто среднее отклонение, является средним арифметическим абсолютных значений разности значения каждой точки и среднего арифметического значений всех точек. Другими словами (что и следует из названия), это среднее расстояние, на которое значение точки данных удалено от среднего. В математических терминах:
i =1 M = 1 / N å ABS (Xi – A), (3.6)
где М — среднее абсолютное отклонение; N — общее число точек данных;
Xi — значение, соответствующее точке i; А — среднее арифметическое значений точек данных; ABS() — функция абсолютного значения.
Уравнение (3.6) дает нам совокупное среднее абсолютное отклонение. Вам следует знать, что можно рассчитать среднее абсолютное отклонение по выборке. Для расчета среднего абсолютного отклонения выборки замените 1 / N в уравнении (3.6) на 1 / (N – 1). Используйте эту версию, когда расчеты ведутся не по всей совокупности данных, а по некоторой выборке.
Самыми распространенными величинами для измерения разброса являются дисперсия и стандартное отклонение. Как и в случае со средним абсолютным отклонением, их можно рассчитать для всей совокупности и для выборки. Далее показана версия для всей совокупности данных, которую можно легко переделать в выборочную версию, заменив 1 / N на 1 / (N – 1).
Дисперсия (variance) чем-то напоминает среднее абсолютное отклонение, но при расчете дисперсии каждая разность значения точки данных и среднего значения возводится в квадрат. В результате нам не надо брать абсолютное значение каждой разности, так как мы автоматически получаем положительный результат независимо от того, была эта разность отрицательной или положительной.
Кроме того, так как в квадрат возводится каждая из этих величин, крайние выпадающие значения оказывают большее влияние на дисперсию, а не на среднее абсолютное отклонение. В математических терминах:
V = 1 / N å ((Xi – A) ^ 2), (3.7)
i =1 где V — дисперсия;
N — общее число точек данных;
Xi — значение, соответствующее точке i;
А — среднее арифметическое значений точек данных.
Стандартное отклонение (standard deviation) тесно связано с дисперсией (и, следовательно, со средним абсолютным отклонением). Стандартное отклонение является квадратным корнем дисперсии.