Чем больше значение абсолютного показателя вариации тем вариация сильнее
Вариация понятие, относительные и абсолютные показатели, способы их расчета
Этот термин ведёт своё происхождение от латинского слова «varito». Оно переводится как «изменение» или «различие».
Вариация это количественная мера изменения определённых данных, которая помогает исследовать её случайные изменения. Для их анализа применяют различные статистические методы.
О них будет более подробно рассказано в этой статье.
Онлайн-калькулятор показателей вариации
Показатели вариации в статистике
Статистика широко применяется в самых различных областях. Она доказала свою пользу не только в естественных науках, но и в изучении различных социологических явлений, изменений цен, а также в других ситуациях.
Эта наука имеет дело со случайными величинами, изменение которых требует для своего описания использования специальных характеристик. Наиболее известной из них является средняя. Однако, хотя она и включает в себя некоторый объём информации, тем не менее не даёт возможности найти информацию о разбросе случайных данных, а также дать понятие о динамике изменения и наиболее вероятных тенденциях в дальнейшем.
Математический аппарат для изучения вариационных процессов использует характеристики, способы расчёта которых можно разделить на три группы.
Показатели размаха изменений говорят о том, какова разница между максимальными отклонениями исследуемых чисел:
Данные, относящиеся ко второй категории, можно считать так:
Для расчёта относительных показателей применяется:
Далее будет рассказано о наиболее часто применяемых математических характеристиках рассматриваемого понятия.
При проведении статистических вычислениях удобно пользоваться электронными таблицами Excel.
Абсолютные показатели вариации
Когда говорят об абсолютных показателях вариации, имеют в виду следующие методы для проведения статистического анализа:
Размах вариации
При рассмотрении изменения исследуемых данных, одной из важных характеристик является размах вариации.
Он равен разности между максимальной и минимальной границами. Посмотрим, как это характеристика исчисляется.
Формула выглядит так:
РВар = ЗнМакс — ЗнМин,
Пример.
Эта формула может быть применена, например, в следующей ситуации. Предположим, рассматривается рост отобранных случайным образом людей. В этой совокупности десять человек и рост их равен: 165, 172, 179, 190, 182, 171, 191, 183, 177 и 178 сантиметров. Эти цифры составляют совокупность значений случайных данных.
Как можно увидеть в рассматриваемом случае, минимальный рост в этой группе людей составляет 165 см, а максимальный — 191 см. Разница между ними составляет 191 — 165 = 26 см. Таким образом, рассматриваемое значение для определённой таким образом совокупности данных показывает 26 см.
Отклонение вариации
Здесь рассматривается отклонение изучаемой случайной величины. Для того, чтобы его вычислить, необходимо сначала определить её среднее значение.
Чтобы посчитать, необходимо просуммировать все значения случайных данных и затем разделить на их количество. Получившаяся величина представляет собой нужный результат.
В некоторых формулах используются значения весов, придаваемых каждому значению. Кратко говоря, они назначаются в соответствии с целями проведения статистического исследования. Веса обычно подбираются таким образом, чтобы их сумма была равна единице.
Среднее линейное простое
Оценка величины отклонения рассчитывается так:
Формула выглядит таким образом:
СЛП = (|x(1) – x0| + |x(2) – x0| + … + |x(n) – x(0)|) / n,
Вертикальные чёрточки используются для того, чтобы показать, что здесь вычисляется абсолютная разность.
Среднее линейное взвешенное
Для этого потребуется формула:
СЛВ = (|x(1) – x0|*f(1) + |x(2) – x0|*f(2) + … + |x(n) – x(0)|*f(n)) / n,
Остальные обозначения рассмотрены ранее.
Среднее квадратическое отклонение
В этом случае результат определяется по другому правилу, чем в прежних случаях:
СКО = SQRT(((x(1) – x0)**2 + (x(2) – x0)**2 + … + (x(n) – x(0))**2) / n),
Дисперсия (простая, взвешенная)
Простая дисперсия равна СКО, возведённому в квадрат.
Взвешенная называется так потому, что каждое слагаемое умножается на свой вес.
Здесь применяется формула:
ДВ = (f(1)*(x(1) – x0)**2 + f(2)*(x(2) – x0)**2 + … + f(n)*(x(n) – x(0))**2) / n*(f(1) + f(2) + … + f(n)),
где: ДВ представляет собой дисперсию взвешенную.
Вариация альтернативного признака
Это понятие характеризует те ситуации, когда часть предметов выборки обладает определённым свойством, а другая — нет:
СРЕД = ((1-p) + (0-p)) / (p+q) = p,
ВАР = (q*(1-p)**2+ q*(0-p)**2) / (p+q) = pq.
Здесь СРЕД обозначает среднее, а p и q представляют собой положительные числа, в сумме дающие единицу.
ВАР обозначает искомую величину.
Относительные показатели вариации
В данном случае рассматриваются отношение отклонения и среднего конкретной выборки. Для различных характеристик используются различные способы определения среднего отклонения.
Чем меньше полученный коэффициент, тем более сгруппированы данные. Этот коэффициент не имеет единиц измерения.
Коэффициент осцилляции
Эта величина равна частному от деления размаха вариации на среднее случайной величины.
Коэффициент вариации
Такой коэффициент можно рассчитать путём деления линейного отклонения на такой же знаменатель, как в предыдущем случае.
Относительное линейное отклонение
В данном случае искомое значение рассчитывается как результат деления среднего квадратического на этот же знаменатель.
Примеры расчетов
Здесь будет приведены примеры расчётов. Рассматривается ситуация, когда пять человек устраиваются на новую работу. В данной специальности они проработали различное количество лет: 2, 3, 4, 7 и 9 лет.
X(0) = (2 + 3 + 4 + 7 + 9) / 5 = 25 / 5 = 5.
СЛП = (|x(1) – x0| + |x(2) – x0| + … + |x(n) – x(0)|)/n = (|2 5| + |3 5| + |4 5| + |7 5| + |9 – 5|) / 5 = (3 + 2 + 1 + 2 + 4) / 5 = 12 / 5 = 2,4 года.
СКО = SQRT(((x(1) – x0)**2 + (x(2) – x0)**2 + … + (x(n) – x(0))**2)/n) = SQRT(((2 – 5)**2 + (3 – 5)**2 + (4 – 5)**2 + (7 – 5)**2 + (9 – 5)**2) / 5) = SQRT((3**2 + 2**2 + 1**2 + 2**2 + 4**2)/5) = SQRT ((9 + 4 + 1 + 4 + 16) / 5) = SQRT(34 / 5) = SQRT(6,80) = 2,61 года (приблизительное значение).
Последнее значение равно СКО, возведённому в квадрат.
В большинстве случаев расчет представляет собой гораздо более сложную задачу, чем показано в приведённом примере. Для облегчения процесса вычислений можно использовать онлайн калькулятор.
Заключение
Изучение случайных процессов играет важную роль в науке, экономике и общественной жизни. Для того, чтобы получить максимальное количество информации при их изучении, нужно активно использовать статистические методы, в том числе те, которые связаны с вариацией.
Тема 9 Показатели вариации
Показатели вариации в анализе взаимосвязей
Для измерения степени колеблемости отдельных значений признака относительно средней исчисляют основные показатели вариации.
Информация о средних уровнях исследуемых показателей обычно бывает недостаточной для полного анализа изучаемого процесса или явления. Иногда совершенно непохожие по своему внутреннему строению совокупности могут иметь равные средние величины. Поэтому для более детального изучения того или иного явления необходимо учитывать разброс или вариацию значений отдельных единиц совокупности. Измерение вариации признаков имеет как теоретическое, так и практическое значение.
Так, например, для выявления наиболее стабильно работающего коллектива или предприятия наравне с другими показателями рассчитывают и основные показатели вариации. Эти показатели дают возможность количественно определить размеры устойчивости производительности труда, уровня квалификации, цен на основные виды выпускаемой продукции и т.п. Измерение размеров вариации такого показателя, как «выполнение работ в срок» имеет важное значение для принятия решений заказчиками и инвесторами, т.к. ситуация, в которой присутствует изменчивость признака, часто содержит риск. Особое значение показатели вариации приобретают в анализе рынка ценных бумаг, где мера колеблемости отождествляется с мерой рискованности вложения денежных средств.
Основными показателями, характеризующими вариацию, являются:
1) Размах вариации
2) Среднее линейное отклонение исчисляют для того, чтобы дать обобщающую характеристику распределению отклонений:
где –абсолютные значения отклонений отдельных вариантов xi от средней арифметической ; fi – частота.
3. Дисперсия – это средняя арифметическая квадратов отклонений отдельных значений признака от их средней арифметической:
4. Среднее квадратическое отклонение – корень квадратный из дисперсии:
5. Коэффициент вариации – используется для сравнительной оценки вариации, а также для характеристики однородности совокупности:
Пример. Для иллюстрации расчетов воспользуемся данными нижеприведенной табл. 9.1:
Таблица 9.1 ‑ Данные о продаже основных марок холодильников:
Рассчитаем размах вариации.
R= 1200-460=740$
Пример вычисления размаха вариации
Размах вариации служит незаменимой мерой разброса экстремальных значений признака. Кроме характеристики границ разброса признака, размах вариации может быть использован для выявления ошибок. При наличии очень больших (или очень малых) ошибочно записанных значений признака размах вариации сразу резко возрастает, что требует проверки и корректировки исходных данных.
Недостатком данного показателя является то, что он оценивает только границы варьирующего признака и не отражает его колеблемость внутри этих границ. Вследствие этого размах вариации может неправильно характеризовать общую колеблемость признака.
Этого недостатка лишен другой показатель – дисперсия, рассчитываемый как средний квадрат отклонений значений признака от их средней величины.
Между индивидуальными отклонениями от средней и колеблемостью признака существует прямая зависимость: чем сильнее колеблемость признака, тем больше отклонения его значений от средней величины и менее устойчив изучаемый показатель.
Как и средняя величина этот показатель может быть рассчитан в двух формах: взвешенной и невзвешенной
По приведенным выше данным определим средневзвешенную цену холодильника:
Далее рассчитаем дисперсию:
. Следует отметить, что дисперсия еще не дает представления об однородности совокупности, и этому показателю трудно дать экономическую интерпретацию, т.к. он рассчитан в квадратных единицах. Поэтому следующим шагом в исследовании однородности совокупности является расчет среднего квадратического отклонения, показывающего, насколько в среднем отклоняются конкретные варианты признака от его среднего значения. Оно определяется как квадратный корень из дисперсии и имеет ту же размерность что и изучаемый признак. .
Рассчитаем среднее квадратическое отклонение
Рассмотренные показатели позволяют получить абсолютное значение вариации признака. Однако для сравнения разных совокупностей с точки зрения устойчивости какого-либо одного признака или для определения однородности совокупности рассчитывают относительные показатели.
Эти показатели вычисляются как отношение размаха вариации, среднего линейного отклонения или среднего квадратического отклонения к средней арифметической или медиане. Чаще всего эти показатели выражаются в процентах.
Определим значение показателя вариации по вышеприведенным данным таблицы
Совокупность считается однородной, если V не превышает 33%.
Если V 25% – вариация сильная.
Вывод: Рассчитанная величина свидетельствует о неоднородности цен на холодильники, т.к. однородной совокупность считается, если коэффициент вариации меньше 33% (для распределений близких к нормальному).
!! Следует отметить, что коэффициент вариации может быть более 100%, что, в частности, может быть при наличии значений сильно отличающихся от средней величины. Такой результат означает, что в исследуемой совокупности сильна вариация признаков по отношению к средней величине.
Изучая вариацию интересующего нас признака в пределах исследуемой совокупности и опираясь на общую среднюю в расчетах, трудно оценить степень воздействия на него какого-либо отдельного признака.
При проведении такого анализа исходная совокупность должна представлять собой множество единиц, каждая из которых характеризуется двумя признаками – факторным (оказывающим влияние на взаимосвязанный с ним признак) и результативным (подверженным влиянию).
Для выявления взаимосвязи исходная совокупность делится по факторному признаку на группы. Выводы о степени взаимосвязи базируются на анализе вариации результативного признака. Если статистическая совокупность разбита на группы по какому-либо признаку, то для оценки влияния различных факторов, определяющих вариацию индивидуальных значений признака, используют правило сложения дисперсий.
Общая дисперсия представляет собой сумму средней из виутригрупповой и межгрупповой и дисперсий:
Общая дисперсия характеризует вариацию признака по всей совокупности как результат влияния всех факторов, определяющих индивидуальные различия единиц совокупности.
Межгрупповая дисперсия характеризует вариацию, обусловленную влиянием фактора, положенного в основу группировки.
Средняя из внутригрупповых дисперсий отражает ту часть вариации результативного признака, которая обусловлена действием всех прочих неучтенных факторов, кроме фактора, по которому осуществлялась группировка. Другими словами внутригрупповая дисперсия отражает случайную вариацию. Внутригрупповая дисперсия рассчитывается отдельно по каждой j-ой группе.
Для всех групп в целом вычисляется средняя из внутригрупповых дисперсий, взвешенных на частоты соответствующих групп по формуле:
Взаимосвязь между тремя видами дисперсий получила название правила сложения дисперсий. Таким образом, зная два вида дисперсий всегда можно определить третий:
Из этого равенства следует, что общая дисперсия, как правило, будет больше средней из групповых дисперсий. Это обусловлено тем, что при расчленении общей совокупности единиц на части по какому-либо признаку образуются более или менее однородные группы, в результате чего сокращается колеблемость признаков в пределах каждой группы. Это приводит к тому, что средняя из групповых дисперсий оказывается меньше дисперсии признака по всей совокупности единиц, причем разница между этими показателями будет тем больше, чем однороднее получаются группы в результате расчленения общей совокупности.
Теснота связи между факторным и результативным признаками оценивается на основе эмпирического корреляционного отношения:
Данный показатель может принимать значения от 0 до 1. Чем ближе к 1 будет его величина, тем сильнее взаимосвязь между рассматриваемыми признаками.
Пример. На следующем условном примере исследуем зависимость объема выполненных работ от формы собственности проектно-изыскательских организаций.
Таблица 9.2. Выполнение работ проектно-изыскательскими организациями разной формы собственности
Форма собственности | Количество предприятий | Итого | |
Государственная | 4 | 10,30,20,40 | 100 |
Негосударственная | 6 | 20, 40, 60, 20, 50, 50 | 240 |
Итого | 10 | 340 |
1) Определим средний объем работ для предприятий двух форм собственности.
2) Определим средний объем работ для каждой формы собственности.
3) Рассчитаем общую и внутригрупповые (т.е. для каждой группы) дисперсии.
4) Определим среднюю из внутригрупповых и межгрупповую дисперсию. Для этого полученные ранее данные заносятся в таблицу расчета.
Таблица 9.3. – Вспомогательная таблица
Пример. Средняя из внутригрупповых дисперсий
Пример. Межгрупповая дисперсия
На последнем этапе решения задачи необходимо проверить тождество, отражающее закон сложения дисперсий:
Проверка закона сложения дисперсий: 54,0+189,8=243,8
Вывод: Таким образом, можно сделать вывод о том, что объем работ, выполненных проектно-изыскательскими организациями на 22% [(54,0/243,8) х 100%] зависит от фактора, положенного в основание группировки, т.е. от формы собственности, а на 78% [(189,8/243,8)х100%)] ‑ от прочих факторов.
Вывод о том, что объем выполненных работ в гораздо большей степени зависит от каких-либо других факторов, чем от формы собственности предприятий подтверждается и величиной эмпирического корреляционного отношения:
Вывод: Величина этого показателя свидетельствует о том, что зависимость объема работ от формы собственности предприятия невелика
Контрольные задания
Вычислить: а) размах вариации; б)среднее линейное отклонение; в) дисперсию; г) среднее квадратическое отклонение; относительные показатели вариации возраста студентов.
2. По данным статистических ежегодников постройте таблицу с рядом показателей и определите показатели вариации: а) размах; б) среднее линейное отклонение; в) среднее квадратическое отклонение; г) коэффициент вариации. Оцените количественную однородность совокупности.
Понятие вариации. Абсолютные показатели вариации
Вариация — это различие в значениях какого-либо признака у разных единиц данной совокупности в один и тот же период или момент времени.
Например, работники фирмы различаются по доходам, затратам времени на работу, уровню образования, уровню квалификации и т.д. Вариация возникает в результате того, что индивидуальные значения признака складываются под совокупным влиянием разнообразных факторов (условий), которые по-разному сочетаются в каждом отдельном случае.
Показатели вариации являются числовой мерой уровня колеблемости признака. Чем больше варианты отдельных единиц совокупности различаются между собой, тем больше они отличаются от своей средней, и наоборот, — чем меньше варианты отличаются друг от друга, тем меньше они отличаются от средней, которая в таком случае будет более реально представлять всю совокупность. Вот почему ограничиваться вычислением одной средней в ряде случаев нельзя. Нужны и другие показатели, характеризующие отклонения отдельных значений от средней.
К абсолютным показателям вариации относятся: размах вариации, среднее линейное отклонение, дисперсия и среднее квадратическое отклонение, квартильное отклонение. Для оценки интенсивности вариации и для сравнения ее в разных совокупностях используют относительные показатели вариации: коэффициент осцилляции, относительное линейное отклонение, коэффициент вариации.
Самым элементарным показателем вариации признака является размах вариации, представляющий собой разность между максимальным и минимальным значениями признака:
Величина размаха характеризует лишь максимальное различие значений признака.
Показателем вариации выступает среднее линейное отклонение. Этот показатель рассчитывается по формуле для несгруппированных данных
для сгруппированных данных
– среднее значение признака,
– i значение признака (варианта),
п – объем совокупности.
Среднее линейное отклонение нельзя поставить в соответствие, с каким- либо вероятностным законом, в том числе и с нормальным распределением, параметром которого является среднее квадратическое отклонение.
Расчет среднего квадратического отклонения проводится по формулам: для несгруппированных данных
для сгруппированных данных
Еще одним показателем силы вариации, характеризующим ее не по всей совокупности, а лишь в центральной части, служит среднее квартальное расстояние, т.е. средняя величина разности между квартилями, обозначаемое далее как q:
Сила вариации в центральной части совокупности, как правило, меньше, чем в целом по всей совокупности. Соотношение между средним линейным отклонением и средним квартильным отклонением также служит для изучения структуры вариации: большое значение такого соотношения говорит о наличии слабо варьирующего «ядра» и сильно рассеянного вокруг этого ядра окружения. Например, d:q=1,23, что говорит о небольшом различии силы вариации в центральной части совокупности и на ее периферии.
Под альтернативным понимается такой статистический показатель, который принимает одно из двух возможных значений (пол – женский или мужской, изделие годное или негодное, план по выпуску продукции – выполнен или не выполнен). Конкретное содержание альтернативного признака устанавливается самим исследователем. Обозначим: 1 — наличие интересующего нас признака; 0 — его отсутствие; р — доля единиц, обладающих данным признаком; q — доля единиц, не обладающих данным признаком; р + q =1. Расчет среднего значения альтернативного признака и среднее квадратическое отклонение альтернативного признака проводят по формулам:
среднее значение альтернативного признака
среднее квадратическое отклонение альтернативного признака