Абсолютный уровень ряда-величины (уровни), из которых состоит динамический ряд(отражают
явления на определенный момент или интервал времени))
Абсолютный прирост представляет собой разность между последующим и предыдущим уровнем.
Темп роста - это отношение последующего уровня к предыдущему, умноженное на 100%.
Темп прироста является отношением абсолютного прироста (снижения) к предыдущему уровню, умноженным на 100%.
Значение 1% прироста определяется отношением абсолютного прироста к темпу прироста.
Показатель наглядности (показывает отношение каждого уровня ряда к одному из них, чаще начальному, принятому за 100%).
Вариационный ряд - ряд однородных статистических величин, характеризующих один и тот же количественный учетный признак, отличающихся друг от друга по своей величине и расположенных в определенном порядке (убывания или возрастания).
Элементы вариационного ряда:
а) варианта - v - числовое значение изучаемого меняющегося количественного признака.
б) частота - p или f - повторяемость вариант в вариационном ряду, показывающая, как часто встречается та или иная варианта в составе данного ряда.
в) общее число наблюдений- n - сумма всех частот: n=ΣΡ. Если общее число наблюдений более 30,статистическая выборка считается большой , если n меньше или равно 30 - малой .
Вариационные ряды бывают:
в зависимости от частоты встречаемости признака:
а) простой - ряд - каждая варианта встречается один раз, т.е. частоты равны единице.
б) обычный - ряд, в котором варианты встречаются более одного раза.
в) сгруппированный - ряд, в котором варианты объединены в группы по их величине в пределах определенного интервала с указанием частоты повторяемости всех вариант, входящих в группу.
Сгруппированный вариационный ряд используют при большом числе наблюдений и большом размахе крайних значений вариант.
Обработка вариационного ряда заключается в получении параметров вариационного ряда (средней величины, среднего квадратического отклонения и средней ошибки средней величины).
3. в зависимости от числа наблюдений:
а) четные и нечетные
б) большой (при числе наблюдений больше 30) и малый (если число наблюдений меньше или равно 30)
Средние величины дают обобщающую характеристику статистической совокупности по определенному изменяющемуся количественному признаку. Средняя величина характеризует весь ряд наблюдений одним числом , выражающим общую меру изучаемого признака. Она нивелирует случайные отклонения отдельных наблюдений и дает типичную характеристику количественного признака.
Требования к средним величинам:
1) качественная однородность совокупности, для которой рассчитывается средняя величина - только тогда она будет объективно отображать характерные особенности изучаемого явления.
2) средняя величина должна основываться на массовом обобщении изучаемого признака, т.к. только тогда она выражает типичные размеры признака
Средние величины получаются из рядов распределения (вариационных рядов).
Виды средних величин:
а) мода (Мо) - величина признака, чаще других встречающаяся в совокупности. За моду принимают варианту, которой соответствует наибольшее количество частот вариационного ряда.
б) Медиана (Me) - величина признака, занимающая срединное значение в вариационном ряду. Она делит вариационный ряд на две равные части.
На величину моды и медианы не оказывают влияния числовые значения крайних вариант, имеющихся в вариационном ряду. Они не всегда могут точно характеризовать вариационный ряд и применяются в медицинской статистике относительно редко. Более точно характеризует вариационный ряд средняя арифметическая величина.
в) Средняя арифметическая (М, или ) - рассчитывается на основе всех числовых значений изучаемого признака.
Реже применяются другие средние величины: средняя геометрическая (при обработке результатов титрования антител, токсинов, вакцин); средняя квадратическая (при определении среднего диаметра среза клеток, результатов накожных иммунологических проб); средняя кубическая (для определения среднего объема опухолей) и другие.
В простом вариационном
ряду, где варианты встречаются только
по одному разу, вычисляется средняя
арифметическая простая по формуле:
где
V
- числовые значения вариант, n - число
наблюдений,
В обычном вариационном
ряду вычисляется средняя арифметическая
взвешенная по формуле:
Где V - числовые значения вариант, р - частота встречаемости вариант, n - число наблюдений.
Одинаковые по величине средние могут быть получены из рядов с различной степенью рассеяния, поэтому для характеристики вариационного ряда, помимо средней величины, необходима другая характеристика, позволяющая оценить степень его колеблемости.
Простыми показателями, характеризующими разнообразие признака в изучаемой совокупности, являются
а) лимит - минимальное и максимальное значение количественного признака
б) амплитуда - разность между наибольшим и наименьшим значением вариант.
Применение средних величин:
а) для характеристики физического развития (рост, вес, окружность груди, динамометрия)
б) для оценки состояния здоровья человека путем анализа физиологических, биохимических параметров организма (уровня АД, ЧСС, температуры тела)
в) для анализа деятельности медицинских организаций (среднее число дней работы койки в году и т.д.)
г) для оценки работы врачей (среднее число посещений на одного врача, среднее число хирургических операций, среднечасовая нагрузка врача на приеме в поликлинике)
Наличие общего признака является основой для образования статистической совокупности, которая представляет собой результаты описания или измерения общих признаков объектов исследования.
Предметом изучения в статистике являются изменяющиеся (варьирующие) признаки или статистические признаками.
Виды статистических признаков .
Атрибутивными называют ряды распределения
, построенные по качественным признакам. Атрибутивный
– это признак, имеющий наименование, (например профессия: швея, учитель и т.д.).
Ряд распределения принято оформлять в виде таблиц. В табл. 2.8 приведён атрибутивный ряд распределения.
Таблица 2.8 - Распределение видов юридической помощи, оказанной адвокатами гражданам одного из регионов РФ.
В зависимости от характера вариации признака различают дискретные и интервальные вариационные ряды
.
Пример дискретного вариационного ряда приведен в табл. 2.9.
Таблица 2.9 - Распределение семей по числу занимаемых комнат в отдельных квартирах в 1989 г. в РФ.
Таблица 1. Общий вид дискретного вариационного ряда частот
Значения признака | x i | x 1 | x 2 | … | x n |
Частоты | m i | m 1 | m 2 | … | m n |
Таблица 2. Общий вид интервального вариационного ряда частот
Таблица 3. Графические изображения вариационного ряда
Ряд | Полигон или гистограмма | Эмпирическая функция распределения | |
Дискретный | |||
Интервальный |
В табл. 2.3 (Группировка населения России по размеру среднедушевого дохода в апреле 1994г.) представлен интервальный вариационный ряд
.
Удобно ряды распределения анализировать при помощи графического изображения, позволяющего судить и о форме распределения. Наглядное представление о характере изменения частот вариационного ряда дают полигон и гистограмма
.
Полигон используется при изображении дискретных вариационных рядов
.
Изобразим, например графически распределение жилого фонда по типу квартир, (табл. 2.10).
Таблица 2.10 - Распределение жилого фонда городского района по типу квартир (цифры условные).
Рис. Полигон распределения жилого фонда
N п/п | Группы семей по размеру жилой площади, приходящейся на одного человека | Число семей с данным размером жилой площади | Накопленное число семей |
1 | 3 – 5 | 10 | 10 |
2 | 5 – 7 | 20 | 30 |
3 | 7 – 9 | 40 | 70 |
4 | 9 – 11 | 30 | 100 |
5 | 11 – 13 | 15 | 115 |
ВСЕГО | 115 | ---- |
Рис. 2.2. Гистограмма распределения семей по размеру жилой площади, приходящейся на одного человека
Рис. 2.3. Кумулята распределения семей по размеру жилой площади, приходящейся на одного человека
N п/п | Группы предприятий по числу занятых, чел. | Число предприятий | Величина интервала, чел. | Плотность распределения |
А | 1 | 2 | 3=1/2 | |
1 | До 20 | 15 | 20 | 0,75 |
2 | 20 – 80 | 27 | 60 | 0,25 |
3 | 80 – 150 | 35 | 70 | 0,5 |
4 | 150 – 300 | 60 | 150 | 0,4 |
5 | 300 – 500 | 10 | 200 | 0,05 |
ВСЕГО | 147 | ---- | ---- |
Для графического изображения вариационных рядов может также использоваться кумулятивная кривая . При помощи кумуляты (кривой сумм) изображается ряд накопленных частот. Накопленные частоты определяются путём последовательно суммирования частот по группам и показывают, сколько единиц совокупности имеют значения признака не больше, чем рассматриваемое значение.
Рис. 2.4. Огива распределения семей по размеру жилой площади, приходящейся на одного человека
При построении кумуляты интервального вариационного ряда по оси абсцисс откладываются варианты ряда, а по оси ординат накопленные частоты.
Представляются в виде рядов распределения и оформляются в виде .
Ряд распределния является одним из видов группировок.
Ряд распределения — представляет собой упорядоченное распределение единиц изучаемой совокупности на группы по определенному варьирующему признаку.
В зависимости от признака, положенного в основу образования ряда распределения различают атрибутивные и вариационные ряды распределения:
В первом столбце приводятся количественные значения варьирующегося признака, которые называются вариантами
и обозначаются . Дискретная варианта — выражается целым числом. Интервальная варианта находится в пределах от и до. В зависимости от типа варианты можно построить дискретный или интервальный вариационный ряд.
Во втором столбце содержится количество конкретных вариант
, выраженное через частоты или частости:
Частоты — это абсолютные числа, показывающие столько раз в совокупности встречается данное значение признака, которые обозначают . Сумма всех частот равна должна быть равна численности единиц всей совокупности.
Частости () — это частоты выраженные в процентах к итогу. Сумма всех частостей выраженных в процентах должна быть равна 100% в долях единице.
Наглядно ряды распределения представляются при помощи графических изображений.
Ряды распределения изображаются в виде:При построении полигона на горизонтальной оси (ось абсцисс) откладывают значения варьирующего признака, а на вертикальной оси (ось ординат) — частоты или частости.
Полигон на рис. 6.1 построен по данным микропереписи населения России в 1994 г.
6.1. Распределение домохозяйств по размеруУсловие
: Приводятся данные о распределении 25 работников одного из предприятий по тарифным разрядам:
4; 2; 4; 6; 5; 6; 4; 1; 3; 1; 2; 5; 2; 6; 3; 1; 2; 3; 4; 5; 4; 6; 2; 3; 4
Задача
: Построить дискретный вариационный ряд и изобразить его графически в виде полигона распределения.
Решение
:
В данном примере вариантами является тарифный разряд работника. Для определения частот необходимо рассчитать число работников, имеющих соответствующий тарифный разряд.
Полигон используется для дискретных вариационных рядов.
Для построения полигона распределения (рис 1) по оси абсцисс (X) откладываем количественные значения варьирующего признака — варианты, а по оси ординат — частоты или частости.
Если значения признака выражены в виде интервалов, то такой ряд называется интервальным.
Интервальные ряды
распределения изображают графически в виде гистограммы, кумуляты или огивы.
Условие
: Приведены данные о размерах вкладов 20 физических лиц в одном банке (тыс.руб) 60; 25; 12; 10; 68; 35; 2; 17; 51; 9; 3; 130; 24; 85; 100; 152; 6; 18; 7; 42.
Задача
: Построить интервальный вариационный ряд с равными интервалами.
Решение
:
При такой записи непрерывного признака, когда одна и та же величина встречается дважды (как верхняя граница одного интервала и нижняя граница другого интервала), то эта величина относится к той группе, где эта величина выступает в роли верхней границы.
Для построения гистограммы по оси абсцисс указывают значения границ интервалов и на их основании строят прямоугольники, высота которых пропорциональна частотам (или частостям).
На рис. 6.2. изображена гистограмма распределения населения России в 1997 г. по возрастным группам.
Рис. 6.2. Распределение населения России по возрастным группамУсловие : Приводится распределение 30 работников фирмы по размеру месячной заработной платы
Задача
: Изобразить интервальный вариационный ряд графически в виде гистограммы и кумуляты.
Решение
:
Для построения кумуляты необходимо рассчитать накопленные частоты (частости). Они определяются путем последовательного суммирования частот (частостей) предшествующих интервалов и обозначаются S. Накопленные частоты показывают, сколько единиц совокупности имеют значение признака не больше, чем рассматриваемое.
Распределение признака в вариационном ряду по накопленным частотам (частостям) изображается с помощью кумуляты.
Кумулята или кумулятивная кривая в отличие от полигона строится по накопленным частотам или частостям. При этом на оси абсцисс помещают значения признака, а на оси ординат — накопленные частоты или частости (рис. 6.3).
Рис. 6.3. Кумулята распределения домохозяйств по размеру4. Рассчитаем накопленные частоты:
Наколенная частота первого интервала рассчитывается следующим образом: 0 + 4 = 4, для второго: 4 + 12 = 16; для третьего: 4 + 12 + 8 = 24 и т.д.
При построении кумуляты накопленная частота (частость) соответствующего интервала присваивается его верхней границе:
Огива строится аналогично кумуляте с той лишь разницей, что накопленные частоты помещают на оси абсцисс, а значения признака — на оси ординат.
Разновидностью кумуляты является кривая концентрации или график Лоренца. Для построения кривой концентрации на обе оси прямоугольной системы координат наносится масштабная шкала в процентах от 0 до 100. При этом на оси абсцисс указывают накопленные частости, а на оси ординат — накопленные значения доли (в процентах) по объему признака.
Равномерному распределению признака соответствует на графике диагональ квадрата (рис. 6.4). При неравномерном распределении график представляет собой вогнутую кривую в зависимости от уровня концентрации признака.
6.4. Кривая концентрацииСтатистические ряды распределения представляют собой упорядоченное расположение единиц изучаемой совокупности на группы по группировочному признаку.
Различают атрибутивные и вариационные ряды распределения.
Атрибутивный - это ряд распределения, построенный по качественным признакам. Он характеризует состав совокупности по различным существенным признакам.
По количественному признаку строится вариационный ряд распределения. Он состоит из частоты (численности) отдельных вариантов или каждой группы вариационного ряда. Данные числа показывают, насколько часто встречаются различные варианты (значения признака) в ряду распределения. Сумма всех частот определяет численность всей совокупности.
Численности групп выражаются в абсолютных и относительных величинах. В абсолютных величинах выражается числом единиц совокупности в каждой выделенной группе, а в относительных величинах - в виде долей, удельных весов, представленных в процентах к итогу.
В зависимости от характера вариации признака различают дискретные и интервальные вариационные ряды распределения. В дискретном вариационном ряде распределения группы составлены по признаку, изменяющемуся дискретно и принимающему только целые значения.
В интервальном вариационном ряде распределения группиро-вочный признак, составляющий основание группировки, может принимать в определенном интервале любые значения.
Вариационные ряды состоят из двух элементов: частоты и варианты.
Вариантой называют отдельное значение варьируемого признака, которое он принимает в ряду распределения.
Частота - это численность отдельных вариант или каждой группы вариационного ряда. Если частоты выражены в долях единицы или в процентах к итогу, то их называют частостями.
Правила и принципы построения интервальных рядов распределения строятся по аналогичным правилам и принципам построения статистических группировок. Если интервальный вариационный ряд распределения построен с равными интервалами, частоты позволяют судить о степени заполнения интервала единицами совокупности. Для проведения сравнительного анализа заполненности интервалов определяют показатель, который будет характеризовать плотность распределения.
Плотность распределения - это отношение числа единиц совокупности к ширине интервала.
Вариационными называют ряды распределения, построенные по количественному признаку. Любой вариационный ряд состоит из двух элементов: вариантов и частот. Вариантами считаются отдельные значения признака, которые он принимает в вариационном ряду, т е. конкретное значение варьирующего признака. Частоты - это численности отдельных вариантов или каждой группы вариационного ряда, т. е. это числа, показывающие, как часто встречаются те или иные варианты в ряду распределения. Сумма всех частот определяет численность всей совокупности, ее объем.
Частостями называются частоты, выраженные в долях единицы или в процентах к итогу. Соответственно сумма частостей равна 1 или 100%.
В зависимости от характера вариации признака различают дискретные и интервальные вариационные ряды.
Как известно, вариация количественных признаков может быть дискретной (прерывной) или непрерывной.
В случае дискретной вариации величина количественного признака принимает только целые значения. Следовательно, дискретный вариационный рядхарактеризует распределение единиц совокупности по дискретному признаку. Примером дискретного вариационного ряда является распределение семей по числу комнат в отдельных квартирах, приведенное в табл. 3.12.
В первой колонке таблицы представлены варианты дискретного вариационного ряда, во второй - помещены частоты вариационного ряда, а в третьей - показаны частости.
В случае непрерывной вариации величина признака у единиц совокупности может принимать в определенных пределах любые значения, отличающиеся друг от друга на сколько угодно малую величину. Построение интервальных вариационныхрядов целесообразно прежде всего при непрерывной вариации признака, а также если дискретная вариация проявляется в широких пределах, т. е. число вариантов дискретного признака достаточно велико. В табл. 3.3 представлен интервальный вариационный ряд.
Графическое изображение рядов распределения
Анализ рядов распределения можно проводить на основе их графического изображения. Линейчатые и круговые диаграммы строятся для отображения структуры совокупности.
Применяются вместе с диаграммами и такие линии, как полигон, кумулята, огива, гистограмма. При изображении дискретных вариационных рядов используется полигон.
Полигон - ломаная кривая, строится на основе прямоугольной системы координат, когда по оси Х откладываются значения признака, а по оси У - частоты.
Гладкая кривая, соединяющая точки - это эмпирическая плотность распределения.
Кумулята - ломаная кривая, строящаяся на основе прямоугольной системы координат, когда по оси Х откладываются значения признака, а по оси У - накопленные частоты.
Для дискретных рядов на оси откладываются сами значения признака, а для интервальных - середины интервалов.
На основе гистограмм можно строить диаграммы накопленных частот с последующим построением интегральной эмпирической функции распределения.
В результате освоения дайной главы студент должен: знать
владеть
При статистическом исследовании признаков различных статистических совокупностей большой интерес представляет изучение вариации признака отдельных статистических единиц совокупности, а также характера распределения единиц по данному признаку. Вариация - это различия индивидуальных значений признака у единиц изучаемой совокупности. Исследование вариации имеет большое практическое значение. По степени вариации можно судить о границах вариации признака, однородности совокупности по данному признаку, типичности средней, взаимосвязи факторов, определяющих вариацию. Показатели вариации используются для характеристики и упорядочения статистических совокупностей.
Результаты сводки и группировки материалов статистического наблюдения, оформленные в виде статистических рядов распределения, представляют собой упорядоченное распределение единиц изучаемой совокупности на группы по группировочному (варьирующему) признаку. Если за основу группировки взят качественный признак, то такой ряд распределения называют атрибутивным (распределение по профессии, по полу, по цвету и т.д.). Если ряд распределения построен по количественному признаку, то такой ряд называют вариационным (распределение по росту, весу, по размеру заработной платы и т.д.). Построить вариационный ряд - значит упорядочить количественное распределение единиц совокупности по значениям признака, подсчитать число единиц совокупности с этими значениями (частоту), результаты оформить в таблицу.
Вместо частоты варианта возможно применение ее отношения к общему объему наблюдений, которое называется частостью (относительной частотой).
Выделяют два вида вариационного ряда: дискретный и интервальный. Дискретный ряд - это такой вариационный ряд, в основу построения которого положены признаки с прерывным изменением (дискретные признаки). К последним можно отнести число работников на предприятии, тарифный разряд, количество детей в семье и т.д. Дискретный вариационный ряд представляет таблицу, которая состоит из двух граф. В первой графе указывается конкретное значение признака, а во второй - число единиц совокупности с определенным значением признака. Если признак имеет непрерывное изменение (размер дохода, стаж работы, стоимость основных фондов предприятия и т.д., которые в определенных границах могут принимать любые значения), то для этого признака возможно построение интервального вариационного ряда. Таблица при построении интервального вариационного ряда также имеет две графы. В первой указывается значение признака в интервале «от - до» (варианты), во второй - число единиц, входящих в интервал (частота). Частота (частота повторения) - число повторений отдельного варианта значений признака. Интервалы могут быть закрытые и открытые. Закрытые интервалы ограничены с обеих сторон, т.е. имеют границу как нижнюю («от»), так и верхнюю («до»). Открытые интервалы имеют какую-либо одну границу: либо верхнюю, либо нижнюю. Если варианты расположены по возрастанию или убыванию, то ряды называются ранжированными.
Для вариационных рядов существует два типа вариантов частотных характеристик: накопленная частота и накопленная частость. Накопленная частота показывает, в скольких наблюдениях величина признака приняла значения меньше заданного. Накопленная частота определяется путем суммирования значений частоты признака по данной группе со всеми частотами предшествующих групп. Накопленная частость характеризует удельный вес единиц наблюдения, у которых значения признака не превосходят верхнюю границу дайной группы. Таким образом, накопленная частость показывает удельный вес вариант в совокупности, имеющих значение не больше данного. Частота, частость, абсолютная и относительная плотности, накопленные частота и частость являются характеристиками величины варианта.
Вариации признака статистических единиц совокупности, а также характер распределения изучаются с помощью показателей и характеристик вариационного ряда, к числу которых относятся средний уровень ряда, среднее линейное отклонение, среднее квадратическое отклонение, дисперсия, коэффициенты осцилляции, вариации, асимметрии, эксцесса и др.
Для характеристики центра распределения применяются средние величины. Средняя представляет собой обобщающую статистическую характеристику, в которой получает количественное выражение типичный уровень признака, которым обладают члены изучаемой совокупности. Однако возможны случаи совпадения средних арифметических при разном характере распределения, поэтому в качестве статистических характеристик вариационных рядов рассчитываются так называемые структурные средние - мода, медиана, а также квантили, которые делят ряд распределения на равные части (квартили, децили, перцентили и т.д.).
Мода - это значение признака, которое встречается в ряду распределения чаще, чем другие его значения. Для дискретных рядов - это варианта, имеющая наибольшую частоту. В интервальных вариационных рядах с целью определения моды необходимо определить прежде всего интервал, в котором она находится, так называемый модальный интервал. В вариационном ряду с равными интервалами модальный интервал определяется по наибольшей частоте, в рядах с неравными интервалами - но наибольшей плотности распределения. Затем для определения моды в рядах с равными интервалами применяют формулу
где Мо - значение моды; х Мо - нижняя граница модального интервала; h - ширина модального интервала; / Мо - частота модального интервала; / Mo j - частота домодального интер- вала; / Мо+1 - частота послемодального интервала, а для ряда с неравными интервалами в данной формуле расчета вместо частот / Мо, / Мо, / Мо следует использовать плотности распределения Ум 0 _| , Ум 0> УМо+"
Если имеется единственная мода, то распределение вероятностей случайной величины называется унимодальным; если имеется более чем одна мода, оно называется многомодальным (полимодальным, мультимодальным), в случае двух мод - бимодальным. Как правило, многомодальность указывает, что исследуемое распределение не подчиняется закону нормального распределения. Для однородных совокупностей, как правило, характерны одновершинные распределения. Многовершинность свидетельствует также о неоднородности изучаемой совокупности. Появление двух и более вершин делает необходимой перегруппировку данных с целью выделения более однородных групп.
В интервальном вариационном ряду моду можно определить графически с помощью гистограммы. Для этого из верхних точек самого высокого столбца гистограммы до верхних точек двух смежных столбцов проводят две пересекающиеся линии. Затем из точки их пересечения опускают перпендикуляр на ось абсцисс. Значение признака на оси абсцисс, соответствующее перпендикуляру, является модой. Во многих случаях при характеристике совокупности в качестве обобщенного показателя отдается предпочтение моде, а не средней арифметической.
Медиана - это центральное значение признака, им обладает центральный член ранжированного ряда распределения. В дискретных рядах, чтобы найти значение медианы, сначала определяется ее порядковый номер. Для этого при нечетном числе единиц к сумме всех частот прибавляется единица, число делится на два. При четном числе единиц в ряду будет две медианные единицы, поэтому в этом случае медиана определяется как средняя из значений двух медианных единиц. Таким образом, медианой в дискретном вариационном ряду является значение, которое делит ряд на две части, содержащие одинаковое число вариантов.
В интервальных рядах после определения порядкового номера медианы отыскивается медиальный интервал по накопленным частотам (частостям), а затем при помощи формулы расчета медианы определяется значение самой медианы:
где Me - значение медианы; х Ме - нижняя граница медианного интервала; h - ширина медианного интервала; - сумма частот ряда распределения; /Д - накопленная частота домедианного интервала; / Ме - частота медианного интервала.
Медиану можно отыскать графически с помощью куму- ляты. Для этого на шкале накопленных частот (частостей) кумуляты из точки, соответствующей порядковому номеру медианы, проводится прямая, параллельная оси абсцисс, до пересечения с кумулятой. Далее из точки пересечения указанной прямой с кумулятой опускается перпендикуляр на ось абсцисс. Значение признака на оси абсцисс, соответствующее проведенной ординате (перпендикуляру), является медианой.
Медиана характеризуется следующими свойствами.
Эти свойства медианы широко используются при проектировании расположения пунктов массового обслуживания - школ, поликлиник, автозаправочных станций, водозаборных колонок и т.д. Например, если в определенном квартале города предполагается построить поликлинику, то расположить ее целесообразнее в такой точке квартала, которая делит пополам не длину квартала, а число жителей.
Соотношение моды, медианы и средней арифметической указывает на характер распределения признака в совокупности, позволяет оценить симметричность распределения. Если х Me то имеет место правосторонняя асимметрия ряда. При нормальном распределении х - Me - Мо.
К. Пирсон на основе выравнивания различных типов кривых определил, что для умеренно асимметричных распределений справедливы такие приближенные соотношения между средней арифметической, медианой и модой:
где Me - значение медианы; Мо - значение моды; х арифм - значение средней арифметической.
Если возникает необходимость изучить структуру вариационного ряда более подробно, то вычисляют значения признака, аналогичные медиане. Такие значения признака делят все единицы распределения на равные численности, их называют квантилями или градиентами. Квантили подразделяются на квартили, децили, перцентили и т.п.
Квартили делят совокупность на четыре равные части. Первую квартиль вычисляют аналогично медиане по формуле расчета первой квартили, предварительно определив первый квартальный интервал:
где Qi - значение первой квартили; x Q ^ - нижняя граница первого квартильного интервала; h - ширина первого квартального интервала; /, - частоты интервального ряда;
Накопленная частота в интервале, предшествующем первому квартильиому интервалу; Jq { - частота первого квартильного интервала.
Первая квартиль показывает, что 25% единиц совокупности меньше ее значения, а 75% - больше. Вторая квартиль равна медиане, т.е. Q 2 = Me.
По аналогии рассчитывают третью квартиль, предварительно отыскав третий квартальный интервал:
где - нижняя граница третьего квартильного интервала; h - ширина третьего квартильного интервала; /, - частоты интервального ряда; /X" - накопленная частота в интервале, предшествующем
г
третьему квартильиому интервалу; Jq - частота третьего квартильного интервала.
Третья квартиль показывает, что 75% единиц совокупности меньше ее значения, а 25% - больше.
Разность между третьей и первой квартилями представляет собой межквартильный интервал:
где Aq - значение межквартильного интервала; Q 3 - значение третьей квартили; Q, - значение первой квартили.
Децили делят совокупность на 10 равных частей. Дециль - это такое значение признака в ряду распределения, которому соответствуют десятые доли численности совокупности. По аналогии с квартилями первый дециль показывает, что 10% единиц совокупности меньше его значения, а 90% - больше, а девятый дециль выявляет, что 90% единиц совокупности меньше его значения, а 10% - больше. Соотношение девятого и первого децилей, т.е. децильный коэффициент, широко применяется при изучении дифференциации доходов для измерения соотношения уровней доходов 10% наиболее обеспеченного и 10% наименее обеспеченного населения. Перцентили делят ранжированную совокупность на 100 равных частей. Расчет, значение и применение перцентилей аналогичны децилям.
Квартили, децили и другие структурные характеристики можно определить графически по аналогии с медианой с помощью кумуляты.
Для измерения размера вариации используются следующие показатели: размах вариации, среднее линейное отклонение, среднее квадратическое отклонение, дисперсия. Величина размаха вариации целиком зависит от случайности распределения крайних членов ряда. Этот показатель представляет интерес в тех случаях, когда важно знать, какова амплитуда колебаний значений признака:
где R - значение размаха вариации; х тах - максимальное значение признака; х тт - минимальное значение признака.
При расчете размаха вариации значение подавляющего большинства членов ряда не учитывается, в то время как вариация связана с каждым значением члена ряда. Этого недостатка лишены показатели, представляющие собой средние, полученные из отклонений индивидуальных значений признака от их средней величины: среднее линейное отклонение и среднее квадратическое отклонение. Между индивидуальными отклонениями от средней и колеблемостью конкретного признака существует прямая зависимость. Чем сильнее колеблемость, тем больше абсолютные размеры отклонений от средней.
Среднее линейное отклонение представляет собой среднюю арифметическую из абсолютных величин отклонений отдельных вариантов от их средней величины.
Среднее линейное отклонение для несгруппированных данных
где / пр - значение среднего линейного отклонения; х,- - значение признака; х - п - число единиц совокупности.
Среднее линейное отклонение сгруппированного ряда
где / вз - значение среднего линейного отклонения; х, - значение признака; х - среднее значение признака для изучаемой совокупности; / - число единиц совокупности в отдельной группе.
Знаки отклонений в данном случае игнорируются, в противном случае сумма всех отклонений будет равна нулю. Среднее линейное отклонение в зависимости от группировки анализируемых данных рассчитывается по различным формулам: для сгруппированных и несгруниированных данных. Среднее линейное отклонение в силу его условности отдельно от других показателей вариации применяется на практике сравнительно редко (в частности, для характеристики выполнения договорных обязательств по равномерности поставки; в анализе оборота внешней торговли, состава работающих, ритмичности производства, качества продукции с учетом технологических особенностей производства и т.п.).
Среднее квадратическое отклонение характеризует, на сколько в среднем отклоняются индивидуальные значения изучаемого признака от среднего значения по совокупности, и выражается в единицах измерения изучаемого признака. Среднее квадратическое отклонение, являясь одной из основных мер вариации, широко используется при оценке границ вариации признака в однородной совокупности, при определении значений ординат кривой нормального распределения, а также в расчетах, связанных с организацией выборочного наблюдения и установлением точности выборочных характеристик. Среднее квадратическое отклонение но несгруипированным данным исчисляется по следующему алгоритму: каждое отклонение от средней возводится в квадрат, все квадраты суммируются, после чего сумма квадратов делится на число членов ряда и из частного извлекается квадратный корень:
где a Iip - значение среднего квадратического отклонения; Xj - значение признака; х - среднее значение признака для изучаемой совокупности; п - число единиц совокупности.
Для сгруппированных анализируемых данных среднее квадратическое отклонение данных рассчитывается по взвешенной формуле
где - значение среднего квадратического отклонения; Xj - значение признака; х - среднее значение признака для изучаемой совокупности; f x - число единиц совокупности в отдельной группе.
Выражение под корнем в обоих случаях носит название дисперсии. Таким образом, дисперсия вычисляется как средний квадрат отклонений значений признака от их средней величины. Для невзвешенных (простых) значений признака дисперсия определяется следующим образом:
Для взвешенных значений признака
Существует также специальный упрощенный способ расчета дисперсии: в общем виде
для невзвешенных (простых) значений признака
для взвешенных значений признака
с использованием метода отсчета от условного нуля
где а 2 - значение дисперсии; х,- - значение признака; х - среднее значение признака, h - величина группового интервала, т 1 - веса (А =
Дисперсия имеет самостоятельное выражение в статистике и относится к числу важнейших показателей вариации. Она измеряется в единицах, соответствующих квадрату единиц измерения изучаемого признака.
Дисперсия имеет следующие свойства.
Вариация альтернативного признака заключается в наличии или отсутствии изучаемого свойства у единиц совокупности. Количественно вариация альтернативного признака выражается двумя значениями: наличие у единицы изучаемого свойства обозначается единицей (1), а его отсутствие - нулем (0). Долю единиц, обладающих изучаемым свойством, обозначают через Р, а долю единиц, не обладающих этим свойством, - через G. Таким образом, дисперсия альтернативного признака равна произведению доли единиц, обладающих данным свойством (Р), на долю единиц, данным свойством не обладающих (G). Наибольшая вариация совокупности достигается в случаях, когда часть совокупности, составляющая 50% от всего объема совокупности, обладает признаком, а другая часть совокупности, также равная 50%, не обладает данным признаком, при этом дисперсия достигает максимального значения, равного 0,25, т.е. Р = 0,5, G = 1 - Р = 1 - 0,5 = 0,5 и о 2 = 0,5 0,5 = 0,25. Нижняя граница этого показателя равна нулю, что соответствует ситуации, при которой в совокупности отсутствует вариация. Практическое применение дисперсии альтернативного признака состоит в построении доверительных интервалов при проведении выборочного наблюдения.
Чем меньше значение дисперсии и среднего квадратического отклонения, тем однороднее совокупность и тем более типичной будет средняя величина. В практике статистики часто возникает необходимость сравнения вариаций различных признаков. Например, интересным является сравнение вариаций возраста рабочих и их квалификации, стажа работы и размера заработной платы, себестоимости и прибыли, стажа работы и производительности труда и т.д. Для таких сопоставлений показатели абсолютной колеблемости признаков непригодны: нельзя сравнивать колеблемость стажа работы, выраженного в годах, с вариацией заработной платы, выраженной в рублях. Для осуществления таких сравнений, а также сравнений колеблемости одного и того же признака в нескольких совокупностях с разными средними арифметическими используются показатели вариации - коэффициент осцилляции, линейный коэффициент вариации и коэффициент вариации, которые показывают меру колебаний крайних значений вокруг средней.
Коэффициент осцилляции :
где V R - значение коэффициента осцилляции; R - значение размаха вариации; х -
Линейный коэффициент вариации".
где Vj - значение линейного коэффициента вариации; I - значение среднего линейного отклонения; х - среднее значение признака для изучаемой совокупности.
Коэффициент вариации :
где V a - значение коэффициента вариации; а - значение среднего квадратического отклонения; х - среднее значение признака для изучаемой совокупности.
Коэффициент осцилляции - это процентное отношение размаха вариации к среднему значению изучаемого признака, а линейный коэффициент вариации - это отношение среднего линейного отклонения к среднему значению изучаемого признака, выраженное в процентах. Коэффициент вариации представляет собой процентное отношение среднего квадратического отклонения к среднему значению изучаемого признака. Как величина относительная, выраженная в процентах, коэффициент вариации применяется для сравнения степени вариации различных признаков. С помощью коэффициента вариации оценивается однородность статистической совокупности. Если коэффициент вариации меньше 33%, то исследуемая совокупность является однородной, а вариация слабой. Если коэффициент вариации больше 33%, то исследуемая совокупность является неоднородной, вариация сильной, а средняя величина - нетипичной и ее нельзя использовать как обобщающий показатель этой совокупности. Кроме того, коэффициенты вариации используются для сравнения колеблемости одного признака в различных совокупностях. Например, для оценки вариации стажа работы работников на двух предприятиях. Чем больше значение коэффициента, тем вариация признака существеннее.
На основе рассчитанных квартилей имеется возможность рассчитать также относительный показатель квартальной вариации по формуле
где Q2 и
Межквартильный размах определяется по формуле
Квартильное отклонение применяется вместо размаха вариации, чтобы избежать недостатков, связанных с использованием крайних значений:
Для неравноинтервальпых вариационных рядов рассчитывается также плотность распределения. Она определяется как частное от деления соответствующей частоты или частости на величину интервала. В неравноинтервальных рядах используются абсолютная и относительная плотности распределения. Абсолютная плотность распределения - это частота, приходящаяся на единицу длины интервала. Относительная плотность распределения - частость, приходящаяся на единицу длины интервала.
Все вышеотмеченное справедливо для рядов распределения, закон распределения которых хорошо описывается нормальным законом распределения или близок к нему.