Основные понятия статистики
ВведениеСлово «статистика» имеет латинское происхождение (от status – состояние). В средние века оно означало политическое состояние государства. В науку этот термин введен в XVIII в. немецким ученым Готфридом Ахенвалем.
В настоящее время термин «статистика» употребляется в трех значениях:
1) под статистикой понимают отрасль практической деятельности, которая имеет своей целью сбор, обработку, анализ и публикацию массовых данных о самых различных явлениях общественной жизни (в этом смысле «статистика» выступает как синоним словосочетания «статистический учет»);
2) статистикой называют цифровой материал, служащий для характеристики какой-либо области общественных явлений или территориального распределения какого-то показателя;
3) статистикой называется отрасль знания, особая научная дисциплина и соответственно учебный предмет в высших и средних специальных учебных заведениях.
Как и всякая наука, статистика имеет свой предмет изучения. Статистика изучает количественную и качественную сторону массовых общественных явлений, исследует количественное выражение закономерностей общественного развития в конкретных условиях места и времени.
Свой предмет статистика изучает при помощи: определенных категорий (т.е. понятий, которые отражают наиболее общие и существенные свойства, признаки, связи и отношения предметов и явлений объективного мира, к ним относятся: статистическая совокупность, единица совокупности, признак единицы, статистический показатель и их система) и специфического метода. Метод статистики – это целая совокупность приемов, пользуясь которыми статистика исследует свой предмет. Она включает в себя три группы собственно методов (этапов любого статистического исследования):
1) метод массовых наблюдений (сбор первичного статистического материала, научно организованная регистрация всех существенных фактов, относящихся к рассматриваемому объекту);
2) метод группировок (дает возможность все собранные в результате массового статистического наблюдения факты подвергать систематизации и классификации);
3) метод обобщающих показателей (позволяет характеризовать изучаемые явления и процессы при помощи статистических величин – абсолютных, относительных и средних, выявляются взаимосвязи и масштабы явлений, определяются закономерности их развития, даются прогнозные оценки).
Основными задачами статистики являются:
1) сбор, обработка, анализ и хранение информации;
2) доведение обработанной информации до органов управления всех уровней;
3) ознакомление широкой общественности и населения с динамикой и дислокацией социально-экономических явлений в стране путем издания статистических сборников, справочников, обзоров, публикаций в печатных и электронных СМИ (например, сайт www.gks.ru);
4) международное сопоставление уровня социально-экономического развития разных стран.
1. Абсолютные и относительные статистические величины
1.1 Понятие абсолютных величин
Результаты статистических наблюдений регистрируются сначала в виде абсолютных величин, отражающих уровень развития явления или процесса. В статистике в отличие от математики все абсолютные величины именованные, обладают конкретной размерностью, а также могут быть положительными и отрицательными.
Единицы измерения абсолютных величин отражают технические или потребительские свойства и являются простыми, отражая одно свойство (например, масса груза в т.), а также сложными, отражая несколько свойств в их взаимосвязи (например, тонно-километр или киловатт-час).
Единицы измерения могут быть натуральными, условно-натуральными и стоимостными. Первые применяются для исчисления величин с однородными свойствами (например, штуки, тонны, погонные метры, квадратные метры и т.д.). Недостаток в том, что они не позволяют суммировать разнородные величины.
Условно-натуральные единицы измерения применяются к абсолютным величинам с однородными свойствами, но проявляющим их по-разному. Например, общая масса энергоносителей (дрова, торф, каменный уголь, нефтепродукты, природный газ) измеряется в т.у.т. — тонны условного топлива, поскольку каждый его вид имеет разную теплотворную способность, а за стандарт принято 29,3 МДж/кГ. Аналогично общее количество школьных тетрадей измеряется в у.ш.т. — условные школьные тетради размером 12 листов. Аналогично продукция консервного производства измеряется в у.к.б. — условные консервные банки емкостью 1/3 литра. Аналогично продукция моющих средств приводится к условной жирности 40%.
Стоимостные единицы измерения выражаются в рублях или в иной валюте, представляя собой меру стоимости каждой абсолютной величины. Они позволяют суммировать даже разнородные величины, но недостаток в том, что при этом часто не учитывается негативное изменение экономических условий в виде инфляции. Поэтому статистика стоимостные величины всегда пересчитывает в сопоставимых ценах.
Смысловой набор абсолютных величин называется статистической совокупностью, в которой их можно группировать по характерным признакам: количественным и словесным.
Количественные признаки выражаются числами и могут быть дискретными и интервальными. Так, возраст человека по паспорту — признак дискретный, а возраст группы людей (от и до) — признак интервальный.
Словесные признаки выражаются словами и, если слов только два, признак называется альтернативным. Например, пол человека: мужской или женский. Если выражающих слов больше двух, то признак называется атрибутивным. Например, национальность, профессия и т.п.
Следует различать моментные и периодные абсолютные величины. Первые показывают фактическое наличие или количественный уровень явления на определенный момент времени или дату (например, наличие оборотных средств, количество денег в кармане и т.п.). Вторые - это итоговый накопленный результат за определенный период времени (например, выпуск продукции за месяц, квартал, год или заработная плата за месяц, квартал, год и т.д.). В отличие от моментных, периодные абсолютные величины допускают последующее суммирование.
Абсолютная статистическая величина обозначается X, а их общее количество в совокупности обозначается N. Количество величин с одинаковым значением признака обозначается fи называется повторяемость, встречаемость, частота. Естественно, Σf = N. Отношение f / N = f / Σf = dназывается доля, удельный вес, частость.
Естественно, Σd = 1. В статистике, в отличие от математики, пределы суммирования не ставятся, а подразумеваются, т.к. абсолютные величины здесь не абстрактные, а смысловые.
Однако сами по себе абсолютные статистические величины не дают полного представления об изучаемом явлении, т.к. не показывают его структуру, соотношение между частями, взаимосвязь с другими абсолютными величинами, развитие во времени. Для этих целей служат относительные статистические величины.
1.2 Понятие относительных величин
Относительная статистическая величина представляет собой соотношение двух абсолютных величин и, если последние однородны, имея одинаковую размерность, то относительная величина получается безразмерной, принимая статус коэффициента. Например, фондоотдача (оборачиваемость) как отношение стоимости выпущенной продукции к стоимости основных фондов является коэффициентом.
Часто применяется искусственная размерность коэффициентов путем их умножения или на 100 (получают проценты), или на 1000 (получают промилле), или на 10000 (получают деципромилле). Две последние размерности используются в статистике населения, где коэффициенты и проценты выражаются очень малыми величинами. Наиболее употребимы проценты.
Однако искусственная размерность коэффициентов удобна лишь в разговорной речи и в отчетах, а в расчетах она только мешает, т.к. сотни и тысячи «путаются под пером» и в конце концов сокращаются. Поэтому существует «золотое» правило финансистов: «Говорим и учитываем процентом — считаем коэффициентом».
Если относительная статистическая величина - результат соотношения двух абсолютных величин с разной размерностью, то она приобретает дробную размерность, принимая статус показателя. Например, это всем известные: себестоимость продукции в руб./ед., ее цена в руб./ед,, производительность рабочей силы в руб./чел., энергоотдача производства в руб./кВт ч и другие показатели.
Относительные величины применяются для качественного статистического анализа динамики, структуры, координации, сравнения и интенсивности изучаемых явлений. При этом безразмерные относительные величины наряду с именованием коэффициентами часто именуются индексами.
1.3 Виды относительных величин
Наиболее распространенной является относительная величина, коэффициент или индекс динамики, который характеризует изменение какого-либо явления во времени, представляя собой отношение значений одной и той же абсолютной величины в разные периоды времени. То есть
. (1.1)
Здесь и далее подиндексы означают: 1 — отчетный или анализируемый период, 0 — прошлый или базисный период.
Критериальным значением индекса динамики служит единица. Если он больше ее, имеет место рост явления; равен единице — стабильность; если меньше единицы, наблюдается спад явления.
Еще одно название индекса динамики — индекс изменения, вычитая из которого единицу получают темп изменения с критериальным значением нуль. Если он больше нуля, имеет место рост явления; равен нулю — стабильность; если меньше нуля, наблюдается спад явления.
. (1.2)
В некоторых учебниках по Статистике индекс изменения назван темпом роста, а темп изменения — темпом прироста, независимо от получаемого результата, который может показать стабильность или спад.
Если анализируемый и базисный периоды не являются соседними во временном ряду (например, год, предшествующий пятилетке и ее последний год), то найденный по формуле (1.1) индекс динамики или изменения будет общим, поэтому дополнительно определяется средний индекс по формуле
, (1.3)
где t — количество периодов во временном ряду (например, в пятилетке t = 5).
Как и у общего, у среднего индекса критериальным значением служит единица с теми же выводами о характере изменения. Вычитанием из среднего индекса единицы получают средний темп изменения с критериальным значением нуль и аналогичными выводами о характере изменения явления.
На производстве применяются относительные величины, коэффициенты или индексы планового задания и выполнения плана. Первый определяется как отношение значений одной и той же абсолютной величины по плану анализируемого периода и по факту базисного. То есть
, (1.4)
где X’1— план анализируемого периода; X0 — факт базисного периода.
Индекс выполнения плана представляет собой отношение значений одной и той же абсолютной величины по факту и по плану анализируемого периода, определяясь по формуле
(1.5)
Перемножая индексы планового задания и выполнения плана, получаем индекс динамики. То есть
(1.6)
Широко применяется также относительная величина, коэффициент или индекс структуры в виде отношения какой-либо части абсолютной величины ко всему ее значению. По существу это упоминавшаяся выше доля, удельный вес, частость, определяемая по формуле
. (1.7)
Например, если количество лиц женского пола (лжп) в группе студентов поделить на численность всей группы, то получится индекс структуры лжп.
Похожей является относительная величина, коэффициент или индекс координации как отношение какой-либо части абсолютной величины к другой ее части, принятой за основу. Определяется по формуле
. (1.8)
Например, если за основу принять количество лжп в группе студентов и на это число поделить количество лиц мужского пола (лмп) в ней, то получится индекс координации лмп относительно лжп.
Следующей является относительная величина, коэффициент или индекс сравнения в виде отношения значений одной и той же абсолютной величины в одном периоде или моменте времени, но для разных объектов или территорий. Определяется по формуле
, (1.9)
где А, Б — признаки сравниваемых объектов или территорий.
Еще один вид относительных величин сравнения получают путем сопоставления индексов динамики разных явлений. В результате образуются индексы опережения или отставания в развитии одного явления по сравнению с другим. Так, если на предприятии производительность труда увеличилась на 12 %, а средняя зарплата только на 7,5 %, то рост производительности труда опережает рост зарплаты по индексу изменения на 112/107,5=1,042 или на 4,2 %, а по темпу изменения на12/7,5=1,6 или на 60 %. Это и есть соответствующие индексы опережения. Индекс отставания роста зарплаты от роста производительности труда будет обратной величиной.
Перечисленные индексы являются безразмерными относительными величинами, а показателем, имеющим размерность, служит относительная величина интенсивности в виде отношения значений двух разнородных абсолютных величин для одного периода времени и одной территории или объекта. Для ее определения используется формула
. (1.10)
К показателям интенсивности относятся упомянутые выше себе стоимость, цена, энергоемкость продукции и другие относительные величины с дробной размерностью.
2. Средние величины и показатели вариации
2.1 Понятие и общие принципы применения средних величин
Статистическая совокупность содержит некоторое количество статистических величин, имеющих, как правило, разные значения и признаки, что делает невозможным сравнение нескольких совокупностей в целом.Для этой цели применяется средняя величина, как обобщающий показатель совокупности, характеризующий уровень изучаемого явления или процесса.
Средняя величина всегда обобщает количественное выражение признака и погашает индивидуальные различия статистических величин совокупности, вызванные случайными обстоятельствами. Но по значению средней величины нельзя делать принципиальные выводы.
Так, если один ученик имеет тетрадь в 48 листов, а другой - ни одной, то в среднем получается по 2 у.ш.т. на ученика. Но из этого нельзя заключать, что все ученики школьными тетрадями обеспечены.
В статистике соблюдаются следующие принципы применения средних величин.
1. Необходим обоснованный выбор статистической совокупности, для которой определяется средняя величина.
2. При определении средней величины исходят из качественного содержания статистических величин, учитывая возможную взаимосвязь изучаемых признаков.
3. Средняя величина должна рассчитываться по однородной совокупности, которая позволяет применять метод группировки, предполагающий расчет системы обобщающих показателей.
4. Общая средняя величина должна подкрепляться и поясняться групповыми средними величинами.
2.2 Виды степенных средних величин
Средние величины делятся на два больших класса: степенные и структурные. К последним относятся мода и медиана, но наиболее часто применяются степенные различных видов.
Степенные средние, в зависимости от представления отдельных величин, могут быть простыми и взвешенными. Простая средняя рассчитывается при наличии двух и более статистических величин, расположенных в произвольном порядке. Общая формула простой средней величины имеет вид
=.(1.11)
Взвешенная средняя величина рассчитывается по сгруппированным статистическим величинам с использованием следующей общей формулы
=(1.12)
При этом обозначено:
Xi – значения отдельных статистических величин или середин группировочных интервалов;
m - показатель степени, от значения которого зависят следующие виды степенных средних величин:
при m = -1 средняя гармоническая;
при m = 0 средняя геометрическая;
при m = 1 средняя арифметическая;
при m = 2 средняя квадратическая;
при m = 3 средняя кубическая и так далее.
Используя общие формулы простой и взвешенной средних при разных показателях степени m, получаем частные формулы каждого вида. Так, приняв m = 1, находим, что простая средняя арифметическая величина определяется по формуле
=. (1.13)
Аналогично для взвешенной средней арифметической величины получаем формулу через частоты или через доли (так как )
=. (1.14)
Не представляет трудностей и вывод формул для простых и взвешенных средних квадратических и кубических величин. Несколько сложнее вывод средней гармонической при m = –1. Так, используя формулу (1.11), имеем вначале
гм = = ,
а окончательно получим, что простая средняя гармоническая величина определяется по формуле
ГМ = , (1.15)
Аналогично выводится формула взвешенной средней гармонической величины, которая имеет следующий окончательный вид через частоты или через доли
ГМ = , (1.16)
Наиболее часто употребляются формулы средних арифметических и гармонических величин.
2.3 Правила применения средней арифметической и гармонической взвешенных
Они часто применяются для осреднения относительных величин интенсивности, т.е. показателей, имеющих дробную размерность. При этом соблюдаются следующие правила.
1. Если имеются дополнительные данные по числителю дробной размерности, то применяется средняя гармоническая.
2. Если имеются дополнительные данные по знаменателю дробной размерности, то применяется средняя арифметическая.
3. Если неясно, к числителю или знаменателю относятся дополнительные данные, то поочередно применяются средняя гармоническая и арифметическая, а затем определяется средняя между ними величина.
Для иллюстрации правил решим задачу: 4 фирмы выпускают одинаковую продукцию при себестоимостях в руб/ед.: Si = 5, 3, 4, 6, а доли фирм равны соответственно di = 0,3; 0,2; 0,4; 0,1. Определить среднюю себестоимость продукции.
Для решения примера используем вышеизложенные правила.
1. Если доли фирм относятся к текущим затратам (числитель показателя себестоимости), то ее среднее значение определяем по формуле (1.16) как среднюю гармоническую величину
= 1/ (0,3/5 + 0,2/3 + 0,4/4 + 0,1/6) = 4,1 (руб./ед.)
2. Если доли фирм относятся к количеству выпущенной продукции (знаменатель показателя себестоимости), то ее среднее значение находим по формуле (1.14) как среднюю арифметическую величину
= 5*0,3 + 3*0,2 + 4*0,4 + 6*0,1 = 4,3 (руб./ед.)
3. Если не сказано, к чему относятся доли фирм, то в дополнение к выполненным расчетам определяем среднюю себестоимость как простую среднюю величину из полученных результатов. То есть = (Sгм + Sар)/2 = 4,2 (руб./ед.)
Таким путем рассчитываются средние значения и других показателей с дробной размерностью.
2.4 Особые виды степенных средних величин
Разновидностью простой средней арифметической служит средняя хронологическая величина, когда имеются моментные статистические величины на определенную одинаковую дату, например, на 1-е число каждого месяца в году. Формула средней хронологической теоретическому выводу не поддается и записывается приближенно в виде
. (1.17)
где Х1 и Xn — первое и последнее значения статистической величины; Xi — промежуточные значения; n — общее число значений.
По такой формуле бухгалтерия определяет среднегодовую стоимость основных фондов, учитывая ее значения на 1-е число каждого месяца. При этом n = 13, т. к. 1-е января фиксируется дважды: у отчетного и следующего за отчетным года. Аналогично коммерческие банки определяют среднегодовую сумму вкладов и выданных кредитов. Если учет квартальный, то n = 5.
Средняя геометрическая величина получается при подстановке в формулу (1.11) m=0:
==
Для раскрытия неопределенностей этого вида прологарифмируем обе части формулы (1.11):
.
Подставляя в правую часть равенства m=0, получаем неопределенность вида . Используя правило Лопиталя и дифференцируя отдельно числитель и знаменатель по переменной m, получаем
.
Следовательно, при m=0
.
Потенцируя, находим
. (1.18)
Формула (1.18) является формулой средней геометрической простой, а если использовать частоты f, получим формулу средней геометрической взвешенной:
= – взвешенная,(1.19)
где П—символ произведения.
Средняя геометрическая величина применяется, если задана последовательность индексов динамики, указывающих, например, на изменение уровня производства каждого последующего года по сравнению с предыдущим.
Рассчитанные для одних и тех же данных различные средние величины оказываются неодинаковыми. Здесь действует правило мажорантности средних величин (впервые сформулировал профессор А. Я. Боярский), согласно которому с ростом показателя степени m в общих формулах увеличивается и средняя величина. То есть
<< < <
Это правило частично подтвердилось расчетом средней себестоимости продукции, где средняя гармоническая получилась равной 4,1 руб./ед., а средняя арифметическая 4,3 руб./ед. Если рассчитать еще и среднюю геометрическую взвешенную, то она будет равной 4,2 руб./ед.
2.5 Структурные средние
Особый вид средних величин – структурные средние – применяется для изучения внутреннего строения рядов распределения значений признака, а также для оценки средней величины (степенного типа), если по имеющимся статистическим данным ее расчет не может быть выполнен.
В качестве структурных средних чаще всего используют показатели моды – наиболее часто повторяющегося значения признака – и медианы – величины признака, которая делит упорядоченную последовательность его значений на две равные по численности части. В итоге у одной половины единиц совокупности значение признака больше медианного уровня, а у другой – меньше его.
Если изучаемый признак имеет дискретные значения, то особых сложностей при расчете моды и медианы не бывает. Если же данные о значениях признака Х представлены в виде упорядоченных интервалов его изменения (интервальных рядов), расчет моды и медианы несколько усложняется. Поскольку медианное значение делит всю совокупность на две равные по численности части, оно оказывается в каком-то из интервалов признака X. С помощью интерполяции в этом медианном интервале находят значение медианы:
, (1.20)
где XMe – нижняя граница медианного интервала;
∆X – его величина (размах);
∑f/2 – половина от общего числа величин;
– сумма наблюдений (или объема взвешивающего признака), накопленная до начала медианного интервала;
fMe – число наблюдений или объем взвешивающего признака в медианном интервале.
При расчете модального значения признака по данным интервального ряда надо обращать внимание на то, чтобы интервалы были одинаковыми, поскольку от этого зависит показатель повторяемости значений признака X. Для интервального ряда с равными интервалами величина моды определяется как
, (1.21)
где ХMo– нижнее значение модального интервала;
fMo – число наблюдений или объем взвешивающего признака в модальном интервале;
fMo-1 – то же для интервала, предшествующего модальному;
fMo+1 – то же для интервала, следующего за модальным;
∆X – величина интервала изменения признака в группах.
Очевидно, что в формуле (1.20) и (1.21) можно заменить частоты f на доли d, так как , а можно вынести за скобки как в числителе, так и в знаменателе и сократить.
Показателями типа медианы, характеризующими структуру рядов распределения признака, являются квартили (делят ряд на 4 равные части), квинтили (на 5), децили (на 10), перцентили (на 100).
2.6 Средние отклонения от средних величин
Каждая статистическая величина от среднего значения отличается (отклоняется) по-разному и в любую сторону: со знаком плюс или минус. Поэтому для оценки типичности полученной средней величины надо знать величину среднего отклонения совокупности от нее. Поскольку неизбежны и отрицательные отдельные отклонения, необходима нейтрализация знака минус, иначе среднего отклонения не получится. Этого можно достичь двумя способами: принять отрицательные отклонения по модулю или возвести их во вторую степень (в квадрат).
При первом способе образуется среднее линейное отклонение, а при втором — среднее квадратическое. В связи с тем, что средние величины могут быть простыми и взвешенными, аналогичными могут быть и средние отклонения. Поэтому среднее линейное отклонение определяется по формулам
–простое;(1.22)
– взвешенное. (1.23)
В этих формулах прямые скобки означают, что разности или отклонения берутся по модулю, то есть без учета знака. Если ошибочно вместо прямых скобок принять обычные круглые, то получится Л=0.
При использовании второго способа вначале определяется дисперсия отклонений по формулам
–простая;(1.24)
– взвешенная.(1.25)
Дисперсия альтернативного признака (т.е. имеющего две взаимоисключающие разновидности, например, пол человека – мужской или женский, качество продукции – годная или бракованная) определяется по формуле 1.25, если вместо Xi подставить 1 и 0 (так как признак может принимать только 2 значения). Зная, что:
+ q = 1,
где – доля единиц, обладающих признаком, q – доля единиц не обладающих им.
Среднее значение можно найти по формуле (1.14):
.
Таким образом получим формулу дисперсии альтернативного признака, применив формулу (1.25):
.
Таким образом, дисперсия альтернативного признака равна
. (1.26)
Предельное значение дисперсии альтернативного признака равно 0,25; оно получается при = q= 0,5.
В отличие от математики статистика оперирует не абстрактными, а смысловыми величинами, имеющими размерность. Поэтому и дисперсия здесь не безразмерная, как в математике, а сопровождается квадратической размерностью. Например, если статистическая величина измеряется в годах, или рублях, то дисперсия отклонений получится в «квадратных» годах или в «квадратных» рублях.
Для получения обычной размерности находится среднее квадратическое отклонение («сигма»)как корень квадратный из дисперсии. То есть
= .(1.27)
Однако значения средних отклонений, как любой абсолютной величины, служат лишь количественной мерой анализа статистической совокупности. Для качественного анализа применяются относительные критерии, называемые коэффициентами вариации.
2.7 Коэффициенты вариации
Вариация — это несовпадение значений одной и той же статистической величины у разных объектов в силу особенностей их собственного развития, а также различия условий, в которых они находятся. Вариация имеет объективный характер и помогает познать сущность изучаемого явления. Если средняя величина сглаживает индивидуальные различия, то вариация, наоборот, их подчеркивает, устанавливая типичность или не типичность найденной средней величины для конкретной статистической совокупности. Тем самым можно делать вывод о качественности подобранных статистических данных.
Вариация измеряется с помощью относительных величин, называемых коэффициентами вариации и определяемых в виде отношения среднего отклонения к средней величине.
Поскольку среднее отклонение может определяться линейным и квадратическим способами, то соответствующими могут быть и коэффициенты вариации. Следовательно, коэффициенты вариации надо определять по формулам
–линейный;(1.28)
–квадратический.(1.29)
Значения коэффициента вариации изменяются от 0 до 1 и чем ближе он к нулю, тем типичнее найденная средняя величина для изучаемой статистической совокупности, а значит и качественнее подобраны статистические данные. При этом критериальным значением коэффициента вариации служит 1/3.
То есть средняя величина считается типичной для данной совокупности при λ 0,333 или при ν 0,333. В ином случае средняя величина не типична и требуется пересмотреть статистическую совокупность с целью включения в нее более объективных статистических величин.
Обычно квадратический коэффициент вариации несколько (примерно на 25%) больше линейного, рассчитанные по одним и тем же данным. А значит возможен случай, когда λ 0,333 и ν 0,333, тогда необходимо взять среднюю из этих коэффициентов и по ее значению сделать окончательный вывод о не/типичности найденной средней величины.
С помощью линейного коэффициента вариации принципиальный вывод о типичности или не типичности средней величины можно получить проще и быстрее, чем с помощью квадратического. Однако квадратический коэффициент применяется чаще, так как существует несколько способов для вычисления дисперсии.
У такого способа оценки вариации есть и существенный недостаток. Действительно, пусть, например, исходная совокупность рабочих, имеющих средний стаж 15 лет, со стандартным отклонением σ = 10 лет, «состарилась» еще на 15 лет. Теперь = 30 лет, а стандартное отклонение по-прежнему равно 10. Совокупность, ранее бывшая неоднородной (10/15*100 = 66,7%), со временем оказывается, таким образом, вполне однородной (10/30*100 = 33,3 %).
Поэтому возможен дополнительный анализ статистической совокупности с помощью коэффициента осцилляции, определяемого по формуле
, (1.30)
где R — размах вариации в виде разности наибольшего и наименьшего значений в совокупности статистических величин. То есть
R = Хмах –Хmin, (1.31)
где Xмax и Xmin — максимальное и минимальное значения в совокупности.
При упорядочении статистических величин в совокупности образуются группировочные интервалы. Тогда под обозначением ∆Х понимается размах интервала, а среднее интервальное значение обозначается ХИ.
В случае ориентировки только на квадратический коэффициент вариации могут применяться разные методы определения дисперсии.
2.8 Определение дисперсии методом моментов
Преобразованием приведенных выше логических формул определения дисперсии могут быть получены ее новые формулы для расчета, например, методом моментов, которым иногда значение дисперсии получается быстрее.
===
Окончательно записываем, что дисперсия методом моментов определяется по формуле
Д = , (1.32)
где – средняя квадратов статистических величин; – квадрат их средней величины.
Эти параметры нередко имеют и другие названия. Вычитаемое называют начальным моментом первого порядка, уменьшаемое – начальным моментом второго порядка, а сама дисперсия при этом называется центральным моментом второго порядка.
Для иллюстрации пользования формулами дисперсии рассмотрим простейший пример, приняв абстрактно Х1 = 2, Х2 = 4, Х3 = 6, для которых среднее значение, очевидно, равняется = 4. Тогда дисперсия простая по логической формуле (1.24) будет равна
Д3 = ((2-4)2 + (4-4)2 + (6-4)2)/3 = 8/3 = 2,67
Применив формулу моментов (1.32), получим тот же результат
Д3 =(22 + 42 + 6 2 )/3 – 42 = 56/3 – 16 = 2,67
В данном примере быстрота определения дисперсии методом моментов не достаточно ощутима, но она проявляется очень заметно при большом количестве статистических данных.
2.9 Свойства средней арифметической и дисперсии
В статистических расчетах эти характеристики статистической совокупности зачастую применяются во взаимодействии. При этом с целью приведения их к удобному для анализа виду при громоздких значениях статистических величин используют следующие свойства.
1. Если каждую статистическую величину изменить на одно число (прибавить или отнять), то средняя арифметическая изменится на это число, а дисперсия при этом не изменится.
2. Если каждую статистическую величину изменить в одинаковое число раз (умножить или разделить), то средняя арифметическая изменится во столько же раз, а дисперсия изменится в квадрат таких раз.
Доказать эти свойства можно путем математических преобразований соответствующих формул, но гораздо проще доказательство получается с помощью следующего численного примера.
Принимая предыдущие три статистические величины с их значениями 2, 4, и 6, сначала прибавим к каждой из них 5, а потом умножим каждую из них на 5. Тогда получим измененные значения статистических величин, представленные матрицей
X1=2; X1’=2+5=7; X1’’=2*5=10.
X2=4; X2’=4+5=9; X2’’=4*5=10.
X3=6; X3’=6+5=11; X3’’=6*5=30.
= 4; ’=9; ’’=20.
Д=2,67; Д’=2,67; Д’’=66,67.
В этой матрице значения средних арифметических очевидны, а первоначальное значение дисперсии было найдено в предыдущем примере. Расчет других ее знач