В непрерывном вариационном ряду варианты выражены. Вариационные ряды

Вариация определяет различия в значениях какого-либо признака у разных единиц данной совокупности в один и тот же период (момент времени). Причиной вариации бывают разные условия существования разных единиц совокупности. Например, даже близнецы в процессе жизни приобретают различия в росте, весе, а также в таких признаках, как уровень образования, доход, количество детей и т.д.

Вариация возникает в результате того, что сами значения признака складываются под суммарным влиянием разнообразных условий, которые разным образом сочетаются в каждом отдельном случае. Таким образом, величина любого варианта объективна.

Вариация характерна всем без исключения явлениям природы и общества, кроме законодательно закрепленных нормативных значений отдельных социальных признаков. Исследования вариации в статистике имеют огромное значение, помогают познать сущность изучаемого явления. Нахождение вариации, выяснение ее причин, выявление влияния отдельных факторов дают важную информацию для внедрения научно обоснованных управленческих решений.

Средняя величина дает обобщенную характеристику признака совокупности, но она не раскрывает её строения. Среднее значение не показывает, как располагаются вокруг нее варианты осредненного признака, распределены ли они вблизи средней или отклоняются от нее. Средняя в двух совокупностях может быть одинаковой, но в одном варианте все индивидуальные значения отличаются от нее незначительно, а в другом - эти отличия велики, т.е. в первом случае вариация признака мала, а во втором - велика, это имеет очень важное значение для характеристики значимости средней величины.

Для того, чтобы руководитель организации, управляющий, научный работник могли изучать вариацию и управлять ей, статистикой разработаны специальные методы исследования вариации (система показателей). С их помощью вариация находится, характеризуются ее свойства. К показателям вариации относятся : размах вариации, среднее линейное отклонение, коэффициент вариации.

Вариационный ряд и его формы

Вариационный ряд - это упорядоченное распределение единиц совокупности чаще по возрастающим (реже убывающим) значениям признака и подсчет числа единиц с тем или иным значением признака. Когда численность единиц совокупности большая, ранжированный ряд становится громоздким, его построение занимает длительное время. В такой ситуации вариационный ряд строится с помощью группировки единиц совокупности по значениям изучаемого признака.

Существуют следующие формы вариационного ряда :

  1. Ранжированный ряд представляет собой, перечень отдельных единиц совокупности в порядке возрастания (убывания) изучаемого признака.
  2. Дискретный вариационный ряд - это таблица, состоящая из двух строк или граф: конкретных значений варьирующего признака х и числа единиц совокупности с данным значение f - признака частот. Он строится тогда, когда признак принимает наибольшее число значений.
  3. Интервальный ряд .

Размах вариации определяется как абсолютная величина разности между максимальными и минимальными значениями (вариантами) признака:

Размах вариации показывает только крайние отклонения признака и не отражает отдельных отклонений всех вариантов в ряду. Он характеризует пределы изменения варьирующего признака и зависим от колебаний двух крайних вариантов и абсолютно не связан с частотами в вариационном ряду, т. е. с характером распределения, что придает этой величине, случайный характер. Для анализа вариации нужен показатель, который отражает все колебания вариационного признака и даёт общую характеристику. Простейший показатель такого вида — среднее линейное отклонение.

Пример решения контрольной работы по математической статистике

Задача 1

Исходные данные : студенты некоторой группы, состоящей из 30 человек сдали экзамен по курсу «Информатика». Полученные студентами оценки образуют следующий ряд чисел:

I. Составим вариационный ряд

m x

w x

m x нак

w x нак

Итого:

II. Графическое представление статистических сведений.

III. Числовые характеристики выборки.

1. Среднее арифметическое

2. Среднее геометрическое

3. Мода

4. Медиана

222222333333333 | 3 34444444445555

5. Выборочная дисперсия

7. Коэффициент вариации

8. Ассиметрия

9. Коэффициент ассиметрии

10. Эксцесс

11. Коэффициент эксцесса

Задача 2

Исходные данные : студенты некоторой группы написали выпускную контрольную работу. Группа состоит из 30 человек. Набранные студентами баллы образуют следующий ряд чисел

Решение

I. Так как признак принимает много различных значений, то для него построим интервальный вариационный ряд. Для этого сначала зададим величину интервала h . Воспользуемся формулой Стэрджера

Составим шкалу интервалов. При этом за верхнюю границу первого интервала примем величину, определяемую по формуле:

Верхние границы последующих интервалов определим по следующей рекуррентной формуле:

, тогда

Построение шкалы интервалов заканчиваем, так как верхняя граница очередного интервала стала больше или равна максимальному значению выборки
.

II. Графическое отображение интервального вариационного ряда

III. Числовые характеристики выборки

Для определения числовых характеристик выборки составим вспомогательную таблицу

Сумма :

1. Среднее арифметическое

2. Среднее геометрическое

3. Мода

4. Медиана

10 11 12 12 13 13 13 13 14 14 14 14 15 15 15 |15 15 15 16 16 16 16 16 17 17 18 19 19 20 20

5. Выборочная дисперсия

6. Выборочное стандартное отклонение

7. Коэффициент вариации

8. Ассиметрия

9. Коэффициент ассиметрии

10. Эксцесс

11. Коэффициент эксцесса

Задача 3

Условие : цена деления шкалы амперметра равна 0,1 А. Показания округляют до ближайшего целого деления. Найти вероятность того, что при отсчете будет сделана ошибка, превышающая 0,02 А.

Решение.

Ошибку округления отсчета можно рассматривать как случайную величину Х , которая распределена равномерно в интервале между двумя соседними целыми делениями. Плотность равномерного распределения

,

где
- длина интервала, в котором заключены возможные значения Х ; вне этого интервала
В данной задаче длина интервала, в котором заключены возможные значения Х , равна 0,1, поэтому

Ошибка отсчета превысит 0,02 если она будет заключена в интервале (0,02; 0,08). Тогда

Ответ: р =0,6

Задача 4

Исходные данные: математическое ожидание и стандартное отклонение нормально распределенного признака Х соответственно равны 10 и 2. Найти вероятность того, чтов результате испытания Х примет значение, заключенное в интервале (12, 14).

Решение.

Воспользуемся формулой

И теоретическими частотами

Решение

Для Х ее математическое ожидание M(X) и дисперсию D(X). Решение . Найдем функцию распределения F(x) случайной величины... ошибка выборки). Составим вариационный ряд Ширина интервала составит : Для каждого значения ряда подсчитаем, какое количество...

  • Решение: уравнение с разделяющимися переменными

    Решение

    В виде Для нахождения частного решения неоднородного уравнения составим систему Решим полученную систему... ; +47; +61; +10; -8. Построить интервальный вариационный ряд . Дать статистические оценки среднего значения...

  • Решение: Проведем расчет цепных и базисных абсолютных приростов, темпов роста, темпов прироста. Полученные значения сведем в таблицу 1

    Решение

    Объем производства продукции. Решение : Средняя арифметическая интервального вариационного ряда вычисляется следующим образом: за... Предельная ошибка выборки с вероятностью 0,954 (t=2) составит : Δ w = t*μ = 2*0,0146 = 0,02927 Определим границы...

  • Решение. Признак

    Решение

    О трудовом стаже которых и составили выборку. Средний по выборке стаж... рабочего дня этих сотрудников и составили выборку. Средняя по выборке продолжительность... 1,16, уровень значимости α = 0,05. Решение . Вариационный ряд данной выборки имеет вид: 0,71 ...

  • Рабочая учебная программа по биологии для 10-11 классов Составитель: Поликарпова С. В

    Рабочая учебная программа

    Простейших схем скрещивания» 5 Л.р. «Решение элементарных генетических задач» 6 Л.р. «Решение элементарных генетических задач» 7 Л.р. « ... , 110, 115, 112, 110. Составьте вариационный ряд , начертите вариационную кривую, найдите среднюю величину признака...

  • Вариационными называют ряды распределения, построенные по количественному признаку. Значения количественных признаков у отдельных единиц совокупности непостоянны, более или менее различаются между собой.

    Вариация - колеблемость, изменяемость величины признака у единиц совокупности. Отдельные числовые значения признака, встречающиеся в изучаемой совокупности, называют вариантами значений. Недостаточность средней величины для полной характеристики совокупности заставляет дополнять средние величины показателями, позволяющими оценить типичность этих средних путем измерения колеблемости (вариации) изучаемого признака.

    Наличие вариации обусловлено влиянием большого числа факторов на формирование уровня признака. Эти факторы действуют с неодинаковой силой и в разных направлениях. Для описания меры изменчивости признаков используют показатели вариации.

    Задачи статистического изучения вариации:

    • 1) изучение характера и степени вариации признаков у отдельных единиц совокупности;
    • 2) определение роли отдельных факторов или их групп в вариации тех или иных признаков совокупности.

    В статистике применяются специальные методы исследования вариации, основанные на использовании системы показателей, с помощью которых измеряется вариация.

    Исследование вариаций имеет важное значение. Измерение вариаций необходимо при проведении выборочного наблюдения, корреляционном и дисперсионном анализе и т. д. Ермолаев О.Ю. Математическая статистика для психологов: Учебник [Текст]/ О.Ю. Ермолаев. - М.: Изд-во Флинта Московского психолого-социального института, 2012. - 335с.

    По степени вариации можно судить об однородности совокупности, об устойчивости отдельных значений признаков и типичности средней. На их основе разрабатываются показатели тесноты связи между признаками, показатели оценки точности выборочного наблюдения.

    Различают вариацию в пространстве и вариацию во времени.

    Под вариацией в пространстве понимают колеблемость значений признака у единиц совокупности, представляющих отдельные территории. Под вариацией во времени подразумевают изменение значений признака в различные периоды времени.

    Для изучения вариации в рядах распределения проводят расположение всех вариантов значений признака в возрастающем или убывающем порядке. Этот процесс называют ранжированием ряда.

    Самыми простыми признаками вариации являются минимум и максимум - самое наименьшее и наибольшее значение признака в совокупности. Число повторений отдельных вариантов значений признаков называют частотой повторения (fi). Частоты удобно заменять частостями - wi. Частость - относительный показатель частоты, который может быть выражен в долях единицы или процентах и позволяет сопоставлять вариационные ряды с различным числом наблюдений. Выражается формулой:

    где Хmax, Хmin - максимальное и минимальное значения признака в совокупности; n - число групп.

    Для измерения вариации признака применяются различные абсолютные и относительные показатели. К абсолютным показателям вариации относятся размах вариации, среднее линейное отклонение, дисперсия, среднее квадратическое отклонение. К относительным показателям колеблемости относят коэффициент осцилляции, относительное линейное отклонение, коэффициент вариации.

    Пример нахождения вариационного ряда

    Задание. По данной выборке:

    • а) Найти вариационный ряд;
    • б) Построить функцию распределения;

    №=42. Элементы выборки:

    1 5 1 8 1 3 9 4 7 3 7 8 7 3 2 3 5 3 8 3 5 2 8 3 7 9 5 8 8 1 2 2 5 1 6 1 7 6 7 7 6 2

    Решение.

    • а) построение ранжированного вариационного ряда:
      • 1 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 3 3 4 5 5 5 5 5 6 6 6 7 7 7 7 7 7 7 8 8 8 8 8 8 9 9
    • б) построение дискретного вариационного ряда.

    Вычислим число групп в вариационном ряду пользуясь формулой Стерджесса:

    Примем число групп равным 7.

    Зная число групп, рассчитаем величину интервала:

    Для удобства построения таблицы примем число групп равным 8, интервал составит 1.

    Рис. 1 Объем продаж магазином товара за определенный промежуток времени

    Вариационный ряд – это ряд числовых значений признака.

    Основные характеристики вариационного ряда: v – варианта, р – частота ее встречаемости.

    Виды вариационного ряда:

      по частоте встречаемости варианты: простой – варианта встречается один раз, взвешенный – варианта встречается два и более раз;

      по расположению варианты: ранжированный – варианты расположены в порядке убывания и возрастания, неранжированный – варианты записаны без определенного порядка;

      по объединению вариант в группы: сгруппированный – варианты объединены в группы, несгруппированный – варианты необъединены в группы;

      по величине варианты: непрерывный – варианты выражены целым и дробным числом, дискретный – варианты выражены целым числом, сложный – варианты представлены относительной или средней величиной.

    Вариационный ряд составляется и оформляется с целью расчета средних величин.

    Форма записи вариационного ряда:

    8. Средние величины, виды, методика расчета, применение в здравоохранении

    Средние величины – совокупная обобщающая характеристика количественных признаков. Применение средних величин :

    1. Для характеристики организации работы лечебно-профилактических учреждений и оценки их деятельности:

    а) в поликлинике: показатели нагрузки врачей, среднее число посещений, среднее число жителей на участке;

    б) в стационаре: среднее число дней работы койки в году; средняя длительность пребывания в стационаре;

    в) в центре гигиены, эпидемиологии и общественного здоровья: средняя площадь (или кубатура) на 1 человека, средние нормы питания (белки, жиры, углеводы, витамины, минеральные соли, калории), санитарные нормы и нормативы и т.д.;

    2. Для характеристики физического развития (основных антропометрических признаков морфологических и функциональных);

    3. Для определения медико-физиологических показателей организма в норме и патологии в клинических и экспериментальных исследованиях.

    4. В специальных научных исследованиях.

    Отличие средних величин от показателей:

    1. Коэффициенты характеризуют альтернативный признак, встречающийся только у некоторой части статистического коллектива, который может иметь место или не иметь место.

    Средние величины охватывают признаки, присущие всем членам коллектива, но в разной степени (вес, рост, дни лечения в больнице).

    2. Коэффициенты применяются для измерения качественных признаков. Средние величины – для варьирующих количественных признаков.

    Виды средних величин:

      средняя арифметическая, ее характеристики – среднее квадратическое отклонение и средняя ошибка

      мода и медиана. Мода (Мо) – соответствует величине признака, который чаще других встречается в данной совокупности. Медиана (Ме) – величина признака, занимающая срединное значение в данной совокупности. Она делит ряд на 2 равные части по числу наблюдений. Средняя арифметическая величина (М) – в отличие от моды и медианы опирается на все произведенные наблюдения, поэтому является важной характеристикой для всего распределения.

      другие виды средних величин, которые применяются в специальных исследованиях: средняя квадратическая, кубическая, гармоническая, геометрическая, прогрессивная.

    Средняя арифметическая характеризует средний уровень статистической совокупности.

    Для простого ряда, где

    ∑v – сумма вариант,

    n – число наблюдений.

    для взвешенного ряда, где

    ∑vр – сумма произведений каждой варианты на частоту ее встречаемости

    n – число наблюдений.

    Среднее квадратическое отклонение средней арифметической или сигма (σ) характеризует разнообразие признака

    - для простого ряда

    Σd 2 – сумма квадратов разности средней арифметической и каждой варианты (d = │M-V│)

    n – число наблюдений

    - для взвешенная ряда

    ∑d 2 p – сумма произведений квадратов разности средней арифметической и каждой варианты на частоту ее встречаемости,

    n – число наблюдений.

    О степени разнообразия можно судить по величине коэффициента вариации
    . Более 20% - сильное разнообразие, 10-20% - среднее разнообразие, менее 10% - слабое разнообразие.

    Если к средней арифметической величине прибавить и отнять от нее одну сигму (М ± 1σ), то при нормальном распределении в этих пределах будет находиться не менее 68,3% всех вариант (наблюдений), что считается нормой для изучаемого явления. Если к 2 ± 2σ, то в этих пределах будет находиться 95,5% всех наблюдений, а если к М ± 3σ, то в этих пределах будет находиться 99,7% всех наблюдений. Таким образом, среднее квадратическое отклонение является стандартным отклонением, позволяющим предвидеть вероятность появления такого значения изучаемого признака, которое находится в пределах заданных границ.

    Средняя ошибка средней арифметической или ошибка репрезентативности. Для простого, взвешенного рядов и по правилу моментов:

    .

    Для расчета средних величин необходимо: однородность материала, достаточное число наблюдений. Если число наблюдений меньше 30, в формулах расчета σ и m используют n-1.

    При оценке полученного результата по размеру средней ошибки пользуются доверительным коэффициентом, которые дает возможность определить вероятность правильного ответа, то есть он указывает на то, что полученная величина ошибки выборки будет не больше действительной ошибки, допущенной вследствие сплошного наблюдения. Следовательно, с увеличением доверительной вероятности увеличивается ширина доверительного интервала, что, в свою очередь повышает доверительность суждения, опорность полученного результата.

    Статистический ряд распределения – это упорядоченное распределение единиц совокупности на группы по определённому варьирующему признаку.
    В зависимости от признака, положенного в основу образования ряда распределения, различают атрибутивные и вариационные ряды распределения .

    Наличие общего признака является основой для образования статистической совокупности, которая представляет собой результаты описания или измерения общих признаков объектов исследования.

    Предметом изучения в статистике являются изменяющиеся (варьирующие) признаки или статистические признаками.

    Виды статистических признаков .

    Атрибутивными называют ряды распределения , построенные по качественным признакам. Атрибутивный – это признак, имеющий наименование, (например профессия: швея, учитель и т.д.).
    Ряд распределения принято оформлять в виде таблиц. В табл. 2.8 приведён атрибутивный ряд распределения.
    Таблица 2.8 - Распределение видов юридической помощи, оказанной адвокатами гражданам одного из регионов РФ.

    Вариационный ряд – это значения признака (или интервалы значений) и их частоты.
    Вариационными рядами называют ряды распределения , построенные по количественному признаку. Любой вариационный ряд состоит из двух элементов: вариантов и частот.
    Вариантами считаются отдельные значения признака, которые он принимает в вариационном ряду.
    Частоты – это численности отдельных вариантов или каждой группы вариационного ряда, т.е. это числа, показывающие, как часто встречаются те или иные варианты в ряду распределения. Сумма всех частот определяет численность всей совокупности, её объём.
    Частостями называются частоты, выраженные в долях единицы или в процентах к итогу. Соответственно сумма частостей равна 1 или 100 %. Вариационный ряд позволяет по фактическим данным оценить форму закона распределения.

    В зависимости от характера вариации признака различают дискретные и интервальные вариационные ряды .
    Пример дискретного вариационного ряда приведен в табл. 2.9.
    Таблица 2.9 - Распределение семей по числу занимаемых комнат в отдельных квартирах в 1989 г. в РФ.

    В первой колонке таблицы представлены варианты дискретного вариационного ряда, во второй – помещены частоты вариационного ряда, в третьей – показатели частости.

    Вариационный ряд

    В генеральной совокупности исследуется некоторый количественный признак. Из нее случайным образом извлекается выборка объема n , то есть число элементов выборки равно n . На первом этапе статистической обработки производят ранжирование выборки, т.е. упорядочивание чисел x 1 , x 2 , …, x n по возрастанию. Каждое наблюдаемое значение x i называется вариантой . Частота m i – это число наблюдений значения x i в выборке. Относительная частота (частость) w i – это отношение частоты m i к объему выборкиn : .
    При изучении вариационного ряда также используют понятия накопленной частоты и накопленной частости. Пусть x некоторое число. Тогда количество вариантов, значения которых меньше x , называется накопленной частотой: для x i n называется накопленной частостью w i max .
    Признак называется дискретно варьируемым, если его отдельные значения (варианты) отличаются друг от друга на некоторую конечную величину (обычно целое число). Вариационный ряд такого признака называется дискретным вариационным рядом.

    Таблица 1. Общий вид дискретного вариационного ряда частот

    Значения признака x i x 1 x 2 x n
    Частоты m i m 1 m 2 m n

    Признак называется непрерывно варьирующим, если его значения отличаются друг от друга на сколь угодно малую величину, т.е. признак может принимать любые значения в некотором интервале. Непрерывный вариационный ряд для такого признака называется интервальным.

    Таблица 2. Общий вид интервального вариационного ряда частот

    Таблица 3. Графические изображения вариационного ряда

    Ряд Полигон или гистограмма Эмпирическая функция распределения
    Дискретный
    Интервальный
    Просматривая результаты проведенных наблюдений, определяют, сколько значений вариантов попало в каждый конкретный интервал. Предполагается, что каждому интервалу принадлежит один из его концов: либо во всех случаях левые (чаще), либо во всех случаях правые, а частоты или частости показывают число вариантов, заключенных в указанных границах. Разности a i – a i +1 называются частичными интервалами. Для упрощения последующих расчетов интервальный вариационный ряд можно заменить условно дискретным. В этом случае серединное значение i -го интервала принимают за вариант x i , а соответствующую интервальную частоту m i – за частоту этого интервала.
    Для графического изображения вариационных рядов наиболее часто используются полигон, гистограмма, кумулятивная кривая и эмпирическая функция распределения.

    В табл. 2.3 (Группировка населения России по размеру среднедушевого дохода в апреле 1994г.) представлен интервальный вариационный ряд .
    Удобно ряды распределения анализировать при помощи графического изображения, позволяющего судить и о форме распределения. Наглядное представление о характере изменения частот вариационного ряда дают полигон и гистограмма .
    Полигон используется при изображении дискретных вариационных рядов .
    Изобразим, например графически распределение жилого фонда по типу квартир, (табл. 2.10).
    Таблица 2.10 - Распределение жилого фонда городского района по типу квартир (цифры условные).


    Рис. Полигон распределения жилого фонда


    На оси ординат могут наноситься не только значения частот, но и частостей вариационного ряда.
    Гистограмма принимается для изображения интервального вариационного ряда . При построении гистограммы на оси абсцисс откладываются величины интервалов, а частоты изображаются прямоугольниками, построенными на соответствующих интервалах. Высота столбиков в случае равных интервалов должна быть пропорциональна частотам. Гистограмма – график, на котором ряд изображен в виде смежных друг с другом столбиков.
    Изобразим графически интервальный ряд распределения, приведённый в табл. 2.11.
    Таблица 2.11 - Распределение семей по размеру жилой площади, приходящейся на одного человека (цифры условные).
    N п/п Группы семей по размеру жилой площади, приходящейся на одного человека Число семей с данным размером жилой площади Накопленное число семей
    1 3 – 5 10 10
    2 5 – 7 20 30
    3 7 – 9 40 70
    4 9 – 11 30 100
    5 11 – 13 15 115
    ВСЕГО 115 ----


    Рис. 2.2. Гистограмма распределения семей по размеру жилой площади, приходящейся на одного человека


    Используя данные накопленного ряда (табл. 2.11), построим кумуляту распределения.


    Рис. 2.3. Кумулята распределения семей по размеру жилой площади, приходящейся на одного человека


    Изображение вариационного ряда в виде кумуляты особенно эффективно для вариационных рядов, частоты которых выражены в долях или процентах к сумме частот ряда.
    Если при графическом изображении вариационного ряда в виде кумуляты оси поменять, то мы получим огиву . На рис. 2.4 приведена огива, построенная на основе данных табл. 2.11.
    Гистограмма может быть преобразована в полигон распределения, если найти середины сторон прямоугольников и затем эти точки соединить прямыми линиями. Полученный полигон распределения изображён на рис. 2.2 пунктирной линией.
    При построении гистограммы распределения вариационного ряда с неравными интервалами по оси ординат наносят не частоты, а плотность распределения признака в соответствующих интервалах.
    Плотность распределения – это частота, рассчитанная на единицу ширины интервала, т.е. сколько единиц в каждой группе приходится на единицу величины интервала. Пример расчета плотности распределения представлен в табл. 2.12.
    Таблица 2.12 - Распределение предприятий по числу занятых (цифры условные)
    N п/п Группы предприятий по числу занятых, чел. Число предприятий Величина интервала, чел. Плотность распределения
    А 1 2 3=1/2
    1 До 20 15 20 0,75
    2 20 – 80 27 60 0,25
    3 80 – 150 35 70 0,5
    4 150 – 300 60 150 0,4
    5 300 – 500 10 200 0,05
    ВСЕГО 147 ---- ----

    Для графического изображения вариационных рядов может также использоваться кумулятивная кривая . При помощи кумуляты (кривой сумм) изображается ряд накопленных частот. Накопленные частоты определяются путём последовательно суммирования частот по группам и показывают, сколько единиц совокупности имеют значения признака не больше, чем рассматриваемое значение.


    Рис. 2.4. Огива распределения семей по размеру жилой площади, приходящейся на одного человека

    При построении кумуляты интервального вариационного ряда по оси абсцисс откладываются варианты ряда, а по оси ординат накопленные частоты.

    Похожие публикации