Ранжирование ряда. Построение ранжированного, интервального и кумулятивного рядов

Практическое занятие 1

ВАРИАЦИОННЫЕ РЯДЫ РАСПРЕДЕЛЕНИЯ

Вариационным рядом или рядом распределения называют упорядоченное распределение единиц совокупности по возрастающим (чаще) или по убывающим (реже) значениям признака и подсчет числа единиц с тем или иным значением признака.

Существует 3 вида ряда распределения:

1) ранжированный ряд – это перечень отдельных единиц совокупности в порядке возрастания изучаемого признака; если численность единиц совокупности достаточно велика ранжированный ряд становится громоздким, и в таких случаях ряд распределения строится с помощью группировки единиц совокупности по значениям изучаемого признака (если признак принимает небольшое число значений, то строится дискретный ряд, а в противном случае – интервальный ряд);

2) дискретный ряд – это таблица, состоящая из двух столбцов (строк) – конкретных значений варьирующего признака X i и числа единиц совокупности с данным значением признака f i – частот; число групп в дискретном ряду определяется числом реально существующих значений варьирующего признака;

3) интервальный ряд – это таблица, состоящая из двух столбцов (строк) – интервалов варьирующего признака X i и числа единиц совокупности, попадающих в данный интервал (частот), или долей этого числа в общей численности совокупностей (частостей).

Числа, показывающие, сколько раз отдельные варианты встречаются в данной совокупности, называются частотами или весами вариант и обозначаются строчной буквой латинского алфавита f . Общая сумма частот вариационного ряда равна объему данной совокупности, т. е.

где k – число групп, n – общее число наблюдений, или объем совокупности.

Частоты (веса) выражают не только абсолютными, но и от­носительными числами – в долях единицы или в процентах от общей численности вариант, составляющих данную совокуп­ность. В таких случаях веса называют относительными частотами или частостями. Общая сумма частностей равна единице

или
,

если частоты выражены в про­центах от общего числа наблюдений п. Замена частот частостями не обязательна, но иногда оказывается полезной и даже необхо­димой в тех случаях, когда приходится сопоставлять друг с дру­гом вариационные ряды, сильно отличающиеся по их объемам.

В зависимости от того, как варьирует признак – дискретно или непрерывно, в широком или узком диапазоне, – статистиче­ская совокупность распределяется в безынтервальный или интер­вальный вариационные ряды. В первом случае частоты относятся непосредственно к ранжированным значениям признака, которые приобретают положение отдельных групп или классов вариаци­онного ряда, во втором – подсчитывают частоты, относящиеся к отдельным промежуткам или интервалам (от – до), на которые разбивается общая вариация признака в пределах от минималь­ной до максимальной варианты данной совокупности. Эти проме­жутки, или классовые интервалы, могут быть равными и не рав­ными по ширине. Отсюда различают равно- и неравноинтервальные вариационные ряды. В неравноинтервальных рядах характер распределения час­тот меняется по мере изменения ширины классовых интервалов. Неравноинтервальную группировку в биологии применяют сравнительно редко. Как правило, биометрические данные рас­пределяются в равноинтервальные ряды, что позволяет не только выявлять закономерность варьирования, но и облегчает вычисле­ние сводных числовых характеристик вариационного ряда, сопо­ставление рядов распределения друг с другом.

Приступая к построению равноинтервального вариационного ряда, важно правильно наметить ширину классового интервала. Дело в том, что грубая группировка (когда устанавливают очень широкие классовые интервалы) искажает типичные черты варьи­рования и ведет к снижению точности числовых характеристик ряда. При выборе чрезмерно узких интервалов точность обобщающих числовых характеристик повышается, но ряд получается слишком растянутым и не дает четкой картины варьирования.

Для получения хорошо обозримого вариационного ряда и обеспечения достаточной точности вычисляемых по нему числовых характеристик следует разбить вариацию признака (в пределах от минимальной до максимальной варианты) на такое число групп или классов, которое удовлетворяло бы обоим требо­ваниям. Эту задачу решают делением размаха варьирования признака на число групп или классов, намечаемых при построе­нии вариационного ряда:

,

где h – величина интервала; X м a x и X min – максимальное и минимальное значения в совокупности; k – число групп.

При построении интервального ряда распределения необходимо выбирать оптимальное число групп (интервалов признака) и установливать длину (размах) интервала. Поскольку при анализе ряда распределения сравнивают частоты в разных интервалах, необходимо, чтобы длина интервалов была постоянной. Если приходится иметь дело с интервальным рядом распределения с неравными интервалами, то для сопоставимости нужно частоты или частости привести к единице интервала, полученное значение называется плотностью ρ , то есть
.

Оптимальное число групп выбирается так, чтобы достаточной мере отразилось разнообразие значений признака в совокупности и в то же время закономерность распределении, его форма не искажалась случайными колебаниями частот. Если групп будет слишком мало, не проявится закономерность вариации; если групп будет чрезмерно много, случайные скачки частот исказят форму распределения.

Чаще всего число групп в ряду распределения определяют по формуле Стерждесса:

где n – численность совокупности.

Существенную помощь в анализе ряда распределения и его свойств оказывает графическое изображение. Интервальный ряд изображается столбиковой диаграммой, в которой основания столбиков, расположенные по оси абсцисс, – это интервалы значений варьирующего признака, а высоты столбиков – частоты, соответствующие масштабу по оси ординат. Диаграмма такого типа называется гистограммой.

Если имеется дискретный ряд распределения или используются середины интервалов, то графическое изображение такого ряда называется полигоном , которое получается соединением прямыми точек с координатами X i и f i .

Если по оси абсцисс откладывать значения классов, а по оси ординат – накопленные частоты с последующим соединени­ем точек прямыми линиями, получается график, называемый кумулятой. Накопленные частоты находят последо­вательным суммированием, или кумуляцией частот в направлении от первого класса до конца вариационного ряда.

Пример . Имеются данные о яйценоскости 50 кур-несушек за 1 год, содер­жащихся на птицеферме (табл. 1.1).

Т а б л и ц а 1.1

Яйценоскость кур-несушек

№ курицы-несушки

Яйценоскость, шт.

№ курицы-несушки

Яйценоскость, шт.

№ курицы-несушки

Яйценоскость, шт.

№ курицы-несушки

Яйценоскость, шт.

№ курицы-несушки

Яйценоскость, шт.

Требуется построить интервальный ряд распределения и отобразить его графически в виде гистограммы, полигона и кумуляты.

Видно, что признак варь­ирует от 212 до 245 яиц, полученных от несушки за 1 год.

В нашем примере по формуле Стерждесса определим число групп:

k = 1 + 3,322lg 50 = 6,643 ≈ 7.

Рассчитаем длину (размах) интервала по формуле:

.

Построим интервальный ряд с 7 группами и интервалом 5 шт. яиц (табл. 1.2). Для построения графиков в таблице рассчитаем середину интервалов и накопленную частоту.

Т а б л и ц а 1.2

Интервальный ряд распределения яйценоскости

Группа кур-несушек по величине яйценоскости

X i

Число кур-несушек

f i

Середина интервала

Х i ’

Накопленная частота

f i

Построим гистограмму распределения яйценоскости (рис. 1.1).

Р и с. 1.1. Гистограмма распределения яйценоскости

Данные гистограммы показывают характерную для многих признаков форму распределения: чаще встречаются значения средних интервалов признака, реже – крайние (малые и большие) значения признака. Форма этого распределения близка к нормальному закону распределения, которое образуется, если на варьирующую переменную влияет большое число факторов, ни один из которых не имеет преобладающего значения.

Полигон и кумулята распределения яйценоскости имеют вид (рис. 1.2 и 1.3).

Р и с. 1.2. Полигон распределения яйценоскости

Р и с. 1.3. Кумулята распределения яйценоскости

Технология решения задачи в табличном процессоре Microsoft Excel следующая.

1. Введите исходные данные в соответствии с рис. 1.4.

2. Ранжируйте ряд.

2.1. Выделите ячейки А2:А51.

2.2. Щелкните левой кнопкой мыши на панели инструментов на кнопке <Сортировка по возрастанию > .

3. Определите величину интервала для построения интервального ряд распределения.

3.1. Скопируйте ячейку А2 в ячейку Е53.

3.2. Скопируйте ячейку А51 в ячейку Е54.

3.3. Рассчитайте размах вариации. Для этого введите в ячейку Е55 формулу =E54-E53 .

3.4. Рассчитайте число групп вариации. Для этого введите в ячейку Е56 формулу =1+3,322*LOG10(50) .

3.5. Введите в ячейку Е57 округленное число групп.

3.6. Рассчитайте длину интервала. Для этого введите в ячейку Е58 формулу =E55/E57 .

3.7. Введите в ячейку Е59 округленную длину интервала.

4. Постройте интервальный ряд.

4.1. Скопируйте ячейку Е53 в ячейку В64.

4.2. Введите в ячейку В65 формулу =B64+$E$59 .

4.3. Скопируйте ячейку В65 в ячейки В66:В70.

4.4. Введите в ячейку С64 формулу =B65 .

4.5. Введите в ячейку С65 формулу =C64+$E$59 .

4.6. Скопируйте ячейку С65 в ячейки С66:С70.

Результаты решения выводятся на экран дисплея в следующем виде (рис. 1.5).

5. Рассчитайте частоту интервалов.

5.1. Выполните команду Сервис , Анализ данных , щелкнув поочередно левой кнопкой мыши.

5.2. В диалоговом окне Анализ данных с помощью левой кнопки мыши установите: Инструменты анализа  <Гистограмма> (рис. 1.6).

5.3. Щелкните левой кнопкой мыши на кнопке <ОК>.

5.4. На вкладке Гистограмма установите параметры в соответствии с рис. 1.7.

5.5. Щелкните левой кнопкой мыши на кнопке <ОК>.

Результаты решения выводятся на экран дисплея в следующем виде (рис. 1.8).

6. Заполните таблицу «Интервальный ряд распределения».

6.1. Скопируйте ячейки В74:В80 в ячейки D64:D70.

6.2. Рассчитайте сумму частот. Для этого выделите ячейки D64:D70 и щелкните левой кнопкой мыши на панели инструментов на кнопке <Автосумма > .

6.3. Рассчитайте середину интервалов. Для этого введете в ячейку Е64 формулу =(B64+C64)/2 и скопируйте в ячейки Е65:Е70.

6.4. Рассчитайте накопленные частоты. Для этого скопируйте ячейку D64 в ячейку F64. В ячейку F65 введите формулу =F64+D65 и скопируйте в ячейки F66:F70.

Результаты решения выводятся на экран дисплея в следующем виде (рис. 1.9).

7. Отредактируйте гистограмму.

7.1. Щелкните правой кнопкой мыши на диаграмме на названии «карман» и на появившейся вкладке нажмите кнопку <Очистить>.

7.2. Щелкните правой кнопкой мыши на диаграмме и на появившейся вкладке нажмите кнопку <Исходные данные>.

7.3. В диалоговом окне Исходные данные измените подписи оси Х. Для этого выделите ячейки В64:С70 (рис. 1.10).

7.5. Нажмите клавишу .

Результаты выводятся на экран дисплея в следующем виде (рис. 1.11).

8. Постройте полигон распределения яйценоскости.

8.1. Щелкните левой кнопкой мыши на панели инструментов на кнопке <Мастер диаграмм > .

8.2. В диалоговом окне Мастер диаграмм (шаг 1 из 4) с помощью левой кнопки мыши установите: Стандартные  <График> (рис. 1.12).

8.3. Щелкните левой кнопкой мыши на кнопке <Далее>.

8.4. В диалоговом окне Мастер диаграмм (шаг 2 из 4) установите параметры в соответствии с рис. 1.13.

8.5. Щелкните левой кнопкой мыши на кнопке <Далее>.

8.6. В диалоговом окне Мастер диаграмм (шаг 3 из 4) введите названия диаграммы и ос Y (рис. 1.14).

8.7. Щелкните левой кнопкой мыши на кнопке <Далее>.

8.8. В диалоговом окне Мастер диаграмм (шаг 4 из 4) установите параметры в соответствии с рис. 1.15.

8.9. Щелкните левой кнопкой мыши на кнопке <Готово>.

Результаты выводятся на экран дисплея в следующем виде (рис. 1.16).

9. Вставьте на графике подписи данных.

9.1. Щелкните правой кнопкой мыши на диаграмме и на появившейся вкладке нажмите кнопку <Исходные данные>.

9.2. В диалоговом окне Исходные данные измените подписи оси Х. Для этого выделите ячейки Е64:Е70 (рис. 1.17).

9.3. Нажмите клавишу .

Результаты выводятся на экран дисплея в следующем виде (рис. 1.18).

Кумулята распределения строится аналогично полигону распределения на основе накопленных частот.

Вариационный ряд представляет собой расположение значений признака каждой статистической единицы в определенном порядке. При этом отдельно взятые значения признака принято называть вариантой (вариантом). . Каждый член вариационного ряда (варианта) называется порядковой статистикой, а номер варианты - рангом (порядком) статистики.

Важнейшими характеристиками вариационного ряда являются его крайне варианты (Х 1 =Хmin; Х n =Хmax) и размах вариации (Rх = Хn – Х 1).

Вариационные ряды находит широкое применение при первичной обработке статистической информации, полученной в результате статистического наблюдения. Они служат базой для построения эмпирической функции распределения статистических единиц в составе статистической совокупности. Поэтому вариационные ряды называют рядами распределения .

В статистике различает следующие виды вариационных рядов: ранжированный, дискретный, интервальный.

Ранжированный (от латинского rang – чин) ряд - это такой ряд распределения единиц статистической совокупности, в котором варианты признака в порядке возрастания или убывания. Любой ранжированный ряд состоит из ранговых номеров (1 до n) и соответствующих им вариант. Число вариант в ранжированном ряду, сформированному по существенному признаку, обычно равно числу единиц в статистической совокупности.

Для формирования ранжированного ряда по заданному признаку (например, по числу работников животноводства в 100 сельскохозяйственных предприятиях) можно воспользоваться макетом табл. 5.1.

Т а б л и ц а 5.1. Порядок формирования ранжированного ряда

Конец работы -

Эта тема принадлежит разделу:

Статистика

И продовольствия республики беларусь.. департамент образования науки и кадров..

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ:

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

Шундалов Б.М
Общая теория статистики. Учебное пособие для экономических специальностей высших сельскохозяйственных учебных заведений. Учебное пособие со

Предмет статистики
Слово "статистика" происходит от латинского "статус" (status), которое означает состояние, положение вещей. Это даёт возможность подчеркнуть теоретическую познавательную сущност

Сущность статистического наблюдения
Любое статистическое исследование, как было отмечено выше (тема 1), всегда начинается со сбора первичной (исходной) информации о каждой единице статистической совокупности. Однако, не всяк

Программа статистического наблюдения
В первой главе было обращено внимание на то, что каждая статистика единица, как объект в целом, обладает множеством различных свойств, качеств, специфических особенностей, которые принято называть

Перечень признаков, регистрируемых в процессе наблюдения, принято называть программой статистического наблюдения
Разработка программы – один из важнейших теоретических и практических вопросов статистического наблюдения. Добротность программы во многом определяет качество собранного материала, его надёжность и

Формы статистического наблюдения
Всё многообразие статистических наблюдений сводит к двум формам: статистической отчётности и специально организованным статистическим наблюдениям. Статистическая отчётность

Статистические формуляры
Статистический формуляр – это банк, содержащий вопросы программы статистического наблюдения и место для ответов на них. формуляр является носителем статистической информации, полученной в результат

Виды статистического наблюдения
Статистические наблюдения классифицируются по видам, которые могут различаться по различным принципам. Так, в зависимости от степени охвата изучаемого объекта статистические наблюдения могут подраз

Способы проведения статистических наблюдений
Статистические наблюдения могут проводится различными способами, среди которых нередко встречаются следующие: отчётный, экспедиционный, самоисчисления, саморегисрации, анкетный, корреспондентский.

Место, сроки и период проведения статистических наблюдений
В плане любого статистического наблюдения должно быть чётко определено место проведения этого наблюдения, т.е. то место, где производится регистрация собираемой информации, заполнения статистическо

Ошибки статистического наблюдения и меры борьбы с ними
Одним из наиболее важных требований, предъявляемых к результатам статистического наблюдения, является их точность, под которой понимается мера соответствия статистических знаний, п

Первичная статистическая сводка
Результаты статистического наблюдения содержат разносторонние сведения о каждой единице совокупности или объекта и обычно носят неупорядоченный характер. Этот исходный материал необходимо, прежде в

Сущность и значение относительных статистических показателей
Относительные показатели – это статистические величины, выражающие меру количественного соотношения абсолютных значений признака и отображающие относительные размеры явлений и процессов. О

Виды относительных показателей. Относительные показатели динамики
В зависимости от задач, решаемых с помощью относительных величин, различают следующие виды относительных показателей: динамики, структуры, координации, интенсивности, сравнения, выполнения заказа,

Относительные показатели структуры
Одна из важнейших особенностей всех явлений заключается в их сложности. Даже молекула дистиллированной воды состоит из атомов водорода и кислорода. Многие же явления природы, общества, человеческог

Относительные показатели координации
Относительные показатели координации – это соотношение между собой абсолютных размеров составных частей в некотором абсолютном целом. Для расчёта этих показателей одну из составных

Относительные показатели интенсивности
Относительные показатели интенсивности (степени) представляют собой соотношение абсолютных размеров двух качественно различных, но взаимосвязанных признаков в статистической совоку

Относительные показатели сравнения
Относительные показатели сравнения (сопоставления) получают путем соотношения одноименных абсолютных показателей, относящихся к разным статистическим единицам, сов

Относительные показатели выполнения заказа
Относительные показатели выполнения заказа (задания, плана) представляют собой соотношение абсолютных, фактически достигнутых показателей за определенный период или по состоянию на

Относительные показатели уровня экономического развития
Относительными показателями уровня экономического развития называют соотношение абсолютных размеров двух качественно различных (разноименных), но взаимосвязанных признаков. При это

Сущность и значение графического метода
Абсолютные статистические показатели, полученные в результате статистических наблюдений, и рассчитанные на этой основе разнообразные относительные показатели могут быть лучше, глубже, доступнее пон

Основные требования, предъявляемые к построению координатных диаграмм
Наиболее распространенным и удобным способом графического изображения абсолютных и относительных показателей динамики, показателей сравнения и др. считается координатнаядиаграмма.

Способы графического изображения показателей динамики и структуры
Во многих случаях имеется необходимость на одной и той же координатной диаграмме отразите не одну, а несколько линий, характеризующих динамику различных абсолютных или относительных показателей либ

Способы графического изображения показателей сравнения
В широком понимании сравнение показателей проводится как во времени, так и в пространстве, т.е. приемами сравнения могут быть охвачены и динамика, и структура, и территориальные объекты. Поэтому пр

Сущность и значение картограмм и картодиаграммы
Во многих случаях имеется необходимость графически изобразить важнейшие признаки, характерные для обширных территориальных объектов. В системе АПК это могут быть населенные пункты, сельскохозяйстве

Контрольная вопросы к теме 4
1. Что представляет собой графический метод и на чем он основывается? 2. С какими основными целями используется графический метод. 3. Каким образом классифицируютс

Сущность вариации. Виды вариационных признаков
Вариация (от латинского variatio – изменение) представляет собой изменение признака (вариант) в статистической совокупности, т.е. принятие единицами совокупности или их группами разных знаний призн

По числу работников животноводства
Ранговый номер (№) варианты Варианта, соответствующая ранговому номеру (№) Символ Число работников животноводства

Дискретный ряд распределения
Дискретный (разделительный) ряд представляет собой такой вариационный ряд, в котором его группы сформированы по признаку, изменяющемуся прерывно, т.е. через определённое число един

Работников животноводства
№ варианты Варианта (значение признака), Х Частотные знаки Локальные частоты, fл Накопительные частоты, fн

Интервальный ряд распределения
Во многих случаях, кота статистическая совокупность включает большое или тем более бесконечное число вариант, что чаще всего встречается при непрерывной вариации, практически невозможно и нецелесоо

Сущность средних величин
Вариационные ряды отображают большое разнообразие явлений и процессов, составляющих сущность нашей действительности. Для более полного, углубленного изучения явлений и процессов окружающего нас мир

Средняя арифметическая величина
Если в формулу 6.2 подставить значение К=1, то получается средняя арифметическая величина, т.е. .

В ранжированном ряду распределения
Ранговые №№ Варианты (значения признака) Символы Посевная площадь, га

Ряду распределения
№ п.п. Варианты Локальные частоты Взвешенные средние варианты Символы Урожайн

Основные свойства средней арифметической величины
Средняя арифметическая величина обладает многими математическими свойствами, имеющими важное математическое значение при ее расчёте. Знание этих свойств помогают контролировать правильность и точно

Средняя хронологическая величина
Одной из разновидностей средней арифметической величины является средняя хронологическая. Среднюю величину, исчисленную по совокупности значений признака в разные моменты или за различные периоды в

Средняя квадратическая величина
При условии постановки значения К=2 в формулу 6.2. получаем среднюю квадратическую величину. В ранжированном ряду средняя квадратическая величина рассчитывается по невзвешенной (пр

Средняя геометрическая величина
Если в формулу 6.2 подставить значение К=0, то в результате получаем среднюю геометрическую величину, которая имеет простую (невзвешенную) и взвешенную формы. Средняя геометрическая проста

Средняя гармоническая величина
При условии подстановки в общую формулу 6.2 значение К=-1 можно получить среднюю гармоническую величину, которая имеет простую и взвешенную формы. Название средней гармони

Структурные среднее. Сущность и значение моды
В некоторых случаях для получения обобщающей характеристики статистической совокупности по какому-либо признаку приходится пользоваться т.н. структурными средними. К ним относят

Сущность и значение медианы
Медиана– варианта, находящиеся в середине вариационного ряда. Медиана в ранжированном ряду находится следующим образом. Во-первых, рассчитывают номер медианой варианты:

Понятие о простейших показателях вариации
Сущность вариации была рассмотрена в 5 главе учебника, где отмечалось, что вариация – это колеблемость, изменение величины признака в статистической совокупности, т.е. принятие единицами совокупнос

Среднее квадратической отклонение
Среднее квадратической отклонение рассчитывается на базе средней квадратической величины. Оно выступает в не взвешенной (простой) и взвешенной формах. Для ранжированного р

Коэффициент вариации
Коэффициент вариации представляет собой относительный показатель, который можно рассчитать по следующей формуле:

Контрольна вопросы к теме 6
1. Что такое средняя величина и что она выражает? 2. Что представляет собой определяющее свойство совокупности и для чего его применяют в статистике? 3. Какие основные виды средни

Сущность генеральной и выборочной совокупности
В статистике сравнительно редко встречается сплошной вид наблюдения, каким является, например, всеобщая перепись населения. Все-таки наиболее часто приходится использовать несплошные наблюдения, ко

Понятие о стохастической совокупности
В реальных условиях сравнительно редко встречаются случаи статистической работы с генеральной совокупностью и, следовательно, далеко не всегда можно получить основные статистические характеристики

Сущность выборочного метопа
Статистическая работа в большинстве случаев так или иначе связана с данными, полученными в результате применения выборочного метода. Многие исследования были бы невыполнимы, если бы не использовали

Преимущества и недостатки выборочного метода
Выборочный метод имеет ряд преимуществ перед сплошным наблюдением. Во - первых, выборочное наблюдение позволяет существенно экономить труд, средства, время для его проведения. Сове

Способы отбора, их преимущества и недостатки
Отбор статистических единиц из генеральной совокупности может быть произведен no-разному и зависит от многих условий. Выборочный метоп включает следующие способы отбора статистических единиц случай

Сущность ошибок репрезентативности и порядок их расчета
Одним из центральных вопросов по выборочному методу считается теоретический расчет основных статистических характеристик и прежде всего среднего значения признаке в генеральной статистической совок

Понятие о малой выборке. Точечная оценка основных статистических характеристик
Применение выборочного метопа может базироваться на отборе из генеральной совокупности теоретически любого числа статистических единил. Математически доказано, что выборочные совокупности могут быт

Предельная ошибка выборки. Интервальная опенка основных статистических характеристик
Предельная ошибка выборки представляет собой расхождение между статистическими характеристиками, полученными в выборочной и генеральной совокупности Как было показано выше (формула

Приемы расчета численности выборки при различных способах отбора
Подготовительная работа к проведению выборочного наблюдения непосредственно связана с определением необходимой численности выборки, которая зависит от способа отбора и численности единиц в генераль

Понятие о вторичной (сложной) статистической сводке
Результаты простой сводки, содержание которой рассмотрено в теме 2, не всегда могут удовлетворить исследователя, так как они дают лишь общее представление об изучаемом объекте, т.е. от статистики т

Типологические группировки
Типологическая группировкапредставляет собой расчленение статистической совокупности на одно-качественных в существенном отношении типологических группы. Типологическую группировку

Структурные группировки
Структурная группировка заключается в расчленении однородной и качественном отношении совокупности статистических единиц на группы, характеризующий состав сложного объекта. Посредством структурной

Сущность и порядок проведения простой и аналитической группировки
Аналитическая группировка, при которой статистическая совокупность разбивается на однородные группы по одному какому-либо факторному признаку, называется простой.

Аналитической группировки
№п.п. Группы крестьянских хозяйств по дозам удобрений, т/га. Частотные знаки в группах (число единиц совокупности в группе)

Результативными показателями в картофелеводстве
№ п.п. Показатели Группы хозяйств по доза удобрений, т/га Итого (в среднем) 10-20

Сущность и значение статистических таблиц
Результаты обработки данных наблюдения с помощью разнообразных статистических методов (сводки, относительных, средних величин, формирований, вариационных рядов, показателей вариации, аналитических

Элементарный состав статистических таблиц
Комплексная статистическая обработка результатов наблюдения обычно связана с использованием многочисленных таблиц. Поэтому каждой таблице присваивается индивидуальный номер.Обязате

Виды и формы статистических таблиц
В зависимости от строения табличного подлежащего различают следующие виды статистических таблиц: простые, групповые и комбинационные. Простая статистическая таблица - хара

Вспомогательные и результативные статистические таблицы
Статистические таблицы могут выполнять различную функциональную роль. Одни из них служат например, для обобщения результатов статистического наблюдения и способствуют выполнения функции первичной с

Результатами производства, 2003 г
(комбинационная таблица) № п.п. Группы хозяйств по нагрузке сельхозугодий на 1 трактор, га Подгруппы хозяйств по нагрузк

Льноперерабатывающих предприятий АПК в 2003 г
(рабочая таблица) № п.п. Годовой объем переработки тресты, т Численность работников, чел Грузоподъемность а

Оформление статистических таблиц
Достижение поставленных целей с помощью табличного метода возможно в тех случаях, когда выдержаны необходимые требования по оформление статистических таблиц. Обычно все таблицы должны имет

Понятие о дисперсионном методе
Название метода обусловлено широким использованием различных видов дисперсий, сущность и способы расчета которых рассмотрены в шестой теме учебника. Целесообразно отметить, что дисперсия количестве

Признака-результата
№ п/п Индивидуальные варианты Линейные отклонения индивид. вариант от средней Квадраты линейных отклонений

Крестьянских хозяйствах
№ п/п Урожайность, ц/га Линейные отклонения индивидуальной урожайности от средней, ц/га Квадраты линейных отклонений урожайнос

Фитофтороза, на урожайность картофеля
№ п/п Группы хозяйств по удельному весу обработанных посевов, % Число хозяйств в группе Средний удельный вес обработанных посевов,

Признака-результата
№ группы Интервалы по факторному признаку Локальная частота Средняя варианта результативного признака

Виды дисперсий. Правило сложения дисперсий
Принцип расчета дисперсии (среднего квадрата отклонений) в общем виде рассмотрен в теме 6. Применительно к дисперсионному методу это означает, что каждому виду вариации соостветствует определенная

Урожайности картофеля (первая группа)
№ п.п. Урожайность, ц/га Линейное отклонение от средней групповой урожайности Квадраты линейных отклонений

Понятие о критерии Р. Фишера
Дисперсионный метод состоит в оценке отношения исправленной дисперсии, характеризующей систематические колебания групповых средних значений изучаемого результативного признака, к исправленной диспе

Двухфакторный дисперсионный комплекс
Решение этого комплекса направленно на изучение качественного влияния двух факторных признаков влияния двух факторных признаков на один или несколько результативных признаков. Двухфакторный комплек

Зерновых культур
№ подгруппы Число хозяйств в подгруппе Средняя урожайность ц/га Линейные отклонения урожайности в подгруппе от средн

Особенности многофакторного дисперсионного комплекса
Изучение качества связи, т.е. существенности влияния нескольких (трех, четырех и более) факторных признаков на результативные показатели, по существу является продолжительности приема комбинированн

Урожайности зерновых культур
№ п.п. Элементы вариаций Символы Общая вариация Систематическая вариация Остаточная вариац

Сущность и виды корреляций
В предыдущей главе было показано, что качество (существенность) зависимости между факторными и результативными признаками в статистической совокупности определяется и оценивается с помощью дисперси

Основные формы корреляционной связи между признаками
Выявлению формы связи между признаками предшествует определение причинной зависимости между ними. Это наиболее важный и ответственный момент для правильного использования корреляционного метода. По

Показатели тесноты корреляционных связей. Корреляционное отношение
Одним из центральных вопросов, решаемых с помощью корреляционного метода, является определение и оценка количественной меры тесноты связи между факторными и результативными признаками. При

Коэффициенты прямолинейной парной корреляции
Если взаимосвязь между признаками изучаемой парой признаков выражается в форме, близкой к прямой, то степень тесноты связи между этими признаками можно рассчитать при помощи коэффициента пр

Ранговый коэффициент корреляции
Основные статистические характеристики в тех случаях, когда генеральная совокупности, из которой берется выборка, оказывается за пределами параметров нормального или близкого к нему закона распреде

Коэффициент множественной корреляции
При изучении тесноты связи между несколькими факторными и результативными признаками рассчитывают совокупный коэффициент множественной корреляции. Так, при определении совокупной м

Показатели детерминации
При изучении количественного влияния признаков – факторов на результаты важно определить, какая часть колеблемости результативного признака непосредственно обусловлена воздействием вариации изучаем

Сущность, виды, и значение уравнений регрессии
Под регрессией понимается функция, предназначенная для описания зависимости изменения результативных признаков под влиянием колеблемости признаков – факторов. Понятие регрессии введено в статистиче

Уравнение прямолинейной регрессии
Корреляционную связь в форме, близкой к прямолинейной, можно представить в виде уравнения прямой линии:

Уравнение гиперболической регрессии
Если форма связи между признаком-фактором и признаком-результатом, выявленная с помощью координатной диаграммы (поля корреляции), приближается к гиперболической, то необходимо составить и решить ур

Регрессии
№ п.п. Признак-фактор Признак-результат Обратное значение признака-фактора Квадрат обратного значения

Гиперболической регрессии
№ п.п. Урожайность гороха, ц/га Х Себестоимость гороха, тыс. руб./ц У Расчетные величины

Уравнение параболической регрессии
В некоторых случаях эмпирические данные статистической совокупности, изображенные наглядно с помощью координатной диаграммы, показывают, что увеличение фактора сопровождаются опережающим ростом рез

Параболической регрессии
№ п.п. Х У ХУ Х2 Х2У Х4

Параболической регрессии
№ п.п. Удельный вес посевов картофеля, Х Урожай картофеля, тыс. ц. У Расчеты величины

Уравнение множественной регрессии
Применение корреляционного метода при изучении зависимости признака – результата от нескольких факторных признаков формируется по схеме, аналогической простой (парной) корреляции. Одной из

Коэффициенты эластичности
Для содержательного и доступного описания (интерпретации) результатов, отражающих корреляционно – регрессионную зависимость между признаками посредством различных уравнений регрессии, обычно исполь

Сущность динамического ряда
Все явления окружающего мира претерпевают непрерывные изменения во времени; с течением времени, т.е. в динамике изменяется их объем, уровень, состав, структура и т.д. целесообразно отметить, что по

Сельскохозяйственных предприятиях
(на начало года; тыс. физических единиц) Показатели 2000 г. 2001 г. 2002 г. 2003 г.

Основные показатели динамического ряда
Всесторонний анализ динамического ряда позволит вскрыть и характеризовать закономерности, проявляющие на разных этапах развития явлений, выявить тенденции и особенности развития этих явлений. В про

Абсолютные приросты уровней
Одним из наиболее простых показателей развития динамики является абсолютный прирост уровня. Абсолютным приростом называется разность двух уровней динамического ряда.Абсолю

Темпы роста уровней
Для характеристики относительной скорости изменения показатель темпа роста. Темп роста – это отношение одного уровня динамического ряда к другому, принятому за базу сравнения. темп роста могут быть

Темп прироста уровней
Если абсолютная скорость прироста уровней динамического ряда характеризуется величиной абсолютных приростов, то относительная скорость прироста уровней – темпами прироста. Темп при

Абсолютное значение одного процента прироста
При анализе динамических рядов нередко ставится задача: выяснить, каким абсолютными значениями выражается 1 % прироста (снижения) уровней, так как в ряде случаев при снижении (замедлении) темпов ро

За 1999-2003 гг
Годы Урожайность, ц/га Абсолютные приросты урожайности., ц/га Темп роста, % Темп прироста, %

Приемы выравнивания динамических рядов
Для выявления временных закономерностей требует, как правило, достаточно большое число уровней, динамического ряда. Если же динамический ряд состоит из ограниченного числа уровней, то его выравнива

Способы аналитического выравнивания динамического рядов
Выявление общей тенденции развития уровней динамического ряда может быть проведено с применением различных приемов аналитического выравнивания, которое наиболее часто осуществляетс

Аналитическое выравнивание по показательной кривой
В некоторых случаях, например, в процессе ввода в действие и освоение новых производственных мощностей, для динамического ряда может быть характерно быстрорастущее изменение уровней, т.е. цепные те

Аналитическое выравнивание по параболе второго порядка
Если изучаемый динамический ряд характеризуется положительными абсолютными приростами, с ускорением развития уровней, то выравнивание ряда может быть проведено по параболе второго порядка.

Аналитическое выравнивание по уравнению гиперболы
Если для динамического ряда характерны затухающие абсолютные снижения уровней (например, динамика трудоемкости продукции, трудообеспеченности производства в сельском хозяйстве и др.), то выравниван

Понятие об интерполяции и экстраполяции уровней динамического ряда
В некоторых случаях необходимо найти значения отсутствующих промежуточных уровней динамического ряда на основе известных его значений. В таких случаях может быть использован прием интерполяции, зак

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http :// www . allbest . ru /

Задание №1

На основании данных статистического наблюдения, приведенных в таблице построить ранжированный, интервальный и кумулятивный ряды распределения сельскохозяйственных предприятий по факторному признаку, изобразить их графически.

Провести сводку данных. Посредством метода группировок определите зависимость результативного признака в сельскохозяйственных предприятиях от факторного. Построить таблицы и графики зависимости. Вывод.

группировка ряд распределение факторный

Качество почвы,баллы (х)

(у)

Решение:

Построение ранжированного ряда распределения предполагает расположение всех вариантов ряда в порядке возрастания изучаемого признака (качества почвы). Проведение сортировки производилось в программе ТП Excel с использованием функции "Сортировка".

Качество почвы

Урожайность овощей открытого грунта

Графическое изображение ранжированного ряда распределения

Линия на рис.1 носит название огива Гальтона. Данная огива имеет тенденцию плавного роста с небольшими скачками в некоторых точках. Для преобразования ранжированного ряда в интервальный лучше выполнить разбивку на группы вручную.

Построение интервального ряда распределения предприятий по изучаемому признаку предполагает определение числа групп (интервалов).

Для расчета числа групп воспользуемся формулой:

n=2 , где N-общее число единиц изучаемой совокупности.

n=2 Ig30 = 2,95424251?3.

Величина равного интервала вычисляется по формуле:

i = = = 16,33333

Кумулятивный ряд - это ряд в котором подсчитываются накопленные частоты. Он показывает, сколько единиц совокупности имеют значение признака не больше, чем данное значение, и вычисляется путем последовательного прибавления к частоте первого интервала частот последующих интервалов.

Интервальный и кумулятивный ряды

частота - число предприятий в группе;

Удельный вес предприятий в группе - находится по формуле:

(число предприятий в группе*100%)/ m , где m-число экспериментальных данных;

Накопленная частота - находится по формуле: число предприятий в предедущей группе +частота данной группы.

Гистограмма частот

Кумулята распределения качества почвы

Сводные показатели

№ группы

Число предприятий в группе

Урожайность овощей открытого грунта (всего по группам)

Качество почвы (всего по группам)

II 61,33333-77,33333

III 77,33333-94,1

Средние характеристики групп

№ Группы

Урожайность овощей открытого грунта

Качество почвы

II 61,33333-77,33333

III 77,33333-94,1

В среднем по совокупности

где, столбец "урожайность овощей" находится по формуле: У У i группе ) / число предприятий в группе ;

столбец "Качество почвы" находится по формуле: У Х i группе)/число предприятий в группе.

Зависимость урожайности овощей открытого грунта от качества почвы.

В рассматриваемом примере можно сделать вывод: с ростом качества почвы увеличивается урожайность овощей открытого грунта, следовательно можно предположить наличие прямой связи между рассматриваемыми параметрами.

Размещено на Allbest.ru

Подобные документы

    Аналитическая группировка по факторному признаку. Построение вариационного частотного и кумулятивного рядов распределения на основе равно интервальной структурной группировки результативного признака – дивидендов, начисленных по результатам деятельности.

    контрольная работа , добавлен 07.05.2009

    Основные показатели численности населения и его размещения по Калужской области. Построение ранжированного и интервального рядов распределения по одному группировочному факторному признаку. Анализ типических групп по показателям в среднем по совокупности.

    курсовая работа , добавлен 11.10.2010

    Построение с помощью формулы Стержесса. Построение рядов распределения с произвольными интервалами. Построение рядов распределения с помощью среднего квадратического отклонения. Классификация рядов распределения. Расчет основных характеристик вариации.

    курсовая работа , добавлен 22.11.2013

    Анализ, расчет и построение исходных динамических рядов признака-функции и признака-фактора. Расчет показателей вариации динамических рядов. Количественное измерение тесноты связи признака-функции и признаков-факторов методом парной корреляции.

    курсовая работа , добавлен 24.09.2014

    Оценка совокупности на предмет её однородности. Построение ранжированного и интервального рядов распределения. Анализ рядов динамики методами укрупнения интервалов и скользящей средней, аналитическое выравнивание по уравнению прямой и параболы.

    курсовая работа , добавлен 10.09.2014

    Расчет среднего балла успеваемости по данным результатов сессии, определение показателя вариаций уровня знаний и структуры численности студентов по успеваемости. Построение интервального ряда распределения предприятий. Оценка коэффициентов корреляции.

    контрольная работа , добавлен 21.08.2009

    Понятие и виды статистической группировки, производимой с целью установления статистических связей и закономерностей, выявления структуры изучаемой совокупности. Построение интервального ряда распределения предприятий по признаку "торговая площадь".

    дипломная работа , добавлен 14.02.2016

    Основные категории статистики. Группировка - основа научной обработки данных статистики. Содержание сводки и статистическая совокупность. Построение вариационного, ранжированного и дискретного рядов распределения. Группировка предприятий по числу рабочих.

    контрольная работа , добавлен 17.03.2015

    Проведение расчета абсолютных, относительных, средних величин, коэффициентов регрессии и эластичности, показателей вариации, дисперсии, построение и анализ рядов распределения. Характеристика аналитического выравнивания цепных и базисных рядов динамики.

    курсовая работа , добавлен 20.05.2010

    Проведение экспериментального статистического исследования социально-экономических явлений и процессов Смоленской области на основе заданных показателей. Построение статистических графиков, рядов распределения, вариационных рядов, их обобщение и оценка.

Понятие сводки, группировки, классификации

Сводка – систематизация и подведение итогов: метеосводка, сводка с полей. Сводка не позволяет детально проанализировать информацию. Любая сводка должна опираться на группировку данных, т.е. сначала группировка, а потом сводка данных.

Группировка – разделение совокупностей на ряд групп по наиболее существенным признакам.

Различают качественную и количественную группировку. Качественная – атрибутивная, количественная – вариационная. В свою очередь вариационная делится на структурную и аналитическую. Структурная группировка предполагает расчет удельного веса каждой группы. Пример: на предприятии 80% - рабочие, 20% - служащие, из них 5% - руководители, 3% - служащие,12% - специалисты. Цель аналитической группировки – выявить взаимосвязь между признаками: стажем работы и средним заработком, стажем и выработкой и другими.

При проведении группировки необходимо:

Проведение всестороннего анализа природы изучаемого явления;

Выявление группировочного признака (одного или нескольких);

Установить границы групп таким образом, чтобы группы существенно отличались друг от друга, и в каждой группе объединялись однородные элементы.

По степени сложности группировки могут быть простые и комбинационные (по признакам).

По исходной информации различают первичную и вторичную группировки, первичная осуществляется на основе исходных данных наблюдения, вторичная использует данные первичной группировки.

Количество групп определяется по формуле Стерджесса:

где n - количество групп, N – генеральная совокупность.

Если используются равные интервалы, то величина интервала равна .

Интервалы могут быть равные и неравные. Последние, в свою очередь, делятся на изменяющиеся по закону арифметической или геометрической прогрессии. Первый и последний интервалы могут быть открытые или закрытые. Закрытые интервалы включают или не включают границы интервала.

Если интервалы закрытые, и ничего не сказано о включении верхних границ, то считаем, что верхние границы включены.

Если интервалы открытые, то ориентируемся по последнему интервалу.

Признак в этих интервалах может измеряться дискретно и непрерывно (т.е. дробиться). При непрерывном признаке границы смыкаются 1- 10, 10 - 20, 20 – 30; если признак изменяется дискретно, то можно использовать следующую запись: 1 – 10, 11 – 20, 21 – 30.

Если интервалы открытые, то величина последнего интервала приравнивается к предыдущему, а первого - ко второму.

Классификация – группировка по качественному признаку. Она относительно устойчива, стандартизирована и утверждается органами государственной статистики.


3.2. Ряды распределения: виды и основные характеристики

Под рядом распределения понимается ряд данных, характеризующих какое-либо социально-экономическое явление по одному признаку. Это простейший вид группировки по двум признакам.

Ряды распределения делятся на качественные и количественные, на ранжированные и не ранжированные, на сгруппированные и не сгруппированные, с дискретным и непрерывным распределением признака.

Примером не сгруппированного, не ранжированного ряда по заработной плате является ведомость заработной платы. В то же время, список работников может быть ранжированный по алфавиту или по табельным номерам. Примером ранжированного ряда является список команд, рейтинг теннисистов.

Ранжированный ряд распределения - ряд данных, расположенных в порядке убывания или возрастания признака.

Для сгруппированных ранжированных рядов выделяют следующие характеристики: варианту, частоту или частость, кумуляту и плотность распределения.

Варианта () – среднее интервальное значение признака. Т.к. при создании группировки должен выполняться принцип равномерного распределения признака в каждом интервале, то варианту можно рассчитывать как полусумму границ интервалов.

Частота () показывает сколько раз встречается данное значение признака. Относительное выражение частоты представляет собой частость (.) , т.е. долю, удельный вес от суммы частот.

Кумулята () – накопленная частота или частость, расчет нарастающим итогом. Кумулятивно подсчитываются объем, затраты, доходы, т.е. результаты деятельности.

Таблица 1

Группировка действующих кредитных организаций
по величине зарегистрированного уставного капитала

в 2008 году в РФ

Ранжирование – процедура упорядочивания любых объектов по возрастанию или убыванию некоторого их свойства при условии, что они этим свойством обладают.

Можно ранжировать:

Государство по уровню жизни, рождаемости, безработице;

Профессии по престижности;

Товары по предпочтению потребителей;

Респондентов по политической активности, материальному положению;

Объектами ранжирования являются те объекты, которые непосредственно упорядочиваются. Основание ранжирование (ранжирующий признак) – то свойство, по которому объекты упорядочиваются. В результате ранжирования получаем ранжированный ряд, в котором каждому объекту приписывается свой индивидуальный ранг – место объекта в ранжированном ряду. Число мест и, соответственно, число рангов в ранжированном ряду равняется числу объектов.

Виды ранжированных рядов:

1) каждый объект имеет значение признака, отличное от значений признака других объектов, тогда каждому объекту ранжированного ряда присваивается свой, отличный от другого объекта, ранг;

2) несколько объектов имеют одинаковое значение признака, тогда этим объектам в ранжированном ряду присваивается одинаковые ранги, рассчитанные по определенной формуле. В этом случае ранжированный ряд называется ранжированным рядом со связанными рангами. При решении задач первый ранг будем присваивать наибольшему значению признака. Связанный ранг рассчитывается как среднее значение мест, занимаемых объектами, имеющими одинаковое значение признака. Установление статистической связи для 2-х и более ранжированных рядов осуществляется с помощью ранговых коэффициентов связи – такие коэффициенты, которые позволяют вычислять степень согласованности в ранжировании одних и тех же объектов по двум различным основаниям (признакам). Наиболее распространенным коэффициентом ранговой связи (ранговой корреляции) является коэффициент ρ-Спирмена.

Допустим, что н объектов упорядочены по признаку х и по признаку у. Пусть

Мера несовпадений рангов i-того объекта: d i = R x i - R y i

Свойства:

Изменяется в интервале от -1 до 1;

Ро = 1, если наблюдается полная согласованность ранжированных рядов; ранги одного и того же объекта по двум признакам совпадают.

Ро = -1, если полная несогласованность ранжированных рядов; такая ситуация возникает, если ранговые ряды имеют обратное направление: R x i – 1 2 3 4 5; R y i – 5 4 3 2 1.

Замечание: может рассчитываться для двух видов равных (если каждый объект свой ранг и если имеются связанные ранги).

Проверка гипотезы о статистической значимости коэффициента ρ-Спирмена.

H 0: ρ гс = 0

H 1: ρ гс ≠ 0

Нулевая гипотеза всегда утверждает, что ρ равен 0. Альтернативная – что значение ρ отлично от 0.

Уровень значимости как в таблицах сопряженности.

Государство А Б В Г Д Е Ж З И
Качество жизни 6,8 7,0 6,5 5,9 4,6 5,7 4,5 5,8 4,0
Безработица 20,3 18,0 19,8 23,4 21,6 20,8
Ранг x
Ранг y
|d i |
d 2 i
Σ d 2 i

τ -Кендалла – разность между вероятностями правильного и неправильного порядка для двух наблюдений, извлечённых из совокупности случайно при условии, что связанные ранги отсутствуют. Свойства:

Изменяется от -1 до 1;

Если признаки х и у статистически независимы, то коэффициент τ обращается в 0; если τ равен 0, еще не значит, что признаки статистически независимы;

Если τ равен 1, это значит, что между признаками имеется полная прямая статистическая связь или ранжированные ряды полностью согласованы; если τ равно -1, это значит, что присутствует полная обратная статистическая связь, или ранжированные ряды являются несогласованными.

S – общее число пар объектов с согласованным правильным порядком по обоим объектам. D – общее число пар объектов с несогласованным неправильным порядком по обоим объектам.

Проверка гипотезы о статистической значимости коэффициента τ:

H 0: τ гс = 0

H 1: τ гс ≠ 0

Коэффициент τ является статистически значимым, если его значения для ГС отлично от 0.

|Z H | > Z кр => H 1

Если ранжированный ряд построим для малого числа объектов, то подтверждение нулевой гипотезы нам говорит о том, что нужно изучить большее количество объектов.

Если изучено достаточное количество объектов, то подтверждение нулевой гипотезы говорит о том, что связь между признаками отсутствует.

Множественный коэффициент ранговой связи

Применяется в тех случаях, когда необходимо измерить связь между более чем 2 ранжированными рядами (например, когда мы хотим оценить согласованность мнений экспертов (более 2) при оценке 1 и тех же объектов).

S – сумма квадратичных отклонений значений рангов по строке от среднего ранга для всей совокупности. k 2 – число переменных (число экспертов). n – число ранжируемых объектов.

Похожие публикации