Инфоурок Другое Другие методич. материалыМетодическое пособие по дисциплине ОП. 03 Статистика для специальности 21.02.05

Методическое пособие по дисциплине ОП. 03 Статистика для специальности 21.02.05

Скачать материал

Частное профессиональное образовательное учреждение

Тюменского областного союза потребительских обществ

«Тюменский колледж экономики, управления и права»

 

 

Методическое пособие

по дисциплине ОП. 03 Статистика

учебно-методическое пособие для студентов

 

 

для студентов специальности  21.02.05 Земельно-имущественные отношения

очной формы обучения

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Тюмень, 2017


Аннотация

 

Методические указания по выполнению практических работ по дисциплине ОП. 03 Статистика специальности 21.02.05 Земельно-имущественные отношения предназначены для студентов всех форм обучения.

Методические указания составлены в соответствии с рабочей программой дисциплины ОП. 03 Статистика, включают содержание всех тем дисциплины, методические указания к выполнению практических работ и внеаудиторной самостоятельной работы, список рекомендованной литературы.

 


 

Содержание

 

Введение

 

1.      Тема 1. Предмет, метод и задачи статистики

1.1. Практическое занятие. Статистическая наука, её предмет и метод.

1.2.Внеаудиторная самостоятельная работа

 

2.      Тема 2. Статистическое наблюдение

2.1.Практическое занятие. План статистического наблюдения

2.2.Внеаудиторная самостоятельная работа

 

3.      Тема 3. Статистическая сводка и группировка

3.1.Практическое занятие. Сводка и группировка статистических данных

3.2.Внеаудиторная самостоятельная работа

 

4.      Тема 4. Графическое представление статистической информации

4.1.Практическое занятие. Табличное и графическое представление статистических данных

4.2.Внеаудиторная самостоятельная работа.

 

5.      Тема 5. Абсолютные, относительные и средние статистические показатели

5.1. Практическое занятие. Абсолютные, относительные и средние статистические данные

5.2. Внеаудиторная самостоятельная работа

 

6.      Тема 6. Показатели вариации

6.1.Практическое занятие. Общее понятие о показателях вариации и способы их расчёта

6.2.Внеаудиторная самостоятельная работа

 

7.      Тема 7. Выборочное наблюдение

7.1.Практическое занятие. Выборочное наблюдение

7.2.Внеаудиторная самостоятельная работа

 

8.      Тема 8. Статистические методы изучения взаимосвязей социально-экономических явлений

8.1.Практическое занятие. Корреляционная связь признаков

8.2.Внеаудиторная самостоятельная работа

 

9.      Контрольные вопросы по темам

 

Список использованной литературы

 

 

 

 

 

 


Введение

Учебная дисциплина «Статистика» является общепрофессиональным  компонентом в подготовке дипломированных специалистов по земельно-имущественным отношениям. Основное назначение данной дисциплины состоит в повышении экономико-математической подготовки студентов в области современных методов сбора, обработки и анализа статистической информации, достижении высокого и устойчивого уровня профессионализма. Современный специалист должен обладать глубокими знаниями, уметь проводить количественный анализ сложных экономических проблем, применять математические расчеты в решении экономических задач. Поэтому изучение данной дисциплины поможет сформировать у студентов целостный взгляд на место и роль статистической науки в современной экономике.

В результате освоения учебной дисциплины обучающийся должен уметь:

- собирать и регистрировать статистическую информацию;

- проводить первичную обработку и контроль материалов наблюдения;

- выполнять расчёты статистических показателей и формулировать основные выводы;

- осуществлять комплексный анализ изучаемых социально-экономических явлений и процессов, в том числе с использованием средств вычислительной техники;

В результате освоения учебной дисциплины обучающийся должен знать:

- предмет, метод и задачи статистики;

- общие основы статистической науки;

- принципы организации государственной статистики;

- современные тенденции развития статистического учёта;

- основные способы сбора, обработки анализа и наглядного представления информации;

- основные формы и виды действующей статистической отчётности;

- технику расчёта статистических показателей, характеризующих социально-экономические явления.

Результатом освоения программы учебной дисциплины ОП.03.Статистика является овладение обучающимися общими (ОК) и профессиональными (ПК) компетенциями

ОК 1. Понимать сущность и социальную значимость своей будущей профессии, проявлять к ней устойчивый интерес

ОК 2. Анализировать социально-экономические и политические проблемы и процессы, использовать методы гуманитарно-социологических наук в различных видах профессиональной и социальной деятельности.

ОК 3. Организовывать свою собственную деятельность, определять методы и способы выполнения профессиональных задач, оценивать их эффективность и качество.

ОК 4. Решать проблемы, оценивать риски и принимать решения в нестандартных ситуациях.

 ОК 5. Осуществлять поиск, анализ и оценку информации, необходимой для постановки и решения профессиональных задач, профессионального и личностного развития.

ПК 1.5. Осуществлять мониторинг земель территории.

ПК 2.4.Осуществлять кадастровый и технический учет объектов недвижимости

ПК 4.1.Осуществлять сбор и обработку необходимой и достаточной информации об объекте оценки и аналогичных объектах.

ПК 4.5. Классифицировать здания и сооружения в соответствии с требованиями нормативных актов, регулирующих правоотношения в этой области

Согласно учебному плану по дисциплине ОП. 03 Статистика максимальной учебной нагрузки обучающегося 60 часов, в том числе: обязательной аудиторной учебной нагрузки обучающегося 40 часа; самостоятельной работы обучающегося 20 часов.


Тема 1. Предмет, метод и задачи статистики

 

Методические указания

 

Термин статистика имеет несколько значений. Во-первых, под статистикой понимают отрасль практической деятельности по сбору, обработке, анализу и публикации статистической информации как в целом по стране, так и по отдельным ее регионам. Такая деятельность, с определенными различиями в используемой методологии, осуществляется во всех странах. В России эта работа выполняется Федеральной службой государственной статистики (старое название организации - Государственный комитет Российской Федерации по статистике).

Статистикой также часто называют и сам результат статистической деятельности, т.е. массив статистических данных или обобщающие показатели, характеризующие состояние массовых явлений и процессов по той или иной совокупности за определенный период. Потребителями статистической информации являются органы государственного управления, научные организации, информационные агентства, аналитические службы компаний и банков, физические лица. В последние годы стремительно повышается значение статистической информации в маркетинговых исследованиях.

Статистика как наука начала формироваться в VII веке в ответ на потребность государства располагать достоверными статистическими данными об имеющихся ресурсах для эффективного управления, организации производства, торговли, налогообложения и т.п. В настоящее время статистика - это наука, включающая разветвленную систему научных дисциплин, изучающих количественную сторону массовых явлений и процессов в неразрывной связи с их качественной стороной.

Изучаемые статистикой явления и процессы многообразны. В первую очередь, статистика изучает все, что связано с экономической деятельностью общества - производство и реализация промышленной и сельскохозяйственной продукции, строительство новых объектов и реконструкция действующих основных фондов, работа транспорта и связи, формирование и движение финансовых потоков. Статистические методы широко используются в анализе социальных процессов и явлений - занятости и безработицы, доходов населения, изучении общественного мнения и т.д. Большую роль играет статистика в технике и производственной деятельности, например, в организации контроля качества продукции. Методы статистики применяются в экономическом анализе, менеджменте, маркетинге, бизнес-планировании, логистике, оценке недвижимости, антикризисном управлении и в других областях научной и практической деятельности.

Рассмотрим отраслевую структуру статистики как науки.

Теория статистики (общая теория статистики) - отрасль статистической науки,

рассматривающая ее общие понятия, категории, принципы и методы сбора, обработки и анализа данных. Теорией статистики разрабатываются общие показатели и методы изучения структуры, взаимосвязи и динамики изучаемых процессов и явлений. Использование этих показателей и методов в отдельных областях научной и практической деятельности наполняет их качественным содержанием, а в ряде случаев – придает им определенную специфику.

Экономическая (макроэкономическая) статистика изучает количественные закономерности происходящих в экономике явлений и процессов, выявление основных пропорций и тенденций экономического развития на макроуровне, т.е. на уровне крупного региона или страны в целом. Экономическая статистика изучает как сам процесс воспроизводства материальных благ и услуг, так и его результаты, а также их воздействие на уровень жизни населения. К основным показателям экономической статистики относятся валовой внутренний продукт, валовой региональный продукт, такие элементы национального богатства, как основные фонды, материальные и оборотные средства, домашнее имущество.

В соответствии с классификацией отраслей экономики в статистической науке и практике также выделяется отраслевой уровень. К отраслевым статистикам относятся:

• статистика промышленности;

• статистика сельского хозяйства;

• статистика капитального строительства;

• статистика услуг, транспорта и связи;

• статистика торговли.

Статистика населения изучает численный и национальный состав, а также возрастно-половую структуру населения, его размещение и воспроизводство как по стране в целом, так и в разрезе территориальных единиц. Одной из основных задач статистики населения является построение краткосрочных и долгосрочных демографических прогнозов.

Социальная статистика изучает социальную структуру населения, его уровень жизни и, в частности, доходы, а также уровень образования и культуры, состояния здоровья и медицинского обслуживания, использование свободного времени, общественное мнение, уровень преступности и другие социальные аспекты жизнедеятельности общества.   

Для того, чтобы получить общее представление о статистической методологии, необходимо рассмотреть сам прогресс статистического исследования, который включает четыре основных этапа:

Процесс статистического исследования начинается с этапа сбора первичного статистического материала, проверки его полноты и достоверности. С этой целью применяются методы сплошного и несплошного статистического наблюдения. От качества полученных исходных статистических данных во многом зависят окончательные результаты всего статистического исследования.

На втором этапе производится предварительная обработка данных, подсчет групповых и общих итогов, расчет некоторых относительных показателей. Основной метод, используемый на данном этапе - метод группировок. В результате его реализации от больших массивов статистических данных осуществляется переход к компактным и удобным для анализа статистическим таблицам.

Третий этап - расчет и интерпретация обобщающих статистических показателей. На данном этапе рассчитываются показатели среднего уровня и вариации, структуры, взаимосвязи и динамики изучаемых процессов и явлений. Полученные результаты подвергаются анализу.

В процессе реализации четвертого этапа осуществляется моделирование взаимосвязей между социально-экономическими процессами и явлениями, строятся уравнения регрессии, а также трендовые модели, отражающие основные тенденции динамики изучаемых показателей.

Используемые в процессе реализации всех этапов статистические приемы и методы в целом составляют статистическую методологию исследования.

 

Практическое занятие №1

Статистическая наука, ее предмет и метод (2 часа).

 

Задание 1.1. Письменно ответить на вопросы

1.1. Назовите в качестве примера сферы общественной жизни, изучаемые статистикой.

1.2. Сформулируйте определение статистики как науки и дайте ему соответствующее обоснование.

1.3. Дайте характеристику основным чертам определения предмета статистики:

а) почему статистика является общественной наукой?

б) почему статистика изучает количественную сторону общественных явлений в связи с их качественным содержанием?

в) почему статистика изучает массовые явления?

г) почему каждое статистическое исследование должно опираться на изучение всех относящихся к данному вопросу фактов?

1.4. К каким видам (количественным или атрибутивным) относятся следующие признаки:

а) количество работников на фирме;

б) родственные связи членов семьи;

в) пол и возраст человека;

г) социальное положение вкладчика в Сбербанк;

д) этажность жилых помещений;

е) количество детей в семье;

ж) розничный товарооборот торговых объединений.

1.5. Укажите, какие совокупности можно выделить в высшем учебном заведении для статистического изучения?

1.6. Укажите, какие можно выделить статистические совокупности кредитных учреждений; сферы потребительского рынка; крестьянских хозяйств.

1.7. Какими количественными и атрибутивными признаками можно охарактеризовать совокупность студентов вуза?

1.8. Исследуется совокупность коммерческих банков Москвы. Какими количественными и качественными признаками можно ее охарактеризовать?

1.9. Назовите наиболее существенные варьирующие признаки, характеризующие студенческую группу.

1.10. Назовите основные факторные признаки, определяющие вариацию успеваемости студентов.

1.11. Какими показателями можно охарактеризовать совокупность жителей города?

1.12. Приведите перечень показателей, которыми можно было бы при статистическом обследовании полно охарактеризовать следующие явления:

а) население;

б) потребительский рынок;

в) промышленность;

г) транспорт и связь.

Для этой цели используйте ежемесячный журнал Госкомстата России «Статистическое обозрение» или статистические ежегодники Госкомстата России.

1.13. Назовите варьирующие и неварьирующие признаки у людей, фермерских хозяйств.

1.14. Найдите соответствующие данные и сравните половой состав населения России по данным переписей населения 1970, 1979 и 1989 гг. Какие выводы на основании этого сравнения можно сделать о половой структуре населения России и тенденциях ее изменения?

1.15. Какими признаками – прерывными или непрерывными – являются:

а) численность населения страны;

б) количество браков и разводов;

в) производство продукции легкой промышленности в стоимостном выражении;

г) капитальные вложения в стоимостном выражении;

д) процент выполнения плана реализованной продукции;

е) число посадочных мест в самолете;

ж) урожайность зерновых культур в центнерах с 1 га.

1.16. К каким видам (качественным или количественным) относятся следующие признаки:

а) тарифный разряд рабочего;

б) балл успеваемости;

в) форма собственности;

г) вид школы (начальная, неполная средняя и т.д.);

д) национальность;

е) состояние в браке.

1.17. Найдите в статистическом сборнике Госкомстата России и выпишите статистические показатели по нескольким качественным и количественным признакам.

1.18. Из того же сборника (см. задание 1.17) выпишите данные по нескольким прерывным и непрерывным количественным признакам.

1.19. Используя статистические сборники, выпишите данные, характеризующие структуру:

а) поголовья скота по категориям хозяйств;

б) использования денежных доходов населения;

в) производственных инвестиций по отраслям экономики.

1.20. По статистическим сборникам Госкомстата России выпишите данные, характеризующие динамику за четыре-пять лет:

а) численности населения;

б) производства отдельных видов продовольственных товаров;

в) экспорта и импорта;

г) курса доллара США и индекса потребительских цен на товары и платные услуги.

1.21. Назовите, какие понятия, категории и методы излагаются в отрасли статистической науки – общей теории статистики.

1.22. Назовите, что изучает экономическая статистика. Какие отрасли экономической статистики вы знаете?

1.23. Укажите, чем объясняется разделение статистической науки на отдельные отрасли и почему изучение статистической науки начинается с общей теории статистики?

1.24. Перечислите специфические методы, присущие статистическому исследованию.

1.25. Какие вы знаете статистические сборники, издающиеся в России?

 

Внеаудиторная самостоятельная работа  (2 часа)

 

Задание. Составить кроссворд по данной теме

 

Тема 2. Статистическое наблюдение

 

Методические указания

Статистическое исследование начинается со сбора статистической информации, характеризующей изучаемые социально-экономические явления и процессы. Данный этап называется статистическим наблюдением.

Статистическое наблюдение — это массовое, планомерное, научно организованное наблюдение за социально-экономическими явлениями и процессами, заключающееся в регистрации необходимых признаков у каждой единицы изучаемой совокупности. Например, при переписи населения по каждому жителю страны регистрируются сведения о поле, возрасте, семейном положении, образовании и др.

Статистическое наблюдение, как правило, носит массовый характер. Это проявляется в том, что при проведении наблюдения необходимо получить данные от максимально возможного числа изучаемых единиц совокупности. Массовый охват совокупности позволяет получать наиболее точные данные, характеризующие изучаемое социально-экономическое явление, выявить имеющиеся закономерности и взаимосвязи.

Планомерность проведения статистического наблюдения заключается в том, что любое исследование проводится по заранее разработанному плану, который включает в себя ряд вопросов, касающихся подготовительных работ, непосредственного сбора необходимой информации и обработки полученных данных.

Принцип научной организации лежит в основе любого этапа статистического исследования и заключается в комплексном применении статистической методологии сбора и обработки данных.

Основная цель статистического наблюдения - это сбор статистической информации о социально-экономических явлениях и процессах для получения обобщающих характеристик.

На современном этапе в статистике существует две основные формы статистического наблюдения:

- отчетность;

- специально организованное статистическое наблюдение;

- регистры;

Отчетность - это способ получения статистической информации от юридических лиц. Отчетность представляет собой специально разработанные формы, включающие в себя те признаки, которые подлежат регистрации. Формы статистической отчетности разрабатываются и утвержденные органами государственной статистики РФ. Одна из форм статистической отчетности представлена в приложении 1. Любое юридическое лицо, являющееся субъектом экономики РФ, обязано предоставлять отчетность органам государственной статистики по месту своей регистрации по установленным отчетным формам и в установленные сроки.

В период формирования рыночной экономики особое место в системе сбора статистической информации стали занимать специально организованные статистические наблюдения, которые проводятся для получения каких-либо данных, не содержащихся в предоставляемой отчетности или которые необходимы для проверки или уточнения данных, содержащихся в отчетах.

Особо следует выделить такой вид специально организованного наблюдения, как перепись.

Перепись - это специально проводимые широкомасштабные работы по сбору необходимой статистической информации об изучаемых объектах в границах отрасли, региона или страны в целом. Так, например, ранее упоминались переписи населения, которые проводятся примерно один раз в 10 лет и направлены на получение необходимой информации о населении страны. Примером также могут служить переписи крупного рогатого скота, которые проводятся в конце календарного года и позволяют получить информацию о численности и структуре поголовья крупного рогатого скота у сельхозпроизводителей. Органами статистики также проводятся переписи многолетних насаждений, жилого фонда, незавершенного строительства и пр.

Кроме переписей, к специально организованному наблюдению также относятся и другие единовременные работы по сбору необходимой статистической информации, в частности, в рамках социологических или маркетинговых исследований.

Регистровое наблюдение представляет собой постоянный мониторинг состояния и развития наблюдаемых единиц, заключающийся в первичном размещении и своевременной актуализации информации в ведущейся базе данных. В статистической практике ряда стран находят применение регистры населения, т.е. постоянно актуализируемые списки жителей страны с указанием их основных социально-демографических признаков, а также регистры предприятий, содержащие информацию организационно-правового и экономического характера.

По охвату единиц совокупности наблюдение бывает двух видов: сплошное и несплошное.

При сплошном наблюдении обследованию подвергаются все единицы изучаемой совокупности. При этом в силу действия ряда факторов возможен незначительный процент неохвата единиц изучаемой совокупности. Примером сплошного наблюдения могут служить переписи населения.

При несплошном наблюдении обследованию подвергается только часть единиц изучаемой совокупности. При этом охватываемая наблюдением часть определяется заранее, т.е. неудавшееся сплошное наблюдение нельзя рассматривать как наблюдение несплошное. Принято выделять следующие виды несплошного статистического наблюдения: выборочное, метод основного массива, монографическое обследование.

Выборочным называют наблюдение, основанное на принципе случайного отбора тех единиц изучаемой совокупности, которые должны быть подвергнуты наблюдению. Выборочное наблюдение, при правильной его организации и проведении, дает достаточно достоверные данные для характеристики изучаемой совокупности в целом. Во многих случаях им вполне можно заменить сплошной учет. При этом обеспечивается значительная экономия средств, затрачиваемых на сбор и обработку данных.

Монографическое обследование представляет собой детальное, глубокое изучение и описание отдельных, характерных в каком-либо отношении единиц совокупности, как правило, по расширенной программе. Монографическое исследование проводится с целью выявления имеющихся или намечающихся тенденций в развитии явления, для выявления имеющихся резервов, оценки результатов экономических экспериментов.

Метод основного массива заключается в том, что обследованию подвергаются наиболее крупные единицы, которые вместе взятые имеют преобладающий удельный вес в совокупности по основному для данного исследования признаку. Например, в ряде отраслей подавляющий объем выпуска продукции приходится на крупные и средние предприятия, поэтому результаты деятельности малых предприятий в этих отраслях   практически не отражаются на обобщающих статистических показателях.

По срокам регистрации наблюдение может быть непрерывным (текущим) и прерывным.

Непрерывным называют такое наблюдение, которое ведется постоянно, и регистрация фактов производится по мере их свершения. Так, например, осуществляется регистрация рождений, заключенных браков и т.п. в органах ЗАГС.

Прерывное наблюдение проводится не постоянно, время от времени. При этом прерывное наблюдение бывает двух видов: периодическое и единовременное. Периодическое — это наблюдение, которое повторяется через определенные, равные промежутки времени. В качестве примера можно выделить ежегодное предоставление отчетности в органы государственной статистики.

Единовременным называется такое наблюдение, которое проводится по мере необходимости, без соблюдения строгой периодичности или вообще проводится один раз и больше не повторяется. Таковым наблюдением являлась перепись многолетних насаждений, проведенная в прошлом веке.

По источнику сведений различают непосредственное наблюдение, документальное наблюдение и опрос.

Непосредственным называют такое наблюдение, при котором сами регистраторы путем непосредственного замера, взвешивания или подсчета устанавливают значение признака и на этом основании производят запись в формуляре наблюдения. Этим способом проводится инвентаризации основных средств на предприятиях.

Документальное наблюдение предполагает запись ответов на вопросы формуляра на основании соответствующих документов. Примером такого наблюдения является сбор данных об успеваемости студентов вуза на основе зачетно-экзаменационных ведомостей, заполнение форм статистической отчетности на основании данных бухгалтерского учета и т.п.

Опрос — это наблюдение, при котором ответы на вопросы формуляра записываются со слов опрашиваемого (респондента). Этим способом проводятся переписи населения, опросы общественного мнения.

В статистике применяются следующие способы сбора сведений:

-    отчетный,

-    экспедиционный,

-    самоисчисление,

-    анкетный,

-    корреспондентский.

Сущность отчетного способа заключается, как уже отмечалось выше, в обязательном представлении хозяйствующими субъектами статистических отчетов о своей деятельности в установленной форме и в установленные сроки.

Экспедиционный способ наблюдения заключается в том, что специально привлеченные и обученные работники посещают каждую единицу наблюдения и сами заполняют формуляр наблюдения. Этим способом собираются сведения при переписях населения.

При способе самоисчислсния формуляры заполняют сами опрашиваемые. Обязанность специально привлеченных для получения информации сотрудников состоит в раздаче формуляров опрашиваемым, инструктаже их, сборе заполненных формуляров и проверке правильности их заполнения.

Анкетный способ — это сбор статистических данных с помощью специальных вопросников, рассылаемых определенному кругу лиц или публикуемых в периодической печати. Как правило, этим способом получения информации пользуются при проведении социологических опросов и также многие крупные производители бытовой техники, мебели и других предметов потребления. Анкеты вкладываются в упаковку товара с просьбой заполнить и вернуть производителю по указанному адресу.

Сущность корреспондентского способа наблюдения заключается в том, что статистические органы договариваются с определенными лицами, которые берут на себя обязательство вести наблюдение за какими-либо явлениями, процессами и в установлении сроки сообщать результаты наблюдений статистическим органам. Таким способом изучаются бюджеты отдельных домохозяйств, цель которых - получение статистической ин формации о доходах и расходах населения.

Практическое занятие №2

План статистического наблюдения (2 часа).

 

Задание 2.1. Необходимо изучить методические указания и самостоятельно провести статистическое наблюдение (тема по выбору студента). Результаты представить в виде плана статистического наблюдения.

 

Методические указания

 

План статистического наблюдения состоит из двух частей, первая включает программно-методологические вопросы, а вторая организационные вопросы.

Программно-методологическая часть плана включает:

- определение объекта наблюдения;

- определение единицы объекта наблюдения;

- составление программы статического наблюдения;

- составление программы разработки материалов наблюдения;

- проектирование формуляра наблюдения;

- определение времени проведения статистического наблюдения и его критического момента;

- составление инструкции.

При планировании статистического наблюдения необходимо, прежде всего, определить его объект и единицу.

Объектом статистического наблюдения называется та совокупность, о которой должны быть собраны нужные сведения. Объектами наблюдения могут быть, например, коммерческие банки, сельхозпроизводители, промышленные предприятия, студенты, население и т.п.

Единицей наблюдения называют составной элемент объекта наблюдения, являющийся носителем признаков, подлежащих регистрации. Единицей наблюдения может быть человек, фермерское хозяйство, коммерческий банк.

Программа наблюдения - это перечень признаков, подлежащих регистрации при проведении статистического наблюдения. К программе наблюдения предъявляется ряд требований, которым она должна удовлетворять, а именно:

а)   программа должна включать только существенные признаки, характеризующие изучаемый объект;

б)   в программу не следует включать второстепенные вопросы, которые могут затруднить работу по сбору информации, а в дальнейшем ее обработку и анализ;

в)   разрабатывая программу, необходимо стремиться к полноте собираемых сведений;

г)   в программу наблюдения должны включаться только такие вопросы, на которые действительно можно получить объективные и достаточно точные ответы;

д)   в программу иногда следует включать вопросы контрольного характера, служащие целям проверки и уточнения собираемых сведений.

Вопросы программы могут дополняться статистическим подсказом, т.е. вариантами ответов. Подсказ может быть закрытым или открытым. Закрытый подсказ подразумевает ряд ответов, из которых респондент должен выбрать один или несколько" При открытом подсказе респондент может выбрать один или несколько ответов из предлагаемого перечня или сформулировать на специально выделенном поле формуляра свой собственный ответ.

При планировании обследования, как правило, составляют и программу разработки собранных материалов, которая конкретизирует задачи статистического наблюдения, показывает, какие данные необходимо собирать и в каком виде оформлять результаты их обработки.

Для записи ответов на вопросы программы конструируется формуляр наблюдения. Формуляр наблюдения разрабатывается специально для записи ответов на вопросы программы и представляет собой особым образом разграфленный лист (листы) бумаги, в котором содержится перечень вопросов программы, свободные места для записи ответов на них, а также для записи шифров (кодов) ответов. Особое внимание при разработке формуляра следует уделить формулировке вопросов. Они должны быть сформулированы кратко и четко, не должны вызывать разночтения. Помимо вопросов программы формуляр включает в себя титульную и адресную части. В титульной части содержится наименование статистического наблюдения, указывается наименование органа, проводящего наблюдение, кем и когда утвержден этот формуляр, иногда и номер, присвоенный ему в обшей системе формуляров наблюдений, осуществляемых данным органом статистики. В адресной части предусматривается запись точного адреса единицы или совокупности единиц наблюдения и ряд других сведений.

Однако насколько четко не был бы составлен формуляр, к нему обычно составляется инструкция, которая включает совокупность разъяснений и указаний, главным образом по программе статистического наблюдения. Инструкция может быть представлена в виде отдельного документа (часто – брошюры) или, изложена на формуляре наблюдения. Инструкцию следует писать кратко, просто, пояснения и указания должны быть ясными и четкими.

При организации статистического наблюдения необходимо решить вопрос о времени проведения данного наблюдения, включая выбор сезона, установления срока (периода) наблюдения, а в некоторых случаях и так называемого критического момента.

Период наблюдения — это время, в течение которого осуществляется регистрация признаков у единиц наблюдения по установленной программе. Продолжительность периода наблюдения зависит от многих факторов, среди которых можно выделить: размер и состояние объекта наблюдения, объем и сложность программы наблюдения.

Для наиболее подвижных объектов изучения, таких как население, например, устанавливается критический момент статистического наблюдения. Критическим моментом называется момент времени, по состоянию на который производится регистрация собираемых сведений. На практике критический момент назначается на начало периода наблюдения.

В целях успешного проведения наблюдения разрабатываются организационные вопросы плана статистического наблюдения, которые фиксируются в организационном плане. Организационный план предполагает решение следующих вопросов:

-    объект наблюдения (дается его определение, описание, указываются отличительные признаки);

-    цели и задачи наблюдения;

-    орган наблюдения, осуществляющий подготовку и проведение наблюдения;

-    место и сроки наблюдения;

-    подготовительные работы к наблюдению включающие в себя подбор и обучение кадров, составление списков единиц изучаемой совокупности, в некоторых случаях эти работы включают рекламную компанию проводимого наблюдения и т.д.;

-    порядок проведения наблюдения;

-    порядок приема и сдачи материалов наблюдения и представления предварительных и окончательных итогов наблюдения;

-    финансирование и материально-техническое обеспечение работ.

 

Внеаудиторная самостоятельная работа  (2 часа)

 

Задание. Представить материал темы №2 в таблицах и графиках.

 

Тема 3. Статистическая сводка и группировка

 

Методические указания

 

3.1. Задачи сводки и се содержание

Важнейшим этапом исследования социально-экономических явлений и процессов является систематизация первичных данных и получение на этой основе сводной характеристики всего объекта при помощи обобщающих показателей, что достигается путем сводки и группировки первичного статистического материала.

Сводка - это научная обработка первичных данных с целью получения обобщенных характеристик изучаемого социально-экономического явления по ряду существенных для него признаков с целью выявления типичных черт и закономерностей, присущих изучаемому явлению в целом.

По глубине и точности обработки материала различают сводку простую и сложную.

Простая сводка - это операция по подсчету общих итогов по совокупности единиц наблюдения и оформление этого материала в статистических таблицах.

Сложная сводка - это комплекс последовательных операций, включающих группировку полученных при наблюдении материалов, составление системы показателей для характеристики типичных групп и подгрупп изучаемой совокупности явлений, подсчет числа единиц и итогов по каждой группе и подгруппе, и по всему объекту и представление результатов в виде статистических таблиц.

Проведение сводки включает следующие этапы:

-    выбор группировочного признака;

-    определение порядка формирования групп;

-    разработка системы статистических показателей для характеристики групп и объекта в целом;

-    разработка макетов статистических таблиц для представления результатов сводки.

По форме обработки материала сводка бывает:

-    централизованная, когда весь первичный материал поступает в одну организацию, подвергается в ней обработке от начала до конца;

-    децентрализованная, когда отчеты предприятий сводятся статистическими органами субъектов РФ, а полученные итоги поступают в Госкомстат РФ и там определяются итоговые показатели в целом по народному хозяйству страны.

 

3.2. Виды статистических группировок

Группировкой называется разбиение общей совокупности единиц объекта наблюдения по одному или нескольким существенным признакам на однородные группы, различающиеся между собой в количественном и качественном отношении и позволяющие выделить социально-экономические типы, изучить структуру совокупности и проанализировать связи между отдельными признаками. Группировки являются важнейшим статистическим методом обобщения статистических данных, основой для правильного исчисления статистических показателей.

С помощью метода группировок решаются следующие задачи:

•   выделение социально-экономических типов явлений;

•   изучение структуры явления и структурных сдвигов, происходящих в нем;

•   выявление взаимосвязи и взаимозависимости между явлениями.

В соответствии с познавательными задачами, решаемыми в ходе построения статистических группировок, различают следующие их виды: типологические, структурные, аналитические.

Типологическая группировка - это разбиение разнородной совокупности единиц наблюдения на отдельные качественно однородные группы и выявление на этой основе социально-экономических типов явлений. При построении группировки этого вида основное внимание должно быть уделено идентификации типов и выбору группировочного признака. Решение вопроса об основании группировки должно осуществляться на основе анализа сущности изучаемого социально-экономического явления.

Структурной называется группировка, которая предназначена для изучения состава однородной совокупности по какому-либо варьирующему признаку, а также структуры и структурных сдвигов, происходящих в нем.

Группировка, выявляющая взаимосвязи между изучаемыми явлениями и признаками, их характеризующими, называется аналитической группировкой.

В статистике при изучении связей социально-экономических явлений признаки необходимо делить на факторные и результативные.

Факторными называются признаки, под воздействием которых изменяются другие результативные признаки. Взаимосвязь проявляется в том, что с возрастанием или убыванием значения факторного признака систематически возрастает или убывает значение признака результативного и наоборот.

Особенностями построения аналитической группировки являются:

•    единицы статистической совокупности группируются по факторному признаку;

•    каждая выделенная группа характеризуется средними величинами результативного признака.

По способу построения группировки бывают простые и комбинационные.

Простой называется группировка, в которой группы образованы только по одному признаку.

Комбинационной называется группировка, в которой разбиение совокупности на группы производится по двум и более признакам, взятым в сочетании (комбинации).

Сначала группы формируются по одному признаку, затем группы делятся на подгруппы по другому признаку, а эти в свою очередь делятся по третьему и так далее. Таким образом, комбинационные группировки дают возможность изучить единицы совокупности одновременно по нескольким взаимосвязанным признакам.

При построении комбинационной группировки возникает вопрос о последовательности разбиения единиц объекта по признакам. Как правило, рекомендуется сначала производить группировку по атрибутивным признакам, значения которых имеют ярко выраженные качественные различия.

 

3.3. Принципы построения статистических группировок и классификаций

Построение статистических группировок осуществляется по следующим этапам:

1.   Определение группировочного признака.

2.   Определение числа групп.

3.   Расчет ширины интервала группировки.

4.   Определение признаков, которые в комбинации друг с другом будут характеризовать каждую выделенную группу.

Построение группировки начинается с определения группировочного признака.

Группировочным признаком называется признак, по которому проводится разбиение единиц совокупности на отдельные группы. От правильного выбора группировочного признака зависят выводы статистического исследования. В качестве основания группировки необходимо использовать существенные, теоретически обоснованные признаки.

В основание группировки могут быть положены как количественные, так и качественные признаки. Количественные признаки - это признаки, которые имеют числовое выражение (объем выпускаемой продукции, возраст человека, доход сотрудника фирмы и т. д.). Качественные признаки отражают состояние единицы совокупности (пол, отраслевая принадлежность предприятия, форма собственности фирмы и т.д.).

После того, как определено основание группировки, следует решить вопрос о количестве групп, на которые необходимо разбить исследуемую совокупность единиц наблюдения.

Число групп зависит от задач исследования и вида показателя, положенного в основание группировки, объема изучаемой совокупности и степени вариации признака. Вид показателя особенно существенен при анализе качественных признаков. Так, например, группировка сотрудников фирмы по полу учитывает только две градации: «мужской» и «женский».

В случае группировки единиц наблюдения по количественному признаку особое внимание необходимо обратить на число единиц исследуемого объекта, объем совокупности и степень колеблемости группировочного признака.

При небольшом объеме совокупности (n<50) не следует образовывать большого количества групп, так как группы будут включать недостаточное число единиц объекта. Показатели, рассчитанные для таких групп, не будут представительными и не позволят получить адекватную характеристику исследуемого явления.

Часто группировка по количественному признаку имеет задачу отразить распределение единиц совокупности по этому признаку. В этом случае количество групп зависит, в первую очередь, от степени колеблемости группировочного признака: чем больше его колеблемость, тем больше можно образовать групп. Поэтому при определении числа групп необходимо принять во внимание размах вариации признака (R), который позволяет оценить вариацию признака между крайними значениями признака - максимальным (Хmах) и минимальным (Xmin) и определяется по следующей формуле:

R= Хmах - Xmin

Чем больше размах вариации признака, положенного в основание группировки, тем, как правило, может быть образовано большее число групп. При этом может возникнуть проблема получения пустых групп, т.е. групп, не содержащих ни одной единицы наблюдения.

Построение большого числа групп позволит, с одной стороны, точнее воспроизвести характер исследуемого объекта. Однако, с другой стороны, слишком большое число групп затрудняет выявление закономерностей при исследовании социально-экономических явлений и процессов. Поэтому в каждом конкретном случае при определении числа групп следует исходить не только из степени колеблемости признака, но и из особенностей объекта и показателей, его характеризующих, а также цели исследования.

Определение числа групп можно осуществить несколькими способами. Формаль-но-математический способ предполагает использование формулы Стерджесса:

 

n=1+3,322*lgN,                                                          (3.1)

где:n – число групп;N – число единиц совокупности.

 

Согласно этой формуле выбор числа групп зависит только от объема изучаемой совокупности.

Применение данной формулы дает хорошие результаты в том случае, если совокупность состоит из большого числа единиц наблюдения (n>50).

Когда определено число групп, то следует определить интервалы группировки.

Интервал - это значения варьирующего признака, лежащие в определенных границах. Каждый интервал имеет верхнюю и нижнюю границы или одну из них. Нижней границей интервала называется наименьшее значение признака в интервале. Верхней границей интервала называется наибольшее значение признака в интервале. Величина интервала представляет собой разность между верхней и нижней границами интервала.

Интервалы группировки бывают:

•    равные и неравные;

•    открытые и закрытые.

В зависимости от величины интервалы группировки бывают: равные и неравные. В свою очередь, неравные интервалы подразделяются на прогрессивно возрастающие, прогрессивно убывающие, произвольные и специализированные.

Равные интервалы применяются в случае, если изменение количественного признака внутри изучаемой совокупности единиц наблюдения происходит равномерно и его вариация проявляется в сравнительно узких границах.

Ширина равного интервала определяется по следующей формуле:

 

h=R/n=Xmax – Xmin/n                                               (3.2)

где:

Xmax, Xmin - максимальное и минимальное значения признака в совокупности;

n -число групп.

Если максимальные или минимальные значения сильно отличаются от смежных с ними значений вариантов в упорядоченном ряду значений группировочного признака, то для определения величины интервала следует использовать не максимальное или минимальное значения, а значения, несколько превышающие минимум, и несколько меньше, чем максимум.

Полученную по формуле (3.2) величину округляют и она будет являться шириной интервала.

Если размах вариации признака в совокупности велик и значения признака варьируют неравномерно, то надо использовать группировку с неравными интервалами. Неравные интервалы могут быть получены в процессе объединения пустых, не содержащих ни одной единицы совокупности, равных интервалов. Это происходит в том случае, если после построения равных интервалов по изучаемому признаку образуются группы, содержащие мало или не содержащие вообще ни одной единицы, т.е. группы, не отражающие определенных типов изучаемого явления по признаку. В этом случае возникает необходимость в увеличении интервалов группировки.

Также неравные интервалы могут быть прогрессивно-возрастающие или прогрессивно-убывающие в арифметической или геометрической прогрессии. Величина интервалов, изменяющихся в арифметической и геометрической прогрессии, определяется следующим образом:

hi+1 = hi + a,

а в геометрической прогрессии:

hi+1 = hi x q,

где:

а - константа: для прогрессивно-возрастающих интервалов имеет знак «+», а при прогрессивно-убывающих - знак «-».

q - константа: для прогрессивно-возрастающих - больше «1»; для прогрессивно-убывающих - меньше «1».

Применение неравных интервалов обусловлено тем, что в первых группах небольшая разница в показателях имеет большое значение, а в последних группах эта разница не существенна.

Например, при построении группировки строительных компаний города по показателю численности работающих, который варьирует от 500 человек до 3500 человек, нецелесообразно рассматривать равные интервалы, т. к. учитываются как малые, так и крупнейшие строительные фирмы города. Поэтому следует образовывать неравные интервалы: 500-1000, 1000-2000, 2000-3500, т. е. величина каждого последующего интервала больше предыдущего на 500 человек и увеличивается в арифметической прогрессии. Выбор исследователя в построении равных или неравных интервалов зависит от степени заполнения каждой выделенной группы, т.е. от числа единиц в них. Если величина интервала существенна и содержит большое число единиц совокупности, то эти интервалы необходимо дробить, а в противном случае - объединять.

Интервалы группировок могут быть закрытыми и открытыми.

Закрытыми называются интервалы, у которых имеются обе границы: верхняя и нижняя границы.

Открытые - это интервалы, у которых указана только одна граница: как правило, верхняя - у первого интервала и нижняя - у последнего. Например, группы страховых компаний по числу работающих в них сотрудников (чел.): до 50, 50-100, 100-150, 150 и более. Применение открытых интервалов целесообразно в тех случаях, когда в совокупности встречается незначительное число единиц наблюдения с очень малыми или очень большими значениями вариантов, которые резко, в несколько раз, отличаются от всех остальных значений изучаемого признака.

При группировке единиц совокупности по количественному признаку границы интервалов могут быть обозначены по-разному, в зависимости от того, непрерывный или дискретный признак положен в основание группировки.

Если основанием группировки служит непрерывный признак (например, группы строительных фирм по объему строительно-монтажных работ, выполненных собственными силами (тыс. руб.): 1200-1400, 1400-1600, 1600-1800, 1800-2000), то одно и то же значение признака выступает и верхней и нижней границами двух смежных интервалов. В данном случае объем работ 1400 тыс. руб. составляет верхнюю границу первого интервала и нижнюю границу второго, 1600 тыс. руб. - соответственно второго и третьего и т.д., т.е. верхняя граница i - го интервала равна нижней границе (i+1) - го интервала.

При таком обозначении границ может возникнуть вопрос, в какую группу включать единицы наблюдения, значения признака у которых совпадают с границами интервалов. Например, во вторую или третью группу должна войти строительная фирма с объемом строительно-монтажных работ 1600 тыс. рублей? Если верхняя граница формируется по принципу «исключительно», то фирма должна быть отнесена к третьей группе, в противном случае - ко второй. Для того, чтобы правильно отнести к той или иной группе единицу совокупности, значение признака которой совпадает с границами интервалов, можно ориентироваться на открытые интервалы (по нашему примеру группы строительных фирм по объему строительно-монтажных работ преобразуются в следующие: до 1400, 1400-1600, 1600-1800, 1800 и более). В данном случае, вопрос отнесения отдельных единиц совокупности, значения которых являются граничными, к той или иной группе решается на основе анализа последнего открытого интервала. Возможны два случая обозначения последнего открытого интервала: 1) 1800 тыс. руб. и более; 2) более 1800 тыс. руб. В первом случае, строительные фирмы с объемом строительно-монтажных работ 1600 тыс. руб. попадут в третью группу; во втором случае - во вторую группу.

Если в основании группировки лежит дискретный признак, то нижняя граница i-ro интервала равна верхней границе i-1-го интервала, увеличенной на 1. Например, группы строительных фирм по числу занятого персонала (чел.) будут иметь вид: 100-150, 151-200, 201-300.

При определении границ интервалов статистических группировок иногда исходят из того, что изменение количественного признака приводит к появлению нового качества. В этом случае граница интервала устанавливается там, где происходит переход от одного качества к другому.

Строя такую группировку, следует дифференцированно устанавливать границы интервалов для разных отраслей народного хозяйства. Это достигается путем использования группировок со специализированными интервалами. Специализированные интервалы - это такие интервалы, которые применяются для выделения из совокупности одних и тех же типов по одному и тому же признаку для явлений, находящихся в различных условиях.

При изучении социально-экономических явлений на макроуровне часто применяют группировки, интервалы которых не будут ни прогрессивно-возрастающими, ни прогрессивно-убывающими. Такие интервалы называются произвольными и, как правило, используются при группировке предприятий, например, по уровню рентабельности.

 

Пример.

Произведем группировку совокупности, включающей 30 банков Российской Федерации (на 01.01.16г.):

 

Номер банка

Капитал, млн. руб.

Рабочие активы, млн. руб.

Уставный фонд, млн. руб.

1

207,7

2,48

1,14

2

200,3

2,40

1,10

3

190,2

2,28

1,05

4

323,0

3,88

1,88

5

247,1

2,96

1,36

6

177,7

2,12

0,97

7

242,5

2,90

1,33

8

182,9

2,18

0,99

9

315,6

3,78

1,73

10

183,2

2,20

1,01

11

320,2

3,84

1,76

12

207,3

2,48

1,14

13

181,0

2,17

0,99

14

172,4

2,06

0,94

15

234,3

2,81

1,29

16

189,5

2,27

1,04

17

187,8

2,24

1,03

18

166,9

1,99

0,91

19

157,7

1,88

0,86

20

168,3

2,02

0,93

21

224,4

2,69

1,23

22

166,5

1,99

0,91

23

198,5

2,38

1,09

24

240,4

2,88

1,32

25

229,3

2,75

1,26

26

175,2

2,10

0,96

27

156,8

1,87

0,86

28

160,1

1,92

0,88

29

178,7

2,14

0,98

30

171,6

2,05

0,94

 

В качестве группировочного признака возьмем капитал банка. Образуем четыре группы банков с равными интервалами. Величину интервала определим по формуле:

h=Xmax - Xmin/n=323,0 – 156,0/4 =41,8

Обозначим границы групп:

1-я группа-156,0-197,8

2-я группа-197,8-239,6

3-я группа-239,6-281,4

4-ягруппа-281,4-323,2

После того, как определен группировочный признак - капитал, задано число групп - 4 и образованы сами группы, необходимо отобрать показатели, которые характеризуют группы, и определить их величины по каждой группе. Показатели, характеризующие банки, разносятся по четырем указанным группам и подсчитываются групповые итоги. Результаты группировки заносятся в таблицу и определяются общие итоги по совокупности единиц наблюдения по каждому показателю.

Таблица 3.1.

Группировка коммерческих банков по величине капитала

 

Группы банков по величине капитала, млн.руб.

Число банков

Капитал, млн. руб.

Активы, млн. руб.

Работающие активы, млн. руб.

А

1

2

3

4

156,0-197,8

17

2966,5

35,48

16,25

197,8-239,6

7

1501,8

17,99

8,25

239,6-281,4

3

730,0

8,74

4,01

281,4-323,2

3

958,8

11,5

5,37

ИТОГО

30

6157,1

73,71

33,88

 

Структурная группировка коммерческих банков на основе данных таблицы 3.1 будет иметь вид:

 

 

 

 

 

Таблица 3.2.

Группировка коммерческих банков по величине капитала (в %% к итогу)

 

Группы банков по величине капитала, млн. руб.

Число банков

капитал

активы

Работающие активы

А

1

2

3

4

156,0-197,8

56,7

48,2

48,1

48,0

197,8-239,6

23,3

24,4

24,4

24,3

239,6-281,4

10,0

11,9

11,9

11,8

281,4-323,2

10,0

15,5

15,6

15,9

ИТОГО

100,0

100,0

100,0

100,0

 

Из таблицы 3.2 видно, что в основном преобладают малые банки - 56,7%, на долю которых приходится 48,2% всего капитала. Более конкретный анализ взаимосвязи показателей можно сделать на основе аналитической группировки.

 

Таблица 3.3.

Группировка коммерческих банков по величине капитала

 

Группы банков по величине капитала, млн. руб.

Число банков

Капитал, млн. руб.

Активы, млн. руб.

Работающие активы, млн. руб.

 

всего

В среднем на один банк

всего

В среднем на один банк

всего

В среднем на один банк

156,0-197,8

17

2966,5

174,5

35,48

2,09

16,25

0,96

197,8-239,6

7

1501,8

214,5

17,99

2,57

8,25

1,18

239,6-281,4

3

730,0

243,3

8,74

2,91

4,01

1,34

281,4-323,2

3

958,8

319,6

11,5

3,83

5,37

1,79

ИТОГО

30

6157,1

205,2

73,71

2,46

33,88

1,13

 

Величина капитала, все активы банка и работающие активы прямо зависят между

собой, и чем крупнее банк, тем эффективнее управление работающими активами.

Мы рассмотрели примеры группировок по одному признаку. Однако в ряде случаев для решения поставленных задач такая группировка является недостаточной. В этих случаях переходят к группировке исследуемой совокупности по двум и более существенным признакам во взаимосвязи (комбинационной группировке).

Произведем группировку данных коммерческих банков по двум признакам: величине капитала и работающим активам.

Каждую группу и подгруппу охарактеризуем следующими показателями: число коммерческих банков, капитал, работающие активы.

Таблица 3.4

Группировка коммерческих банков по величине капитала и работающим активам

 

Номер группы

Группы банков по величине капитала, млн. руб.

Подгруппы по величине работающих активов, млн.руб.

Число банков

Капитал, млн. руб.

Работающие активы, млн. руб.

1

2

3

4

5

6

1

156,0-197,8

0,86-1,37

1,37-1,88

17

-

2966,5

-

16,25

-

Итого

 

17

2966,5

16,25

2

197,8-239,6

0,86-1,37

1,37-1,88

7

-

1501,8

-

8,25

-

Итого

 

7

15001,8

8,25

3

239,6-281,4

0,86-1,37

1,37-1,88

 

730

-

4,01

-

Итого

 

3

730

4,01

4

 

0,86-1,37

1,37-1,88

-

3

-

958,8

-

5,37

Итого

 

3

958,8

5,37

5

Всего по подгруппам

0,86-1,37

1,37-1,88

27

3

5198,3

958,8

28,51

5,37

Всего

 

30

6157,1

33,88

 

От группировок следует отличать классификацию. Классификацией называется систематизированное распределение явлений и объектов на определенные группы, классы, разряды на основании их сходства и различия.

Отличительными чертами классификаций является:

•       в их основе лежит качественный признак;

•       классификации стандартны и устанавливаются органами государственной и международной статистики;

•       классификации устойчивы, так как остаются неизменными в течение длительного периода времени.

Ряды распределения представляют собой простейшую группировку, в которой каждая выделенная группа характеризуется только частотой.

В зависимости от признака, положенного в основу образования ряда распределения, различают атрибутивные и вариационные ряды распределения.

Атрибутивными называют ряды распределения, построенные по качественным признакам, то есть признакам, характеризующим состояние изучаемого явления и не имеющим числового выражения.

Атрибутивные ряды распределения характеризуют состав совокупности по тем или иным существенным признакам. Взятые за несколько периодов, эти данные позволяют исследовать изменение структуры.

Вариационными рядами называют ряды распределения, построенные по количественному признаку, т.е. признаку, имеющему числовое выражение у отдельных единиц совокупности. Вариационный ряд состоит из двух элементов: вариантов и частот. Вариантами называются отдельные значения признака, которые он принимает в вариационном ряду, то есть конкретное значение варьирующего признака. Частотами называются численности отдельных вариант или каждой группы вариационного ряда. Частоты показывают, как часто встречаются те или иные значения признака в изучаемой совокупности. Сумма всех частот определяет численность всей совокупности, ее объем. Частостями называются частоты, выраженные в долях единицы или в процентах к итогу. Соответственно сумма частостей равна 1 или 100%.

В зависимости от характера вариации признака различают дискретные и интервальные вариационные ряды.

Дискретный вариационный ряд - это ряд распределения в котором группы составлены по признаку, изменяющемуся прерывно, т.е. через определенное число единиц и характеризуют распределение единиц совокупности по дискретному признаку, принимающему только целые значения. Например, группы студентов по баллу в сессию по предмету: 5,4,3,2.

Интервальный вариационный ряд распределения - это ряд распределения, в котором группировочный признак, составляющий основание группировки, может принимать в интервале любые значения, отличающиеся друг от друга на сколь угодную малую величину.

Построение интервальных вариационных рядов целесообразно прежде всего при непрерывной вариации признака, а также если дискретная вариация признака проявляется в широких пределах, то есть число вариантов дискретного признака достаточно велико.

Правила построения рядов распределения аналогичны правилам построения группировки.

Анализ рядов распределения наглядно можно проводить на основе их графического изображения. Для этой цели строят полигон, гистограмму, огиву и кумуляту распределения.

Полигон используется при изображении дискретных вариационных рядов. Для его построения в прямоугольной системе координат по оси абсцисс в одинаковом масштабе откладываются ранжированные значения варьирующего признака, а по оси ординат наносится шкала для выражения величины частот. Полученные на пересечении оси абсцисс (х) и оси ординат (у) точки соединяются прямыми линиями, в результате чего получают ломаную линию, называемую полигоном частот. Иногда для замыкания полигона предлагается крайние точки (слева и справа на ломаной линии) соединить с точками на оси абсцисс, в результате чего получается многоугольник.

Гистограмма применяется для изображения интервального вариационного ряда. При построении гистограммы на оси абсцисс откладываются величины интервалов, а частоты изображаются прямоугольниками, построенным на соответствующих интервалах. Высота столбиков должна быть пропорциональна частотам. В результате получается график, на котором ряд распределения изображен в виде смежных друг с другом столбиков.

Гистограмма может быть преобразована в полигон распределения, если середины верхних сторон прямоугольников соединить прямыми линиями.

При построении гистограммы распределения вариационного ряда с неравными интервалами по оси ординат наносят не частоты, а плотность распределения признака в соответствующих интервалах. Это необходимо сделать для устранения влияния величины интервала на распределение интервала и получения возможности сравнивать частоты. Плотность распределения - это частота, рассчитанная на единицу ширины интервала, то есть, сколько единиц в каждой группе приходится на единицу величины интервала.

 

3.4. Сравнимость статистических группировок.

Вторичная группировка

Группировки, построенные за один и тот же период времени, но для разных объектов или, наоборот, для одного объекта, но за два разных периода времени могут оказаться несопоставимыми из-за различного числа выделенных групп или неодинаковости границ интервалов.

Вторичная группировка, или перегруппировка сгруппированных данных применяется для лучшей характеристики изучаемого явления (в случае, когда первоначальная группировка не позволяет четко выявить характер распределения единиц совокупности), либо для приведения к сопоставимому виду группировок с целью проведения сравнительного анализа.

Вторичная группировка - операция по образованию новых групп на основе ранее осуществленной группировки.

Применяют два способа образования новых групп. Первым, наиболее простым и распространенным способом является изменение (чаще укрупнение) первоначальных интервалов. Второй способ получил название долевой перегруппировки и состоит в образовании новых групп на основе закрепления за каждой группой определенной доли единиц совокупности. Проиллюстрируем методику вторичной группировки на следующем примере.

Пример:

Распределение сотрудников предприятия по уровню дохода

 

Группы работающих по уровню доходов, тыс. руб.

Число работающих, чел.

До 4

16

4-10

20

10-18

44

18-30

74

30-40

37

40 и более

9

ИТОГО

200

 

Произведем перегруппировку данных, образовав новые группы с интервалами до 5, 5-10,10-20,20-30, свыше 30 тыс. руб.

В первую новую группу войдет полностью первая группа сотрудников и часть второй группы. Чтобы образовать группу до 5 тыс. руб., необходимо от интервала второй группы взять 1,0 тыс. руб. Величина интервала этой группы составляет 6,0 тыс. руб. Следовательно, необходимо взять от нее 1/6 (1,0:6,0) часть. Аналогичную же часть во вновь образуемую   первую   группу   надо   взять   и   от   численности   работающих, то   есть

20 х 1/6 = 3 чел. Тогда в первой группе будет работающих: 16+3 = 19 чел.

Вторую новую группу образуют работающие второй группы за вычетом отнесенных к первой, то есть 20-3 = 17 чел. Во вновь образованную третью группу войдут все сотрудники третьей группы и часть сотрудников четвертой. Для определения этой части от интервала 18-30 (ширина интервала равна 12) нужно добавить к предыдущему 2,0 (чтобы верхняя граница интервала была равна 2,0 тыс. руб.). Следовательно, необходимо взять часть интервала, равную [2:12 = 1:6]. В этой группе 74 человека, значит надо взять 74х(1:6) = 12 чел. В новую третью группу войдут 44+12 = 56 чел. Во вновь образованную четвертую группу войдут 74-12 = 62 чел., оставшихся от прежней четвертой группы. Пятую вновь образованную группу составят работающие пятой и шестой прежних групп: 37+9 = 46 чел.

В результате получим следующие новые группы:

 

Группы работающих по уровню доходов, тыс. руб.

Число работающих, чел.

До 5

19

5-10

17

10-20

56

20-30

62

Свыше 30

46

ИТОГО

200

 

Практическое занятие №3

Сводка и группировка статистических данных (2 часа).

 

Исходные данные

Имеются условные данные по среднесписочной численности менеджеров по продажам, количеству проданного ими однокачественного товара, индивидуальной рыночной цене на этот товар, а также объёму продаж 30 фирм в одной из регионов РФ в 1 квартале отчётного года.

Таблица 3.5.

Исходная информация для сквозной задачи

 

Номер фирмы

Численность менеджеров, чел.

Количество проданного товара, шт.

Цена, тыс. руб.

Объём продаж, млн. руб.

1

15

18

528

9,50

2

24

20

515

10,30

3

39

22

499

10,98

4

25

20

520

10,40

5

20

19

530

10,07

6

27

20

518

10,36

7

20

19

527

10,01

8

25

20

500

10,00

9

29

20

515

10,30

10

27

20

495

9,90

11

22

19

520

9,88

12

33

21

505

10,61

13

32

21

499

10,48

14

35

22

480

10,56

15

17

18

530

9,54

16

25

20

511

10,22

17

33

21

516

10,84

18

32

21

510

10,71

19

30

21

490

10,29

20

35

22

485

10,67

21

18

18

532

9,58

22

45

23

478

11,00

23

33

21

515

10,82

24

39

23

475

10,93

25

27

20

513

10,26

26

20

19

514

9,77

27

38

22

488

10,74

28

34

21

500

10,50

29

28

20

515

10,30

30

22

19

515

9,79

ИТОГО

849

610

-

309,31

 

Задание 3.1.

 

Используя исходные данные таблицы 3.1, требуется построить дискретный ряд распределения фирм по количеству проданного товара.

Таблица 3.6.

Дискретный ряд распределения фирм по количеству проданного товара в одном из регионов РФ в 1 кв. отчётного года

 

Вариант признака (хj)

Количество проданного товара, шт.

Частота (fj)

Число фирм, ед.

 

 

 

 

 

 

 

 

 

 

 

 

ИТОГО

30

 

Задание 3.2.

 

Используя исходные данные, требуется построить ранжированный ряд 30 фирм по среднесписочной численности менеджеров.

 

Задание 3.3.

 

Используя исходные данные таблицы 3.1, требуется:

1.      Построить интервальный ряд распределения фирм по численности менеджеров.

2.      Рассчитать частности ряда распределения фирм.

3.      Сделать выводы

 

 

Таблица 3.7.

Интервальный ряд распределения фирм по среднесписочной численности менеджеров в одном из регионов РФ в 1 квартале отчётного года

 

Вариант признака (хj)

Численность менеджеров, чел.

Частота (fj)

Число фирм, ед

Частость (wj),

Доля фирм в общем итоге

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ИТОГО

30

1,00

 

Задание 3.4.

Используя исходные данные таблицы 3.1, а также интервальный ряд распределения фирм по численности менеджеров (табл. 1.2.) требуется построить  аналитическую группировку зависимости между численностью менеджеров и объёмов продаж фирм и на основании её сделать вывод о наличии (или отсутствии) связи между указанными признаками.

 

Таблица 3.8.

Зависимость объёмов продаж от численности менеджеров фирм в одном из регионов РФ в 1 кв. отчётного года.

 

Номер группы

(хj), численность менеджеров, чел.

(fj), число фирм, ед

Средний объём продаж фирмы, млн. руб., yj

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Внеаудиторная самостоятельная работа (4 часа).

 

Задание. Используя приведённый ниже материал составить статистические таблицы каждого вида (темы и данные таблиц выбрать самостоятельно).

 

Статистическая таблица и ее элементы

Результаты сводки и группировки материалов статистического наблюдения, как правило, представляются в виде таблиц. Таблица является наиболее рациональной, наглядной и компактной формой представления статистического материала. Однако не всякая таблица является статистической. Таблица умножения, опросный лист социологического обследования и так далее могут носить табличную форму, но еще не являются статистическими таблицами.

Статистической называется таблица, которая содержит сводную числовую характеристику исследуемой совокупности по одному или нескольким существенным признакам, взаимосвязанным логикой экономического анализа.

Табличной называется такая форма расположения числовой информации, при которой число располагается на пересечении четко сформулированного заголовка по вертикальному столбцу, называемому графой, и названия по соответствующей горизонтальной полосе - строке.

Таким образом, внешне таблица представляет собой пересечение граф и строк, которые формируют остов таблицы.

Статистическая таблица содержит три вида заголовков: общий, верхние и боковые. Общий заголовок отражает содержание всей таблицы (к какому месту и времени она относится), располагается над макетом таблицы по центру и является внешним заголовком. Верхние заголовки характеризуют содержание граф (заголовки сказуемого), а боковые (заголовки подлежащего) - строк. Они являются внутренними заголовками.

Остов таблицы, заполненный заголовками, образует макет таблицы; если на пересечении граф и строк записать цифры, то получается полная статистическая таблица.

 

Название таблицы

(общий заголовок)

 

Содержание строк

Наименование граф (верхние заголовки)

А

1

2

3

4

5

Наименование строк (боковые заголовки)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Итоговая строка

 

 

 

 

 

Итоговая графа

Схема 3.1. Остов (основа) статистической таблицы

 

Цифровой материал может быть представлен абсолютными (численность населения РФ), относительными (индексы цен на продовольственные товары) и средними (средне-месячный доход сотрудника коммерческого банка) величинами.

Таблицы могут сопровождаться примечанием, используемым с целью пояснения, в случае необходимости, заголовков, методики расчета некоторых показателей, источников информации и так далее.

По логическому содержанию таблица представляет собой «статистическое предложение», основными элементами которого являются подлежащее и сказуемое.

Подлежащим статистической таблицы называется объект, который характеризуется цифрами. Это может быть одна или несколько совокупностей, отдельные единицы совокупности в порядке их перечня или сгруппированные по каким-либо признакам, территориальные единицы и так далее. Обычно подлежащее таблицы дается в левой части, в наименовании строк.

Сказуемое статистической таблицы образует система показателей, которыми характеризуется объект изучения, то есть подлежащее таблицы. Сказуемое формирует верхние заголовки и составляет содержание граф с логически последовательным расположением показателей слева направо.

Расположение подлежащего и сказуемого в отдельных случаях может меняться местами для более полного и лучшего способа прочтения и анализа исходной информации об исследуемой совокупности.

 

Виды статистических таблиц

В практике экономико-статистического анализа используются различные виды статистических таблиц.

В зависимости от структуры подлежащего, от группировки единиц в нем, различают статистические таблицы простые и сложные, а последние, в свою очередь, подразделяются на групповые и комбинационные.

Простой называется такая таблица, в подлежащем которой дается перечень каких-либо объектов или территориальных единиц.

Простые таблицы различают монографические и перечневые. Монографические таблицы характеризуют не всю совокупность единиц изучаемого объекта, а только одну какую-либо группу из нее, выделенную по определенному признаку.

Простые таблицы не дают возможности выявить социально-экономические типы изучаемых явлений, их структуру, а также взаимосвязи и взаимозависимости между характеризующими их признаками.

Эти задачи более полно могут быть решены с помощью сложных - групповых и, особенно, комбинационных таблиц.

Групповыми называются статистические таблицы, подлежащее которых содержит группировку единиц совокупности по одному количественному или атрибутивному признаку.

Простейшим видом групповых таблиц являются ряды распределения. Групповая таблица может быть более сложной, если в сказуемом дополнительно приводятся ряд показателей, характеризующих группы подлежащего. Такие таблицы часто используются в целях сопоставления обобщающих показателей по группам.

Таблица 3.9.

Распределение населения Российской Федерации

по возрастным группам в 2016 г. (на начало года)

 

Группы населения по возрасту, лет

Численность населения, тыс. чел.

Численность населения, в % к итогу

1

2

3

0-4

6306

4,4

5-9

7123

4,9

10-14

10825

7,5

15-19

12208

8,5

20-24

10901

7,6

25-29

10422

7,2

30-34

9534

6,6

35-39

10588

7,4

40-44

12595

8,7

45-49

11625

8,1

50-54

9832

6,8

55-59

4841

3,4

60-64

8625

6,0

65-69

5974

4,2

70 и более

12555

8,7

итого

143954

100,0

 

Таблица 3.9. отражает количественное распределение населения Российской Федерации по возрасту.

Таким образом, групповые таблицы позволяют выявить и охарактеризовать социально-экономические типы явлений, их структуру в зависимости только от одного признака.

Комбинационными называются статистические таблицы, подлежащее которых содержит группировку единиц совокупности одновременно по двум и более признакам: каждая из групп, построенная по одному признаку, разбивается, в свою очередь, на подгруппы пo какому-либо другому признаку и так далее.

 

 

 

 

 

 

 

 

Таблица 3.10.

Группировка предприятий пищевой промышленности одного из регионов

Российской Федерации по величине прибыли и численности промышленно-

производственного персонала в 2016 г.

 

Группы предприятий по величине прибыли, млн. руб.

Группы предприятий по численности промышленно-производственного персонала (чел)

Число предприятий

1

2

3

50-100

200-250

250-300

300-350

3

4

8

Итого по группе

-

15

100-150

200-250

250-300

300-350

1

2

2

Итого по группе

 

5

Итого по группам

200-250

250-300

300-350

4

6

10

Всего

 

20

 

Подлежащим в таблице являются группы предприятий по величине прибыли и численности промышленно-производственного персонала.

Комбинационные таблицы позволяют характеризовать типические группы, выделенные по нескольким признакам и связь между ними. Последовательность разбиения единиц совокупности на однородные группы по признакам определяется либо важностью одного из них в их комбинации, либо порядком их изучения.

В сказуемом статистической таблицы, как уже говорилось, приводятся показатели, которые являются характеристикой изучаемого объекта.

По структурному строению сказуемого различают статистические таблицы с простой и сложной его разработкой.

При простой разработке сказуемого показатель, определяющий его, не подразделяется на подгруппы и итоговые значения получаются путем простого суммирования значений по каждому признаку отдельно, независимо друг от друга. Примером простой разработки сказуемого может служить следующий фрагмент статистической таблицы:

 

 

Таблица 3.11.

Распределение строительных организаций различных форм собственности по объему работ, выполненных по договорам строительного подряда в 2016 г.

 

Строительные организации

Объём работ, выполненных по договорам строительного подряда - всего

в том числе по формам собственности

государственная

муниципальная

частная

прочие

 

После заполнения данного фрагмента таблицы получается подробная характеристика строительных организаций по структуре объема работ по формам собственности. По каждой строительной организации можно получить информацию» об объеме работ, выполненных по договорам строительного подряда, как в целом, так и в разрезе форм собственности.

Сложная разработка сказуемого предполагает деление признака, формирующего его, на подгруппы:

 

предприятия

Приобретено акций (всего)

в том числе

На льготных условиях

По цене определенной Госкомимуществом

Привилегированные типа А

обыкновенные

Привилегированные типа А

обыкновенные

 

 

 

 

 

 

 

При этом получается более полная и подробная характеристика объекта.

Здесь оба признака сказуемого (ценовой и видовой) тесно связаны друг с другом. Можно проанализировать не только количество приобретенных акций по видам и условиям приобретения их сотрудниками приватизированных предприятий, но и определить число привилегированных и обыкновенных акций, приобретенных на разных ценовых условиях. То есть, при сложной разработке сказуемого явление или объект могут быть охарактеризованы различной комбинацией признаков, формирующих их.

Исследователь при построении статистических таблиц должен руководствоваться оптимальным соотношением показателей сказуемого.

 

Основные правила построения и анализа статистических таблиц

Статистические таблицы, как средство наглядного и компактного представления цифровой информации, должны быть статистически правильно оформлены.

Основными приемами, определяющими технику формирования статистических таблиц, являются следующие:

1. Таблица должна быть компактной и содержать только те данные, которые непосредственно отражают исследуемое явление в статике и динамике и необходимы для познания его сущности. Цифровой материал необходимо излагать таким образом, чтобы при анализе таблицы сущность явления раскрывалась чтением строк слева направо и сверху вниз;

2.  Заголовок таблицы и названия граф и строк должны быть четкими, краткими, лаконичными, представлять собой законченное целое, органично вписывающееся в содержание текста. В названии таблицы должны найти отражение объект, признак, время и место совершения события. Например: «Курс доллара США на торгах ММВБ на 01.01.2004 г.» Названия таблицы, граф и строк пишутся полностью, без сокращений.

3. Информация, располагаемая в столбцах (графах) таблицы, завершается итоговой строкой. Существуют различные способы соединения слагаемых граф с их итогом:

•    строка «Итого» или «Всего» завершает статистическую таблицу;

•    итоговая строка располагается первой строкой таблицы и соединяется с совокупностью ее слагаемых словами «В том числе».

4.  Если названия отдельных граф повторяются между собой, содержат повторяющиеся термины или несут единую смысловую нагрузку, то необходимо им присвоить объединяющий заголовок.

5.   Графы и строки полезно нумеровать. Графы слева, заполненные названием строк, принято обозначать заглавными буквами алфавита (А), (В) и так далее, а все последующие графы - номерами в порядке возрастания.

6. Взаимосвязанные данные, характеризующие одну из сторон анализируемого явления (например, число коммерческих банков и удельный вес коммерческих банков (в % к итогу) и т.д.), целесообразно располагать в соседних друг с другом графах.

7.  Графы и строки должны содержать единицы измерения, соответствующие поставленным в подлежащем и сказуемом показателям. При этом используются общепринятые сокращения единиц измерения (чел., руб., кВт/ч и так далее).

8.  Числа целесообразно, по возможности, округлять. Округление чисел в пределах одной и той же графы или строки следует проводить с одинаковой степенью точности (до целого знака или до десятого и так далее).

Если все числа одной и той же графы или строки даны с одним десятичным знаком, а одно из чисел имеет точно два знака после запятой, то числа с одним знаком после запятой следует, дополнять нулем, тем самым подчеркнув их одинаковую точность.

9. Отсутствие данных об анализируемом социально-экономическом явлении может быть обусловлено различными причинами и это по-разному отмечается:

а) если данная позиция (на пересечении соответствующих графы и строки) вообще не подлежит заполнению, то ставится знак «X»;

б) если по какой-либо причине отсутствуют сведения, то ставится многоточие «...» или «нет свед.»;

в) если явление отсутствует полностью, то клетка заполняется тире (-)

г) для отображения очень малых чисел используют обозначения (0,0) или (0,00).

10. В случае необходимости дополнительной информации - разъяснений к таблице, могут даваться примечания.

Соблюдение приведенных правил построения и оформления статистических таблиц делает их основным средством представления, обработки и обобщения статистической информации о состоянии и развитии анализируемых социально-экономических явлений.

Анализу статистических таблиц предшествует этап ознакомления - чтения их.

«Чтение» предполагает, что исследователь, прочитав слова и числа таблицы, усвоил ее содержание в целом, сформулировал первые суждения об объекте, уяснил назначение таблицы, дал оценку явлению или процессу, описанному в таблице.

Анализ предполагает реализацию двух его направлений - структурного и содержательного.

Структурный анализ предполагает анализ строения таблицы и характеристику представленных в ней:

•    совокупности и единиц наблюдения, формирующих ее;

•    признаков и их комбинации, формирующих подлежащее и сказуемое таблицы;

•    признаков - количественные или атрибутивные;

•    соотношение признаков подлежащего с показателями сказуемого;

•    вида таблицы - простая или сложная, а последняя - групповая или комбинационная;

•    решаемых задач - анализ структуры, типов явлений или их взаимосвязей. Содержательный анализ предполагает изучение внутреннего содержания таблицы:

анализ отдельных групп подлежащего по соответствующим признакам сказуемого; выявление соотношений и пропорций между группами явлений по одному и разным признакам; сравнительный анализ и формулировка выводов по отдельным группам и по всей совокупности в целом, установление закономерностей и определение резервов развита изучаемого объекта.

Прежде чем приступить к анализу числовой информации, необходимо проверить достоверность и научную обоснованность, источники ее получения. Должна быть произведена проверка данных: логическая (например, абсурдно, если численность работающих на фирме составила 115,1 чел.) и счетная - выборочный расчет отдельных значений признаков по группе, либо итоговых значений.

Анализ отдельных признаков и групп необходимо начинать с изучения абсолютных величин, затем - связанных с ними относительных величин.

Анализ таблиц может быть дополнен расчетными средними величинами, график ми, диаграммами и т.д., если этого требуют задачи исследования.

Анализ данных таблиц производится по каждому признаку в отдельности, а затем логико-экономическом сочетании признаков.

Соблюдение правил и последовательности работы со статистическими таблицам позволит исследователю осуществить научно-обоснованный экономико-статистический анализ объектов и процессов.

 

Тема 4. Графическое представление статистической информации

 

Методические указания

Использование графиков для изложения статистических показателей позволяет придать последним наглядность и выразительность, облегчить их восприятие, а во многих случаях помогает уяснить сущность изучаемого явления, его закономерности и особенности, увидеть тенденции его развития, взаимосвязь характеризующих его показателей.

Статистические графики можно классифицировать по разным признакам: назначению (содержанию), способу построения и характеру графического образа.

По содержанию или назначению можно выделить графики сравнения в пространстве, графики различных относительных величин (структуры, динамики и т.п.), графики вариационных рядов, графики размещения по территории, графики взаимосвязанных показателей. Возможны и комбинации этих графиков, например графическое изображение вариации в динамике или динамики взаимосвязанных показателей и т.п.

По способу построения графики можно разделить на диаграммы, картодиаграммы и картограммы.

По характеру графического образа различают графики точечные, линейные, плоскостные (столбиковые, почасовые, квадратные, круговые, секторные, фигурные) и объемные.

 

Примером диаграммы служит рис. 1

 

http://www.aup.ru/books/m81/img/03-3_2.gif

 

Рис.1. Запасы нефти в отдельных странах в 1987 г.

 

Разновидностью столбиковой диаграммы является полосовая (ленточная) диаграмма, для которой характерны горизонтальная ориентация столбиков (полос) и вертикальное расположение базовой линии. Полосовая диаграмма особенно удобна в тех случаях, когда отдельные объекты сравнения характеризуются противоположными по знаку показателями (рис. 2).

 

http://www.aup.ru/books/m81/img/03-3_3.gif

 

Рис. 2. Добыча нефти в отдельных странах в 1986 г. по сравнению с 1970 г.

 

Квадратные и круговые диаграммы менее наглядны, чем столбиковые и полосовые, что связано с трудностью визуальной оценки соотношения площадей. Поэтому внутри квадратов и кругов следует проставлять величины изображаемых показателей (рис. 3.4). Еще меньшей наглядностью отличаются объемные диаграммы (например, в виде кубов), в которых лимитные размеры графического образа пропорциональны корням кубическим из сравниваемых величин.

 

http://www.aup.ru/books/m81/img/03-3_4.gif

 

Рис. 3. Численность населения Китая и Канады, млн. чел.

 

Основной формой структурных диаграмм являются секторные диаграммы (рис. 4). «Работающим» геометрическим параметром в секторной диаграмме удельных весов служит величина угла между радиусами: 1 % принимается на диаграмме равным 3,6°, а сумма всех углов, составляющая 360°, приравнивается к 100 %.

 

http://www.aup.ru/books/m81/img/03-3_5.gif

 

Рис. 4. Структура активов коммерческого банка по степени риска.

 

Для изображения экономических явлений, протекающих во времени, применяют динамические диаграммы. В отличие от диаграмм, отображающих сравнительные величины отдельных объектов или их структуры, в динамических диаграммах объектом отображения служат процессы.

Геометрически адекватной формой их отражения являются линейные координатные диаграммы (рис. 5.).

http://www.aup.ru/books/m81/img/03-3_6.gif

Рис. 5. Уровень средней цены приватизационных чеков на торгах РТСБ.

 

http://www.aup.ru/books/m81/img/03-3_7.gif

Рис. 6. Распределение квартир по числу проживающих в них.

 

Для изображения вариационных рядов применяются линейные и плоскостные диаграммы, построенные в прямоугольной системе координат.

При дискретной вариации признака графиком вариационного ряда служит полигон распределения (рис. 6.).

Полигон распределения представляет собой замкнутый многоугольник, абсциссами вершин которого являются значения варьирующегося признака, а ординатами – соответствующие им частоты.

 

Практическое занятие №4.

Табличное и графическое представление статистических данных (2 часа)

 

Задание 4.1.

Используя исходные данные таблицы 3.5, а также интервальный ряд распределения фирм по численности менеджеров (табл. 3.3), требуется построить корреляционную таблицу, характеризующую наличие (или отсутствие) связи между численностью менеджеров и объёмов продаж фирм и сделать вывод.

Таблиц 4.1.

Интервальный ряд распределения фирм по объёму продаж в одном из регионов РФ в 1 кв. отчётного года

 

Объём продаж, млн. руб., yj

Число фирм, ед.¸fj

 

 

 

 

ИТОГО

30

 

Задание 4.2.

Используя исходные данные таблицы 3.5, требуется построить для первых трёх однотипных фирм столбиковую диаграмму сравнения этих фирм по количеству проданного ими условного одно качественного товара и сделать вывод.

 

Задание 4.3.

Используя исходные данные таблицы 3.5, требуется построить для первых трёх однотипных фирм полосовую диаграмму сравнения этих фирм по количеству проданного ими условного одно качественного товара и сделать вывод.

 

Задание 4.4.

Используя исходные данные таблицы 3.5, требуется построить для первых трёх однотипных фирм круговую диаграмму сравнения этих фирм по количеству проданного ими условного одно качественного товара и сделать вывод.

 

 

Задание 4.5.

Используя исходные данные таблицы 3.5, требуется построить для первых трёх однотипных фирм квадратную диаграмму сравнения этих фирм по количеству проданного ими условного одно качественного товара и сделать вывод.

 

Задание 4.6.

Используя исходные данные таблицы 3.5, требуется построить для первых трёх однотипных фирм прямоугольную диаграмму сравнения объёмов продаж и сделать вывод.

 

Задание 4.7.

По данным таблицы 4.2. требуется построить линейную диаграмму поквартальной динамики объёмов продаж группы однотипных фирм, реализующих условный одно качественный товар в одном из регионов РФ в отчётном году, и сделать вывод.

 

Таблица 4.2.

Поквартальная динамика объёмов продаж группы однотипных фирм одного из регионов РФ в отчётном году

 

Квартал

Объём продаж, млн. руб.

1

309,31

2

362,03

3

456,78

4

340,46

 

Задание 4.8.

По данным интервального ряда распределения однотипных фирм в одном из регионов РФ в 1 квартале отчётного года (таблица 3.7.), требуется построить секторную диаграмму распределения фирм по среднесписочной численности менеджеров этих фирм и сделать вывод.

 

Внеаудиторная самостоятельная работа  (2 часа)

 

Методические указания

Карты статистические представляют собой вид графических изображений статистических данных на схематичной географической карте, характеризующих уровень или степень распространения того или иного явления на определенной территории.

Средствами изображения территориального размещения являются штриховка, фоновая раскраска или геометрические фигуры. Различают картограммы и картодиаграммы.

Картограмма - это схематическая географическая карта, на которой штриховкой различной густоты, точками или окраской различной степени насыщенности показывается сравнительная интенсивность какого-либо показателя в пределах каждой единицы нанесенного на карту территориального деления (например, плотность населения по областям или республикам, распределение районов по урожайности зерновых культур и т.п.). Картограммы делятся на фоновые и точечные.

Картограмма фоновая - вид картограммы, на которой штриховкой различной густоты или окраской различной степени насыщенности показывают интенсивность какого-либо показателя в пределах территориальной единицы. Картограмма точечная — вид картограммы, где уровень какого-либо явления изображается с помощью точек. Точка изображает одну единицу совокупности или некоторое их количество, чтобы показать на географической карте плотность или частоту появления определенного признака.

 

Задание 1. Составить точечную картограмму размещения посевных площадей картофеля (цифры условные). Сделать вывод.

Таблица 4.3

 

Номер района на контурной карте

Площадь посева картофеля, га

Число точек на карте

1

5930

 

2

5810

 

3

4690

 

4

6200

 

5

5700

 

6

6050

 

7

4820

 

8

3920

 

9

4280

 

10

3880

 

11

4055

 

12

2910

 

13

2540

 

14

2430

 

15

2720

 

 

 

Решение.

Составим точечную картограмму размещения посевных площадей картофеля.

1.    Отразить на карте размеры площади посева картофеля в каждом районе в виде определенного числа точек. Для этого установить, какая площадь картофеля будет соответствовать одной точке, т.е. определить масштаб картограммы. Для наглядности картограммы нужно, чтобы число точек было оптимальным, так как при большом количестве точки сольются, а при малом не отразят существующие различия между районами. При выборе масштаба следует учитывать, что при данных размерах контурной карты на территории района может быть размешено максимум 60-80 точек и что величина масштаба должна быть округленной, удобной для пользования числом. Исходя из этого, целесообразно принять 1 точку, равную 100 га. При этом в районе 4, где находится максимум посевов картофеля - 6200 га, будет 62 точки(6200:100), что является оптимальным числом.

2.    Определить в соответствии с принятым масштабом число точек, которые следует нанести в границах каждого района.

3.    Нанести на контурную карту данные по каждому району. При этом проследить, чтобы точки были одинакового размера и равномерно распределялись в границах района.

4. Сделать вывод

 

Задание 2. Построить фоновую картограмму урожайности картофеля фермерских хозяйств по отдельным районам области.

 

Решение

1.      Для построения фоновой картограммы предполагается предварительная группировка 16 районов по величине изучаемого признака - урожайности картофеля:

 

Группы районов

1

2

3

4

Урожайность, га

До 160

161-190

191-200

Свыше 200

 

2.    Установить для каждой группы районов вид штриховки. Интенсивность (густота)ее должна увеличиваться пропорционально нарастанию урожайности по группам районов и отражать различия в ней.

3.    Заштриховать районы, отнесенные к определенной группе, соответствующим видом штриховки. Указать на картограмме культуру, интервалы урожайности и принятую для них штриховку

4. Вывод

 

Таким образом, фоновые картограммы, как правило, используются для изображения средних или относительных величин, точечные - для объемных (количественных) показателей.

Вторую большую группу статистических карт составляют картограммы. Они представляют собой сочетание диаграмм с географической картой. В качестве изобразительных знаков в картодиаграммах используются диаграммные фигуры (столбики, квадраты, круги, фигуры, полосы), которые размещаются на контуре географической карты. Картодиаграммы дают возможность географически отразить более сложные статистико-географические построения, чем картограммы. Дальнейшим развитием данного подхода представления статистической информации являются географические информационные системы (ГИС).

 

Тема 5. Абсолютные, относительные и средние статистические показатели

 

Методические указания

Обобщающий статистический показатель - отражает количественную сторону изучаемой совокупности общественных явлений, представляет собой их величину, выраженную соответствующей единицей измерения.

Функции статистических показателей:

- познавательная (характеризует состояние и развитие изучаемых явлений, направление и интенсивности процессов);

- управленческая (на основе анализа состояния явления принимается управленческое решение);

- мониторная (постоянное наблюдение за социально-экономическими явлениями и процессами);

- прогностическая (используется для прогнозов);

- оценочная (используется для оце­нки деятельности);

- рекламно - пропагандисткая.

Все статистические показатели по охвату единиц совокупности разделяются на: абсолютные, относительные, средние.

Абсолютные обобщающие показатели — это число единиц по совокупности в целом или по ее отдельным группам, которое по­лучают в результате суммирования зарегистрированных значений признаков первичного статистического материала (статическое наблюдение, сводка), кроме того они могут быть получены расчетным путем на основе других показателей. Абсолютные статистические показатели всегда являются именованными числами. Они выражаются в натуральных (тоннах, килограммах, штуках, литрах и др.), стоимостных (рубли, доллары и др.) и трудовых (человеко-дни, человеко-часы и др.) единицах измерения.

По способу выражения размеров абсолютные величины делятся на:

-индивидуальные абсолютные показатели получают непосредственно в процессе статистического наблюдения как результат замера, взвешивания, подсчета и оценки, они служат основанием для статистической сводки и группировки;

- сводные объемные показатели, характеризующие объем признака или объем совокупности как в целом, так и по какой-либо его части, получают в результате сводки и группировки индивидуальных значений.

Относительные показатели - это результат деления одного абсолютного показателя на другой, выражающий соотношение между количественными характеристиками социально-экономических явлений и процессов, характеризуют интенсивность развития изучаемого явления во времени.

Относительные показатели могут выражаться в процентах, в коэффициентах или быть именнованными, их расчет ведется по формуле:

http://www.studfiles.ru/html/2706/652/html_D333zp1u2z.nqRr/htmlconvd-O3l6z2_html_17802cac.gif(1)

Относительные показатели можно разделить на следующие виды:

1) Относительный показатель динамики (ОПД) - это отношение уровня исследуемого процесса или явления за данный период времени к уровню этого же процесса или явления в прошлом. ОПД показывает во сколько раз текущий уровень превышает предшествующий или какую до­лю от последнего составляет. Если данный показатель выражен кратным отношением, он назы­вается коэффициентом роста, при умножении этого коэффициента на 100% получают темп роста.

2) Относительный показатель плана (ОПП) используется предприятиями с целью пер­спективного планирования своей деятельности.

3) Относительный показатель структуры (ОПС) представляет собой соотношение структурных частей изучаемого объекта и их целого. ОПС выражается в долях единицы или в процентах.

4) Относительный показатель координации (ОПК) — характеризует соотношение отдельных частей целого между собой. При этом в качестве базы сравнения выбирается та часть, которая имеет наибольший удельный вес или является приоритетной. В результате получают, сколько единиц каждой структурной части приходится на 1 единицу (иногда на 100, 1000 и т.д. единиц) базисной структурной части.

5) Относительный показатель интенсивности (ОПИ) - характеризует степень распро­странения изучаемого процесса или явления в присущей ему среде. ОПИ исчисляется, когда абсолютная величина оказывается недостаточной для формули­ровки обоснованных выводов о масштабах явления, его размерах, насыщенности, плотности распространения. Он может выражаться в процентах, быть именованной величиной.

6) Относительный показатель сравнения (ОПСр) - представляет собой соотношение од­ноименных абсолютных показателей, характеризующих разные объекты (предприятия, фирмы, районы, области и т.п.).

Средняя величина – это обобщающий показатель, характеризующий типический уровень явления. Он выражает величину признака, отнесенную к единице совокупности.

Средняя всегда обобщает количественную вариацию признака, т.е. в средних величинах погашаются индивидуальные различия единиц совокупности, обусловленные случайными обстоятельствами. В отличие от средней абсолютная величина, характеризующая уровень признака отдельной единицы совокупности, не позволяет сравнивать значения признака у единиц, относящихся к разным совокупностям. Так, если нужно сопоставить уровни оплаты труда работников на двух предприятиях, то нельзя сравнивать по данному признаку двух работников разных предприятий. Оплата труда выбранных для сравнения работников может быть не типичной для этих предприятий. Если же сравнивать размеры фондов оплаты труда на рассматриваемых предприятиях, то не учитывается численность работающих и, следовательно, нельзя определить, где уровень оплаты труда выше. В конечном итоге сравнить можно лишь средние показатели, т.е. сколько в среднем получает один работник на каждом предприятии. Таким образом, возникает необходимость расчета средней величины как обобщающей характеристики совокупности.

Вычисление среднего – один из распространенных приемов обобщения; средний показатель отрицает то общее, что характерно (типично) для всех единиц изучаемой совокупности, в то же время он игнорирует различия отдельных единиц. В каждом явлении и его развитии имеет место сочетание случайности и необходимости. При исчислении средних в силу действия закона больших чисел случайности взаимопогашаются, уравновешиваются, поэтому можно абстрагироваться от несущественных особенностей явления, от количественных значений признака в каждом конкретном случае. В способности абстрагироваться от случайности отдельных значений, колебаний и заключена научная ценность средних как обобщающих характеристик совокупностей.

Для того, чтобы средний показатель был действительно типизирующим, он должен рассчитываться с учетом определенных принципов.

Остановимся на некоторых общих принципах применения средних величин.

1. Средняя должна определяться для совокупностей, состоящих из качественно однородных единиц.

2. Средняя должна исчисляться для совокупности, состоящей из достаточно большого числа единиц.

3. Средняя должна рассчитываться для совокупности, единицы которой находятся в нормальном, естественном состоянии.

4. Средняя должна вычисляться с учетом экономического содержания исследуемого показателя.

Средние величины делятся на два больших класса: степенные средние, структурные средние.

К степенным средним относятся такие наиболее известные и часто применяемые виды, как средняя геометрическая, средняя арифметическая и средняя квадратическая.

В качестве структурных средних рассматриваются мода и медиана.

Остановимся на степенных средних. Степенные средние в зависимости от представления исходных данных могут быть простыми и взвешенными. Простая средняя считается по не сгруппированным данным и имеет следующий общий вид:

http://www.aup.ru/books/m81/img/05-f01.gif,

где Xi – варианта (значение) осредняемого признака;

m – показатель степени средней;

n – число вариант.

Взвешенная средняя считается по сгруппированным данным и имеет общий вид        

http://www.aup.ru/books/m81/img/05-f02.gif,

где Xi – варианта (значение) осредняемого признака или серединное значение интервала, в котором измеряется варианта; 

m – показатель степени средней;

fi – частота, показывающая, сколько раз встречается i-e значение осредняемого признака.

Приведем в качестве примера расчет среднего возраста студентов в группе из 20 человек:

№ п/п

Возраст 
(лет)

№ п/п

Возраст 
(лет)

№ п/п

Возраст 
(лет)

№ п/п

Возраст 
(лет)





5

18 
18 
19 
20 
19





10

20 
19 
19 
19 
20

11 
12 
13 
14 
15

22 
19 
19 
20 
20

16 
17 
18 
19 
20

21
19 
19 
19 
19

 

Средний возраст рассчитаем по формуле простой средней:

http://www.aup.ru/books/m81/img/05-f03.gif

 

Сгруппируем исходные данные. Получим следующий ряд распределения:

 

Возраст, Х лет

Число студентов

18

2

19

11

20

5

21

1

22

1

Всего

20

 

 

В результате группировки получаем новый показатель – частоту, указывающую число студентов в возрасте Х лет. Следовательно, средний возраст студентов группы будет рассчитываться по формуле взвешенной средней:

http://www.aup.ru/books/m81/img/05-f04.gif

 

 

Практическое занятие №5.

Абсолютные, относительные и средние величины (2 часа)

 

Задача 1. Расход топлива на производственные нужды предприятия характеризуется в отчетном периоде следующими данными:

 

Вид топлива

Теплотворная  способность, МДж/кГ

Расход, т

по плану

фактически

Дизельное топливо

41,9

1000

1050

Мазут

40,1

750

730

Уголь

26,4

500

555

Определить общее количество потребленного условного топлива (1 т.у.т. = 29,3 МДж/кГ) по плану и фактически, а также процент выполнения плана по общему расходу топлива.

Решение. Учитывая стандартную теплотворную способность 29,3 МДж/кГ, определяем количество потребленного условного топлива каждого вида по плану (X1i) и фактически (X1i):

        дизельное топливо: X1дт = 41,9/29,3*1000 = 1430,034 т.у.т.

дизельное топливо: X1дт = 41,9/29,3*1050 = 1501,536 т.у.т.;

        мазут: X= 40,1/29,3*750 = 1026,451 т.у.т.

мазут: X= 40,1/29,3*730 = 999,078 т.у.т.;

        уголь: X= 26,4/29,3*500 = 450,512 т.у.т.

уголь: X= 26,4/29,3*555 = 500,068 т.у.т.

Суммируя количество потребленного условного топлива каждого вида, получим общее количество потребленного условного топлива:

        по плану X1= ∑X1i= 2906,997 т.у.т.;

        фактически X1= ∑X1i= 3000,682 т.у.т.

Для определения процента выполнения плана необходимо рассчитать индекс выполнения плана, то есть отношение значений по факту и плану отчетного периода:

,                                                              (1)

Применяя формулу (1), имеем: = 3000,682/2906,997 = 1,032, то есть план по общему расходу топлива перевыполнен на 3,2%.

 

Задача 2.Рассчитать индекс и темп изменения, если в марте произведено продукции 130 тонн, а в феврале 100 тонн.

Решение. Индекс изменения (динамики) характеризует изменение какого-либо явления во времени. Он представляет собой отношение значений одной и той же абсолютной величины в разные периоды времени. Данный индекс определяется по формуле (2):

,                                                               (2)

где подиндексы означают: 1 — отчетный или анализируемый период, 0 — прошлый или базисный период.

Критериальным значением индекса динамики (темпа роста) служит единица, то есть если >1, то имеет место рост явления во времени; если =1 – стабильность; если <1 – наблюдается спад явления. Применяя формулу (2), имеем: = 130/100 = 1,3 (или 130%) > 1 – рост объема произведенной продукции.

Темп изменения (прироста) определяется по формуле (3):

.                                                             (3)

Применяя формулу (3), имеем: Т = 1,3 – 1 = 0,3 (или 30%), то есть объем произведенной продукции вырос в марте по сравнению с февралем на 30%.

 

Задача 3.Рассчитать индексы планового задания, выполнения плана и динамики, если выпуск продукции в отчетном году составил 100 млн. рублей, на следующий год планировалось 140 млн. рублей, а фактически получено 112 млн. рублей.

Решение. Индекс планового задания – это отношение значений одной и той же абсолютной величины по плану анализируемого периода и по факту базисного. Он определяется по формуле (4):

,                                                              (4)

где X1— план анализируемого периода; X0 — факт базисного периода

Применяя формулу (4) имеем: = 140/100 = 1,4 (или 140%), то есть на следующий год планировалось выпустить продукции в размере 140% от объема предыдущего года.

Индекс выполнения плана определим, применяя формулу (1): = 112/140 = 0,8 (или 80%), то есть план по увеличению выпуска продукции выполнили лишь на 80% или недовыполнили на 20%.

Индекс динамики можно определить по формуле (2) или перемножая индексы планового задания и выполнения плана, то есть = 1,12.

 

Задача 4. Суммарные денежные доходы россиян в 2005 г. составили 13522,5 млрд. руб., из которых 8766,7 млрд. руб. составила оплата труда, 1748,4 млрд. руб. – социальные выплаты, 1541,7 млрд. руб. – доход от предпринимательской деятельности, 1201,5 млрд. руб. – доходы от собственности, остальное – прочие доходы. Рассчитать относительные величины структуры и координации, приняв за основу оплату труда. Построить секторную (круговую) диаграмму структуры доходов.

Решение. Индекс структуры (доля) – это отношение какой-либо части величины (совокупности) ко всему ее значению. Он определяется по формуле (5):

                                                        (5)

Применяя формулу (5) и округляя значения до 3-х знаков после запятой, имеем:

        доля оплаты труда dОТ = 8766,7/13522,5 = 0,648 или 64,8%;

        доля социальных выплат dСВ =1748,4/13522,5 = 0,129 или 12,9%;

        доля доходов от предпринимательской деятельности dПД =1541,7/13522,5 = 0,114 или 11,4%;

        доля доходов от собственности dДС =1201,5/13522,5 = 0,089 или 8,9%.

Долю прочих доходов найдем, используя формулу (6), согласно которой сумма всех долей равна единице:

.                                                                (6)

Таким образом, доля прочих доходов dпроч = 1 – 0,648 – 0,129 – 0,114 – 0,089  = 0,020 или 2,0%.

Для иллюстрации структуры (составных частей) доходов построим секторную диаграмму (рис.1):

 

Рис.1. Структура денежных доходов населения РФ в 2005 году.

Таким образом, очевидно, что наибольшую долю в суммарных денежных доходах составляет оплата труда (64,8%), на 2-м месте – социальные выплаты (12,9%), затем следуют предпринимательский доход (11,4%), доходы от собственности (8,9%), а прочие доходы составляют лишь 2%.

Индекс координации– это отношение какой-либо части величины к другой ее части, принятой за основу (базу сравнения). Он определяется по формуле (7):

.                                                                (7)

Применяя формулу (7) и принимая за основу оплату труда, имеем:

индекс координации социальных выплат = 1748,4/8766,7 ≈ 0,129/0,648 = 0,199;

индекс координации предпринимательского дохода =1541,7/8766,7 ≈ 0,114/0,648 = 0,176;

индекс координации доходов от собственности = 1201,5/8766,7 ≈ 0,089/0,648 = 0,137;

индекс координации прочих доходов ≈ 0,02/0,648 = 0,031.

Таким образом, социальные выплаты составляют 19,9% от оплаты труда, предпринимательский доход – 17,6%, доходы от собственности – 13,7%, а прочие доходы – 3,1%.

 

Задача 5. Запасы воды в озере Байкал составляют 23000 км3, а в Ладожском озере 911 км3. Рассчитать относительные величины сравнения запасов воды этих озер.

Решение. Индекс сравнения – это отношение значений одной и той же величины в одном периоде или моменте времени, но для разных объектов или территорий. Он определяется по формуле (8):

,                                                               (8)

где А, Б — признаки сравниваемых объектов или территорий.

Применяя формулу (8) и принимая за объекты А и Б, соответственно, озера Байкал и Ладожское, найдем индекс сравнения: = 23000/911 = 25,25, то есть запасов воды в озере Байкал в 25,25 раза больше, чем в Ладожском озере.

Контрольные задания по практическому занятию

Задание 1. Определить общее производство моющих средств в условных тоннах (условная жирность 40%) по плану и фактически, а также процент выполнения плана по следующим данным:

Вид продукта

Жирность, %

Физическая масса, т

по плану

фактически

Мыло хозяйственное

60

500

600

Мыло туалетное

80

1000

1500

Стиральный порошок

10

50000

40000

Задание 2. По данным о численности жителей двух крупнейших городов России (тыс. чел) определить индексы сравнения и динамики.

Город                    Год

2004

2005

Москва

10391

10407

Санкт-Петербург

4624

4600

Задание 3.

1. По плану на 2005 год намечалось увеличение товарооборота на 3%. В 2005 году плановое задание перевыполнили на 600 млн. руб. или на 2,5%. Определить фактический прирост товарооборота (в млн. руб.) в 2005 году по сравнению с 2004 годом.

1.      По данным о товарообороте из предыдущей задачи, состоящего из реализации собственной продукции и продажи покупных товаров, определить относительные величины координации и структуры собственной и покупной продукции в 2004 и 2005 годах, если известно, что доля собственной продукции в  2004 году составила 65%, а в 2005 году она увеличилась на 10%.

Задание 4. Жилищный фонд и численность населения России следующие (на начало года):

Год

2002

2003

2004

2005

Весь жилищный фонд, млн. м2

2853

2885

2917

2949

Численность населения, млн. чел.

145,6

145,0

144,2

143,5

Охарактеризовать изменение обеспеченности населения жилой площадью с помощью относительных величин динамики и координации.

 

Задание 5.

1. В России в 2004 численность женщин составила 77144,3 тыс. чел, а мужчин – 67023,9 тыс. чел. Рассчитать относительные величины структуры и координации.

2. По плану объем продукции в отчетном году должен возрасти по сравнению с прошлым годом на 2,5%. План выпуска продукции перевыполнен на 3,0%. Определить фактический выпуск продукции в отчетном году, если известно, что объем продукции в прошлом году составил 25,3 млн. руб.

Задание 6.Определить общий объем фактически выпущенной продукции по следующим данным по трем филиалам предприятия, выпускающих однородную продукцию:

Номер филиала

Планируемый объем выпуска продукции, млн. руб.

Выполнение намеченного плана, %

1

500

104

2

750

92

3

250

116

Задание 7. По промышленному предприятию за отчетный год имеются следующие данные о выпуске продукции:

Наименование

продукции

План на I квартал,

тыс. т

Фактический выпуск, тыс. т

Отпускная цена

 за 1 т, у.е.

январь

февраль

март

Сталь арматурная

335

110

115

108

1700

Прокат листовой

255

75

90

100

2080

Определить процент выполнения квартального плана: 1) по выпуску каждого вида продукции; 2) в целом по выпуску всей продукции.

Задание 8. Определить процент выполнения плана по продажам условных школьных тетрадей (1 у.ш.т. – 12 листов) по каждому виду тетрадей и в целом по магазину по следующим данным:

Вид тетради

Цена, руб./шт.

Объем продаж, тыс. шт.

по плану

фактически

Тетрадь общая 90 листов

20

50

40

Тетрадь общая 48 листов

13

200

350

Тетрадь общая 16 листов

9

700

500

Задание 9.В России на начало 2005 года численность населения составила 144,2 млн. чел., в течение года: родилось 1,46 млн. чел., умерло – 2,3 млн. чел., мигрировало из других государств 2,09 млн. чел., мигрировало за границу – 1,98 млн. чел. Охарактеризовать изменение численности населения в 2005 году с помощью относительных величин.

Задание 10.Определить общий объем фактически выпущенной условной консервной продукции (1 у.к.б. = 0,33 л) по следующим данным:

Вид продукции

Планируемый объем выпуска продукции, тыс. шт.

Выполнение плана, %

Томатная паста 1 л

500

85

Томатная паста 0,5 л

750

104

Томатная паста 0,2 л

250

130


Внеаудиторная самостоятельная работа (2 часа)

 

Задание 1.Используя набор слов, дайте определение относительной величины.

Набор слов: сравнение, величины, собой, одной, отношение, базой, к, называемой, другой, представляет.

 

Задание 2. Приведите правильную последовательность этапов расчета относительной величины структуры:

а) каждый из элементов делим на итог и умножаем на 100;

б) подсчитываем итог имеющихся данных;

в) полученная структура в итоге должна дать 100%.

 

Задание 3. Вставьте пропущенное слово:

….. величины характеризуют явления или на определенный момент, или за определенный период.

 

Задание 4. Найдите ошибку:

Абсолютные величины бывают:

а) индивидуальные;

б) динамические;

в) общие.

 

Тема 6. Показатели вариации

Методические указания

Конкретные условия, в которых находится каждый из изучаемых объектов, а также особенности их собственного развития (социальные, экономические и пр.) выражаются соответствующими числовыми уровнями статистических показателей. Таким образом, вариация, т.е. несовпадение уровней одного и того же показателя у разных объектов, имеет объективный характер и помогает познать сущность изучаемого явления.

Для измерения вариации в статистике применяют несколько способов.

Наиболее простым является расчет показателя размаха вариации Н как разницы между максимальным (Xmax ) и минимальным (Xmin) наблюдаемыми значениями признака:

H=Xmax - Xmin.

Однако размах вариации показывает лишь крайние значения признака.

Повторяемость промежуточных значений здесь не учитывается.

Более строгими характеристиками являются показатели колеблемости относительно среднего уровня признака. Простейший показатель такого типа – среднее линейное отклонение Л как среднее арифметическое значение абсолютных отклонений признака от его среднего уровня:

http://www.aup.ru/books/m81/img/05-f23.gif

При повторяемости отдельных значений Х используют формулу средней арифметической взвешенной:

http://www.aup.ru/books/m81/img/05-f24.gif

(Напомним, что алгебраическая сумма отклонений от среднего уровня равна нулю.)

Показатель среднего линейного отклонения нашел широкое применение на практике. С его помощью анализируются, например, состав работающих, ритмичность производства, равномерность поставок материалов, разрабатываются системы материального стимулирования. Но, к сожалению, этот показатель усложняет расчеты вероятностного типа, затрудняет применение методов математической статистики. Поэтому в статистических научных исследованиях для измерения вариации чаще всего применяют показатель дисперсии.

Дисперсия признака (s2) определяется на основе квадратической степенной средней:

http://www.aup.ru/books/m81/img/05-f25.gif.

Показатель s, равный http://www.aup.ru/books/m81/img/05-f26.gif,  называется средним квадратическим отклонением.

В общей теории статистики показатель дисперсии является оценкой одноименного показателя теории вероятностей и (как сумма квадратов отклонений) оценкой дисперсии в математической статистике, что позволяет использовать положения этих теоретических дисциплин для анализа социально-экономических процессов.

Если вариация оценивается по небольшому числу наблюдений, взятых из неограниченной генеральной совокупности, то и среднее значение признака определяется с некоторой погрешностью. Расчетная величина дисперсии оказывается смещенной в сторону уменьшения. Для получения несмещенной оценки выборочную дисперсию, полученную по приведенным ранее формулам, надо умножить на величину n / (n - 1). В итоге при малом числе наблюдений (< 30) дисперсию признака рекомендуется вычислять по формуле

http://www.aup.ru/books/m81/img/05-f27.gif.

Обычно уже при n > (15÷20) расхождение смещенной и несмещенной оценок становится несущественным. По этой же причине обычно не учитывают смещенность и в формуле сложения дисперсий.

Если из генеральной совокупности сделать несколько выборок и каждый раз при этом определять среднее значение признака, то возникает задача оценки колеблемости средних. Оценить дисперсию среднего значения можно и на основе всего одного выборочного наблюдения по формуле

http://www.aup.ru/books/m81/img/05-f28.gif,

где n – объем выборки; s2 – дисперсия признака, рассчитанная по данным выборки.

Величина http://www.aup.ru/books/m81/img/05-f29.gif  носит название средней ошибки выборки и является характеристикой отклонения выборочного среднего значения признака Х от его истинной средней величины. Показатель средней ошибки используется при оценке достоверности результатов выборочного наблюдения.

Показатели относительного рассеивания. Для характеристики меры колеблемости изучаемого признака исчисляются показатели колеблемости в относительных величинах. Они позволяют сравнивать характер рассеивания в различных распределениях (различные единицы наблюдения одного и того же признака в двух совокупностях, при различных значениях средних, при сравнении разноименных совокупностей). Расчет показателей меры относительного рассеивания осуществляют как отношение абсолютного показателя рассеивания к средней арифметической, умножаемое на 100%.

1. Коэффициентом осцилляции отражает относительную колеблемость крайних значений признака вокруг средней

http://www.aup.ru/books/m81/img/05-f30.gif.

 2. Относительное линейное отключение характеризует долю усредненного значения признака абсолютных отклонений от средней величины

http://www.aup.ru/books/m81/img/05-f31.gif.

3. Коэффициент вариации:

http://www.aup.ru/books/m81/img/05-f32.gif

является наиболее распространенным показателем колеблемости, используемым для оценки типичности средних величин.

В статистике совокупности, имеющие коэффициент вариации больше 30–35 %, принято считать неоднородными.

У такого способа оценки вариации есть и существенный недостаток. Действительно, пусть, например, исходная совокупность рабочих, имеющих средний стаж 15 лет, со средним квадратическим отклонением s = 10 лет, «состарилась» еще на 15 лет. Теперь http://www.aup.ru/books/m81/img/05-f33.gif  = 30 лет, а среднеквадратическое отклонение по-прежнему равно 10. Совокупность, ранее бывшая неоднородной (10/15 × 100 = 66,7%), со временем оказывается, таким образом, вполне однородной (10/30 × 100 = 33,3 %).

 

Практическое занятие№6

Общее понятие о показателях вариации и способы их расчёта (2 часа).

 

Методические указания по теме

 

Задача 1. Имеются следующие данные о возрастном составе студентов группы заочного отделения ВУЗа (лет): 19; 19; 19; 20; 20; 20; 20; 20; 20; 20; 20; 20; 21; 21; 21; 22; 23; 23; 24; 25; 25; 25; 26; 27; 29.

Для анализа распределения студентов по возрасту требуется: 1) построить интервальный ряд распределения и его график; 2) рассчитать модальный, медианный и средний возраст, установить его типичность с помощью коэффициентов вариации; 3) проверить распределение на нормальность с помощью коэффициентов асимметрии и эксцесса.

Решение. Для построения интервального ряда из дискретного используется формула Стерджесса, с помощью которой определяется оптимальное количество интервалов (n):

n=1+3,322lgN,(10)

где N – число величин в дискретном ряде.

В нашей задаче n = 1 + 3,322lg25 = 1 + 3,322*1,398 = 5,64. Так как число интервалов не может быть дробным, то округлим его до ближайшего целого числа, т.е. до 6.

После определения оптимального количества интервалов определяем размах интервала по формуле:

h=H/n,(11)

где H – размах вариации, определяемый по формуле (12).

Hмах–Хmin(12)

где Xмax и Xmin — максимальное и минимальное значения в совокупности.

В нашей задаче h = (29 – 19)/6 = 1,67.

Интервальная группировка данных приведена в первом столбце таблицы 1, которая содержит также алгоритм и промежуточные расчеты.

 

 

Таблица 1. Вспомогательные расчеты для решения задачи

 

Xi , лет

fi

ХИ

XИfi

ХИ-

И-)2

И-)2fi

И-)3 fi

И-)4 fi

до 20,67

12

19,833

237,996

-2,134

25,602

4,552

54,623

-116,539

248,638

20,67-22,33

4

21,5

86,000

-0,467

1,866

0,218

0,871

-0,406

0,189

22,33-24

3

23,167

69,501

1,200

3,601

1,441

4,323

5,190

6,231

24-25,67

3

24,833

74,499

2,866

8,599

8,217

24,650

70,659

202,543

25,67-27,33

2

26,5

53,000

4,533

9,067

20,552

41,105

186,348

844,806

более 27,33

1

28,167

28,167

6,200

6,200

38,446

38,446

238,383

1478,091

Итого

25

549,163

54,937

164,018

383,636

2780,498

 

Мода – это наиболее часто повторяющееся значение признака. Для интервального ряда с равными интервалами величина моды определяется по формуле (13):

,(13)

где ХMo– нижнее значение модального интервала; fMo – число наблюдений или объем взвешивающего признака (вес признака) в модальном интервале; fMo-1 – то же для интервала, предшествующего модальному; fMo+1 – то же для интервала, следующего за модальным; h  – величина интервала изменения признака в группах.

В нашей задаче чаще всего повторяется (12 раз) первый интервал возраста (до 20,67), значит, это и есть модальный интервал. Используя формулу (13), определяем точное значение модального возраста:

Мо = 19 + 1,667*(12-0)/(2*12-4-0) = 20 (лет).

Медиана – это такое значение признака, которое приходится на середину ранжированного ряда. Таким образом, в ранжированном ряду распределения одна половина ряда имеет значения признака больше медианы, другая – меньше медианы. Для интервального ряда с равными интервалами величина медианы определяется так:

,(14)

где XMe – нижняя граница медианного интервала; h – его величина (размах); – сумма наблюдений (или объема взвешивающего признака), накопленная до начала медианного интервала; fMe – число наблюдений или объем взвешивающего признака в медианном интервале.

В нашей задаче второй интервал возраста (от 20,67 до 22,33) является медианным, так как на него приходится середина ряда распределения возраста. Используя формулу (14), определяем точное значение медианного возраста:

Ме = 20,67 + 1,667*(12,5-12)/4 = 20,878 (года).

Средняя величина – это обобщающий показатель совокупности, характеризующий уровень изучаемого явления или процесса. Средние величины могут быть простыми и взвешенными. Простая средняя рассчитывается при наличии двух и более статистических величин, расположенных в произвольном (несгруппированном) порядке, по общей формуле (15). Взвешенная средняя величина рассчитывается по сгруппированным статистическим величинам с использованием общей формулы (16).

=; (15)               *=.(16)

При этом обозначено: Xi – значения отдельных статистических величин или середин группировочных интервалов; m - показатель степени, от значения которого зависят виды средних величин. Используя формулы (15) и (16) при разных показателях степени m, получаем частные формулы каждого вида (см. таблицу 2).

 

Таблица 2. Виды степенных средних и их применение

 

m

Название

средней

Формула расчета средней

Когда применяется

простая

взвешенная

1

Арифметическая

=(17)

=(18)

Чаще всего, кроме тех случаев, когда должны применяться другие виды средних

–1

Гармоническая

ГМ = (19)

ГМ = (20)

Для осреднения величин с дробной размерностью при наличии дополнительных данных по числителю дробной размерности

0

Геометрическая

(21)

(22)

Для осреднения цепных индексов динамики

2

Квадратическая

=(23)

*=(24)

Для осреднения вариации признака (расчет средних отклонений)

3

Кубическая

=(25)

=(26)

Для расчета индексов нищеты населения

1

Хронологическая

(27)

 (28)

Для осреднения моментных статистических величин

 

Выбор вида формулы средней величины зависит от содержания осредняемого признака и конкретных данных, по которым ее приходится вычислять. Показатель степени m в общей формуле средней величины оказывает существенное влияние на значение средней величины: по мере увеличения степени возрастает и средняя величина (правило мажорантности средних величин), то есть *<<<<. Так, если , то , а если , то .

В нашей задаче, применяя формулу (18) и подставляя вместо  середины интервалов возраста ХИ, определяем средний возраст студентов: = 549,163/25 = 21,967 (года). Теперь осталось определить типичность или нетипичность найденной средней величины. Это осуществляется с помощью расчета показателей вариации. Чем ближе они к нулю, тем типичнее найденная средняя величина для изучаемой статистической совокупности. При этом критериальным значением коэффициента вариации служит 1/3.

Коэффициенты вариации рассчитываются как отношение среднего отклонения к средней величине. Поскольку среднее отклонение может определяться линейным и квадратическим способами, то соответствующими могут быть и коэффициенты вариации.

Среднее линейное отклонение определяется по формулам (29) и (30):

 –простое;                             (29)                                                       – взвешенное.                                 (30)

Среднее квадратическое отклонение определяется как корень квадратный из дисперсии, то есть по формуле (31):

. (31)

Дисперсия определяется по формулам (32) или (33):

–простая; (32)                  –взвешенная.             (33)

В нашей задаче, применяя формулу (30), определим ее числитель и внесем в расчетную таблицу. В итоге получим среднее линейное отклонение: Л = 54,937/25 = 2,198 (года). Разделив это значение на средний возраст, получим линейный коэффициент вариации: = 2,198/21,967 = 0,100. По значению этого коэффициента для рассмотренной группы студентов делаем вывод о типичности среднего возраста, т.к. расчетное значение коэффициента вариации не превышает критериального (0,100 < 0,333).

Применяя формулу (33), получим в итоге дисперсию: Д = 164,018/25 = 6,561. Извлечем из этого числа корень и получим в результате среднее квадратическое отклонение: = = 2,561 (года).Разделив это значение на средний возраст, получим квадратический коэффициент вариации:= 2,561/21,967 = 0,117. По значению этого коэффициента для рассмотренной группы студентов можно сделать вывод о типичности среднего возраста, т.к. расчетное значение коэффициента вариации не превышает критериального (0,117 < 0,333).

В качестве показателей асимметрии используются: коэффициент асимметрии – нормированный момент третьего порядка (34) и коэффициент асимметрии Пирсона (35):

,                      (34)                                                   .                      (35)

Если значение коэффициента асимметрии положительно, то в ряду преобладают варианты, которые больше средней (правосторонняя скошенность), если отрицательно – левосторонняя скошенность. Если коэффициент асимметрии равен 0, то вариационный ряд симметричен.

В нашей задаче ==383,636/25 = 15,345; =2,5613= 16,797; =15,345/16,797 = 0,914 > 0, значит, распределение студентов по росту с правосторонней асимметрией. Это подтверждает и значение коэффициента асимметрии Пирсона: As = (21,967-20)/2,561 = 0,768.

Для характеристики крутизны распределения используется центральный момент 4-го порядка:

=.(36)

Для образования безразмерной характеристики определяется нормированный момент 4-го порядка , который и характеризует крутизну (заостренность) графика распределения. При измерении асимметрии эталоном служит нормальное (симметричное) распределение, для которого =3. Поэтому для оценки крутизны данного распределения в сравнении с нормальным вычисляется эксцесс распределения (37):

.(37)

Для приближенного определения эксцесса может быть использована формула Линдберга (38):

,                                                                                                          38)

где – доля количества вариант, лежащих в интервале, равном половине  (в ту и другую сторону от средней величины).

В нашей задаче числитель центрального момента 4-го порядка рассчитан в последнем столбце расчетной таблицы. В итоге по формуле (37) имеем: Ex = (2780,498/25)/2,5614–3 = 111,220/43,017–3 = -0,415. Так как Ex<0, то распределение низковершинное. Это подтверждает и приблизительный расчет по формуле (38): в интервале 21,9670,5*2,561, то есть от 20,687 до 23,248 находится примерно 21,4% студентов. Таким образом, Ex= 0,214 – 0,3829 = –0,169.

 

Внеаудиторная самостоятельная работа (2 часа)

 

По имеющимся в следующей таблице данным по группе из 20 студентов заочного отделения необходимо:

1) построить интервальный ряд распределения признака и его график;

2) рассчитать модальное, медианное и среднее значение, установить его типичность с помощью коэффициентов вариации;

3) проверить распределение на нормальность с помощью коэффициентов асимметрии и эксцесса.

п/п

Вариант

1

2

3

4

5

6

7

8

9

10

Рост,

см

Вес,

кг

Доход,

у.е./мес.

IQ (тест Айзенка)

Тет-радь,

листов

Воз-раст,

лет

Соот-ношение

«рост/вес»

Стаж

работы, мес.

Кол-во

друзей, чел.

Время решения контрольной, час.

1

159

45

430

95

24

20

3,533

26

5

8,5

2

160

61

640

115

32

25

2,623

63

7

6,2

3

161

56

610

111

24

28

2,875

94

10

6,8

4

162

48

330

97

24

19

3,375

16

4

12,0

5

162

54

420

105

60

23

3,000

49

2

7,5

6

164

58

290

98

16

20

2,828

14

6

10,0

7

166

51

480

109

90

26

3,255

78

9

7,2

8

169

62

610

120

24

19

2,726

10

5

4,2

9

170

70

840

122

48

30

2,429

130

10

3,5

10

170

72

330

92

24

20

2,361

20

3

9,5

11

171

73

560

110

16

28

2,342

86

8

7,8

12

171

64

450

102

48

21

2,672

29

4

8,0

13

172

73

350

108

32

26

2,356

75

7

6,0

14

174

68

310

100

48

21

2,559

22

4

4,8

15

176

81

380

104

64

20

2,173

32

1

8,6

16

176

84

340

104

48

19

2,095

21

5

10,0

17

178

76

660

128

90

27

2,342

96

8

4,5

18

181

90

450

106

48

26

2,011

70

9

12,5

19

183

68

540

105

32

23

2,691

59

6

10,5

20

192

95

750

117

60

27

2,021

98

4

6,5

 

 

Тема 7. Выборочное наблюдение

 

Выборочное наблюдение применяется, когда применение сплошного наблюдения физически невозможно из-за большого массива данных или экономически нецелесообразно. Физическая невозможность имеет место, например, при изучении пассажиропотоков, рыночных цен, семейных бюджетов. Экономическая нецелесообразность имеет место при оценке качества товаров, связанной с их уничтожением, например, дегустация, испытание кирпичей на прочность и т.п.

Статистические единицы, отобранные для наблюдения, составляют выборочную совокупность или выборку, а весь их массив - генеральную совокупность (ГС). При этом число единиц в выборке обозначают n, а во всей ГС - N.

Отношение n/N называется относительный размерили доля выборки.

Качество результатов выборочного наблюдения зависит от репрезентативности выборки, то есть от того, насколько она представительна в ГС. Для обеспечения репрезентативности выборки необходимо соблюдать принцип случайности отбора единиц, который предполагает, что на включение единицы ГС в выборку не может повлиять какой-либо иной фактор кроме случая.

Существует 4 способа случайного отбора в выборку:

Собственно случайный отбор или «метод лото», когда статистическим величинам присваиваются порядковые номера, заносимые на определенные предметы (например, бочонки), которые затем перемешиваются в некоторой емкости (например, в мешке) и выбираются наугад. На практике этот способ осуществляют с помощью генератора случайных чисел или математических таблиц случайных чисел.

Механический отбор, согласно которому отбирается каждая (N/n)-я величина генеральной совокупности. Например, если она содержит 100 000 величин, а требуется выбрать 1 000, то в выборку попадет каждая 100 000 / 1000 = 100-я величина. Причем, если они не ранжированы, то первая выбирается наугад из первой сотни, а номера других будут на сотню больше. Например, если первой оказалась единица № 19, то следующей должна быть № 119, затем № 219, затем № 319 и т.д. Если единицы генеральной совокупности ранжированы, то первой выбирается № 50, затем № 150, затем № 250 и так далее.

Отбор величин из неоднородного массива данных ведется стратифицированным (расслоенным) способом, когда генеральная совокупность предварительно разбивается на однородные группы, к которым применяется случайный или механический отбор.

Особый способ составления выборки представляет собой серийный отбор, при котором случайно или механически выбирают не отдельные величины, а их серии (последовательности с какого-то номера по какой-то подряд), внутри которых ведут сплошное наблюдение.

Качество выборочных наблюдений зависит и от типа выборки: повторная или бесповторная. 

При повторном отборе попавшие в выборку статистические величины или их серии после использования возвращаются в генеральную совокупность, имея шанс попасть в новую выборку. При этом у всех величин генеральной совокупности одинаковая вероятность включения в выборку.

Бесповторный отбор означает, что попавшие в выборку статистические величины или их серии после использования не возвращаются в генеральную совокупность, а потому для остальных величин последней повышается вероятность попадания в следующую выборку.

Бесповторный отбор дает более точные результаты, поэтому применяется чаще. Но есть ситуации, когда его применить нельзя (изучение пассажиропотоков, потребительского спроса и т.п.) и тогда ведется повторный отбор.

 

Ошибки выборки

Выборочную совокупность можно сформировать по количественному признаку статистических величин, а также по альтернативному или атрибутивному. В первом случае обобщающей характеристикой выборки служит выборочная средняя величина, обозначаемая Выборочная средняя, а во втором — выборочная доля величин, обозначаемая w. В генеральной совокупности соответственно:генеральная средняя Генеральная средняя и генеральная доля р.

Разности http://chaliev.ru/statistics/images/vyborochnoe-nablyudenie_clip_image002_0000.gif  http://chaliev.ru/statistics/images/vyborochnoe-nablyudenie_clip_image004_0000.gif и W  р называются ошибкой выборки, которая делится на ошибку регистрации и ошибку репрезентативности. Первая часть ошибки выборки возникает из-за неправильных или неточных сведений по причинам непонимания существа вопроса, невнимательности регистратора при заполнении анкет, формуляров и т.п. Она достаточно легко обнаруживается и устраняется. Вторая часть ошибки возникает из-за постоянного или спонтанного несоблюдения принципа случайности отбора. Ее трудно обнаружить и устранить, она гораздо больше первой и потому ей уделяется основное внимание.

Величина ошибки выборки может быть разной для разных выборок из одной генеральной совокупности, поэтому в статистике определяется средняя ошибка повторной и бесповторной выборки по формулам:

Средняя ошибка повторной выборки- повторная;

Средняя ошибка бесповторной выборки- бесповторная;

где Дв — выборочная дисперсия.

Например, на заводе с численностью работников 1000 чел. проведена 5%-ая случайная бесповторная выборка с целью определения среднего стажа работников. Результаты выборочного наблюдения приведены в первых двух столбцах следующей таблицы:

X, лет
(стаж работы)

 

f, чел.
(число работников в выборке)

 

Xи

 

Xиf

 

http://chaliev.ru/statistics/images/vyborochnoe-nablyudenie_clip_image002_0015.gif

До 1

7

0,5

3,5

38,987

1-2

8

1,5

12,0

14,797

2-3

10

2,5

25,0

1,296

3-4

12

3,5

45,5

5,325

4-5

9

4,5

40,5

24,206

Более 5

3

5,5

16,5

20,909

ИТОГО

50

 

143

105,520

 

 

В 3-м столбце определены середины интервалов X (как полусумма нижней и верхней границ интервала), а в 4-м столбце - произведения XИf для нахождения выборочной средней по формуле средней арифметической взвешенной:

выборочная средняя
 = 143,0/50 = 2,86 (года).

Рассчитаем выборочную дисперсию взвешенную:
Расчет выборочной дисперсии
 = 105,520/50 = 2,110.

Теперь найдем среднюю ошибку бесповторной выборки:
расчет средней ошибки бесповторной выборки
 = 0,200 (лет).

 

Из формул средних ошибок выборки видно, что ошибка меньше при бесповторной выборке, и, как доказано в теории вероятностей, она возникает с вероятностью 0,683 (то есть если провести 1000 выборок из одной генеральной совокупности, то в 683 из них ошибка не превзойдет средней ошибки выборки). Такая вероятность (0,683) является невысокой, поэтому она мало пригодна для практических расчетов, где нужна более высокая вероятность. Чтобы определить ошибку выборки с более высокой, чем 0,683 вероятностью, рассчитываютпредельную ошибку выборки:

предельная ошибка выборки

где t – коэффициент доверия, зависящий от вероятности, с которой определяется предельная ошибка выборки.

Значения коэффициента доверия t рассчитаны для разных вероятностей и имеются в специальных таблицах (интеграл Лапласа), из которых в статистике широко применяются следующие сочетания:

 

вероятностьВероятность

t

0,683

1

0,866

1,5

0,950

1,96

0,954

2

0,988

2,5

0,990

2,58

0,997

3

0,999

3,5

 

Задавшись конкретным уровнем вероятности, выбирают из таблицы соответствующую ей величину t и определяют предельную ошибку выборки по формуле.

При этом чаще всего применяют http://chaliev.ru/statistics/images/vyborochnoe-nablyudenie_clip_image002_0005.gif = 0,95 и t= 1,96, то есть считают, что с вероятностью 95% предельная ошибка выборки в 1,96 раза больше средней.

Такая вероятность (0,95) считаетсястандартной и применяется по умолчанию в расчетах.

В нашем примере про средний стаж работников, определим предельную ошибку выборки при стандартной 95%-ой вероятности (из таблицы берем t = 1,96 для 95%-ой вероятности): Расчет предельной ошибки выборки = 1,96*0,200 = 0,392 (года).

После расчета предельной ошибки находят доверительный интервал обобщающей характеристики генеральной совокупности. Такой интервал для генеральной средней величины имеет вид 

доверительный интервал генеральной средней

а для генеральной доли аналогично:

доверительный интервал генеральной доли.

 

Следовательно, при выборочном наблюдении определяется не одно, точное значение обобщающей характеристики генеральной совокупности, а лишь ее доверительный интервалс заданным уровнем вероятности. И это серьезный недостаток выборочного методастатистики.

В нашем примере про средний стаж работников, определим доверительный интервал генеральной средней - среднего стажа работников:
2,86 - 0,392
 http://chaliev.ru/statistics/images/vyborochnoe-nablyudenie_clip_image002_0025.gif 2,86 + 0,392 или 2,468 лет http://chaliev.ru/statistics/images/vyborochnoe-nablyudenie_clip_image002_0026.gif3,252 лет.

То есть средний стаж работников на всем заводе лежит в интервале от 2,468 года до 3,252 года.


Практическое занятие №7

Выборочное наблюдение (2 часа).

 

Методические указания по теме

Задача 1. На предприятии в порядке случайной бесповторной выборки было опрошено 100 рабочих из 1000 и получены следующие данные об их доходе за месяц:

 

Доход, у.е.

до 300

300-500

500-700

700-1000

более 1000

Число рабочих

8

28

44

17

3

 

С вероятностью 0,950 определить:

1) среднемесячный размер дохода работников данного предприятия;

2) долю рабочих предприятия, имеющих месячный доход более 700 у.е.;

3) необходимую численность выборки при определении среднемесячного дохода работников предприятия, чтобы не ошибиться более чем на 50 у.е.;

4) необходимую численность выборки при определении доли рабочих с размером месячного дохода более 700 у.е., чтобы при этом не ошибиться более чем на 5%.

Решение. Выборочный метод (выборка) используется, когда применение сплошного наблюдения физически невозможно из-за огромного массива данных или экономической нецелесообразности. Учитывая, что на основе выборочного обследования нельзя точно оценить изучаемый параметр (например, среднее значение –  или долю какого-то признака – р) генеральной совокупности, необходимо найти пределы, в которых он находится. Для этого необходимо определить изучаемый параметр по данным выборки (выборочную среднюю – и/или выборочную долю – w) и его дисперсию (Дв). Для этого построим вспомогательную таблицу 3.

 

 

 

 

Таблица 3.

Вспомогательные расчеты для решения задачи

 

Xi

fi

ХИ

XИfi

И -)2

И -)2fi

до 300

8

200

1600

137641

1101128

300 - 500

28

400

11200

29241

818748

500 - 700

44

600

26400

841

37004

700 - 1000

17

850

14450

77841

1323297

более 1000

3

1150

3450

335241

1005723

Итого

100

 

57100

 

4285900

 

По формуле (18) получим средний доход в выборке: = 57100/100 = 571 (у.е.). Применив формулу (33) и рассчитав ее числитель в последнем столбце таблицы, получим дисперсию среднего выборочного дохода: Дв = 4285900/100 = 42859.

Затем необходимо определить предельную ошибку выборки по формуле (39)[1]:

 = t,(39)

где tкоэффициент доверия, зависящий от вероятности, с которой определяется предельная ошибка выборки;средняя ошибка выборки, определяемая для повторной выборки по формуле (40), а для бесповторной – по формуле (41):

*= ,               (40)                                             *= ,                       (41)

где n – численность выборки; N – численность генеральной совокупности.

В нашей задаче выборка бесповторная, значит, применяя формулу (41), получим среднюю ошибку выборки при определении среднего возраста в генеральной совокупности: *= = 19,640 (у.е.).

Для определения средней ошибки выборки при определении доли рабочих с доходами более 700 у.е. в генеральной совокупности необходимо определить дисперсию этой доли. Дисперсия доли альтернативного признака w (признак, который может принимать только два взаимоисключающих значения – например, больше или меньше определенного значения) определяется по формуле (42):

.(42)

В нашей задаче долю альтернативного признака (рабочие с доходами более 700 у.е.) найдем как отношение числа таких рабочих к общему числу рабочих в выборке: w = 20/100 = 0,2 или 20%. Теперь определим дисперсию этой доли по формуле (42): =0,2*(1-0,2) = 0,16. Теперь можно рассчитать среднюю ошибку выборки по формуле (41): *= = 0,038 или 3,8%.

Значения вероятности * и коэффициента доверия t имеются в математических таблицах нормального закона распределения вероятностей (если в выборке более 30 единиц), из которых в статистике широко применяются сочетания, приведенные в таблице 4:

Таблица 4.

Значения интеграла вероятностей Лапласа

 

*

0,683

0,866

0,950

0,954

0,988

0,997

t

1

1,5

1,96

2

2,5

3

 

В нашей задаче * = 0,950, значит t = 1,96 (то есть предельная ошибка выборки в 1,96 раза больше средней). Предельная ошибка выборки по формуле (39) будет равна:  = 1,96*19,64 = 38,494 (у.е.) при определении среднего дохода;  = 1,96*0,038 = 0,075 или 7,5% при определении доли рабочих с доходами более 700 у.е.

После расчета предельной ошибки находят доверительный интервал обобщающей характеристики генеральной совокупности по формуле (43) – для средней величины и по формуле (44) – для доли альтернативного признака:

(-)(+)               (43)                              (w-)p(w +)           (44)

В нашей задаче по формуле (43): 571-38,494571+38,494 или 532,506 у.е.  609,494 у.е., то есть средний доход всех рабочих предприятия с вероятностью 95% будет лежать в пределах от 532,5 до 609,5 у.е.

Аналогично определяем доверительный интервал для доли по формуле (44): 0,2-0,075p0,2+0,075 или 0,125p0,275, то есть доля рабочих с доходами более 700 у.е. на всем предприятии с вероятностью 95% будет лежать в пределах от 12,5% до 27,5%.

При разработке программы выборочного наблюдения очень часто задается конкретное значение предельной ошибки () и уровень вероятности (*). Неизвестной остается минимальная численность выборки (n), обеспечивающая заданную точность. Ее можно получить, если подставить формулу (40) или (41) в формулу (39) и выразить из них n. В результате получатся формулы для вычисления необходимой численности повторной (45) и бесповторной (46) выборок.

nповт = ;            (45)                                       nб/повт =.                  (46)

В нашей задаче выборка бесповторная, значит, воспользуемся формулой (46), в которую подставим уже рассчитанные дисперсии среднего выборочного дохода рабочих (Дв = 42859) и доли рабочих с доходами более 700 у.е. (Дв = 0,16):

nб/повт == 62 (чел.),         nб/повт= = 197 (чел.).

Таким образом, необходимо включить в выборку не менее 62 рабочих при определении среднего месячного дохода работников предприятия, чтобы не ошибиться более чем на 50 у.е., и не менее 197 рабочих при определении доли рабочих с размером месячного дохода более 700 у.е., чтобы при этом не ошибиться более чем на 5%.

Контрольные задания по практическому занятию

Для изучения вкладов населения в коммерческом банке города была проведена 5%-я случайная выборка лицевых счетов, в результате которой получено следующее распределение клиентов по размеру вкладов:

Размер вклада, у.е.

Число вкладчиков, чел.

Вариант

1

2

3

4

5

6

7

8

9

10

до 5000

10

80

100

50

60

30

90

20

70

40

5 000 – 15 000

40

60

150

30

40

110

75

65

90

80

15 000 – 30 000

25

35

70

90

120

90

130

140

60

95

30 000 – 50 000

30

45

40

5

80

30

60

75

20

115

свыше 50 000

15

10

30

25

50

15

25

5

10

5

С вероятностью 0,954 определить:

1) средний размер вклада во всем банке;

2) долю вкладчиков во всем банке с размером вклада свыше 15000 у.е.;

3) необходимую численность выборки при определении среднего размера вклада, чтобы не ошибиться более чем на 500 у.е.;

4) необходимую численность выборки при определении доли вкладчиков во всем банке с размером вклада свыше 30 000 у.е., чтобы не ошибиться более чем на 10%.

 

Внеаудиторная самостоятельная работа (4 часа)

Задание 1. Письменно ответить на вопросы

1. Преимущества выборочного наблюдения перед сплошным.

2. Дать определение понятий: ошибка наблюдения, ошибка регистрации, ошибка репрезентативности, максимально возможная ошибка.

3. Условия правильного отбора единиц совокупности при выборочном наблюдении.

4. Генеральная и выборочная совокупности.

5. Различия между повторной и бесповторной выборками.

6. Формулы взаимосвязи средней и предельной ошибки выборки.

7. Формулы расчета средней ошибки при повторном и бесповторном отборе.

8. Неравенства, устанавливающие возможные пределы, в которых будут находиться характеристики генеральной совокупности.

9. Формулы для расчета необходимого объема выборки.

10. Сущность теорем П.Л. Чебышева и А.М. Ляпунова.

11. Распространение результатов выборочного наблюдения на генеральную совокупность.

 

Задание 2. Решить тест
1. Совокупность, из которой производится отбор единиц для выборочного наблюдения называется:

а) выборочной; б) генеральной; в) однородной; г) свой ответ.

2. Виды ошибок статистических наблюдений:

а) регистрации; б) систематические; в) случайные; г) репрезентативности;

3. По методу отбора различают:

а) бесповторный отбор; б) случайный отбор; в) повторный отбор;

4. Если количество единиц в совокупности меньше 30, то выборка считается:

а) большой; б) малой; в) средней; г) нет верного ответа.

5. Виды выборок:

а) случайная; б) типическая; в) механическая; г) групповая.

6. При 6%-ой выборке из партии деталей в 600 ед. объем выборки n составляет:

а) 54 ед; б) 36 ед; в) 46 ед.

7. Для характеристики надежности выборочных показателей различают следующие виды ошибок выборки:

а) среднюю; б) случайную; в) предельную; г) репрезентативности.

8. Размер средней ошибки выборки зависит от:

а) объема выборки; б) однородности совокупности; в) ассиметрии;

г) степени варьирования изучаемого признака.

9. Чем больше численность выборки при прочих равных условиях, тем величина средней ошибки выборки:

а) больше; б) меньше; в) точнее г) свой ответ.

10. Чем больше вариация признака, тем ______ средняя ошибка выборки:

а) больше; б) меньше; в) точнее; г) свой ответ.

11. Средняя ошибка выборки показывает __________.

12. Средняя ошибка выборки имеет единицы измерения:

а) что и количественный признак;

б) не имеет единиц измерения;

в) представлена коэффициентом;

г) в процентах.

13. Для отбора единиц из неоднородной совокупности применяется:

а) типическая выборка;

б) механическая выборка;

в) собственно-случайная выборка;

г) серийная выборка.

14. Отбор единиц из генеральной совокупности посредством жеребьевки или какого-либо иного подобного способа – это:

а) типическая выборка;

б) механическая выборка;

в) собственно-случайная выборка;

г) серийная выборка.

15. Доверительные интервалы (пределы) для средней ___________.

 

Тема 8. Статистические методы изучения взаимосвязей социально-экономических явлений

 

Методические указания по теме

             По условным данным таблицы 10 о стоимости основных фондов х и валовом выпуске продукции у (в порядке возрастания стоимости основных фондов) выявить наличие и характер корреляционной связи между признаками x и y.

 

Таблица 1.

Стоимость основных фондов и валовой выпуск по 10 однотипным предприятиям

 

Предприятия

i

Основные производственные

фонды, млн. руб.

xi

Валовой выпуск

продукции, млн. руб.

yi

1

2

3

4

5

6

7

8

9

10

12

16

25

38

43

55

60

80

91

100

28

40

38

65

80

101

95

125

183

245

+

+

+

+

+

+

+

+

+

Итого

520

1000

 

 

Решение. Для выявления наличия и характера корреляционной связи между двумя признаками в статистике используется ряд методов.

 

1. Графический метод, когда корреляционную зависимость для наглядности можно изобразить графически. Для этого, имея n взаимосвязанных пар значений x и y и пользуясь прямоугольной системой координат, каждую такую пару изображают в виде точки на плоскости с координатами x и y. Соединяя последовательно нанесенные точки, получают ломаную линию, именуемую эмпирической линией регрессии (см. рисунок справа). Анализируя эту линию, визуально можно определить характер зависимости между признаками x и y. В нашей задаче эта линия похожа на восходящую прямую, что позволяет выдвинуть гипотезу о наличии прямой зависимости между величиной основных фондов и валовым выпуском продукции.

 

2. Рассмотрение параллельных данных (значений x и y в каждой из n единиц). Единицы наблюдения располагают по возрастанию значений факторного признака х и затем сравнивают с ним (визуально) поведение результативного признака у. В нашей задаче в большинстве случаев по мере увеличения значений x увеличиваются и значения y (за несколькими исключениями – 2 и 3, 6 и 7 предприятия), поэтому, можно говорить о прямой связи между х и у (этот вывод подтверждает и эмпирическая линия регрессии). Теперь необходимо ее измерить, для чего рассчитывают несколько коэффициентов.

 

3. Коэффициент корреляции знаков (Фехнера) – простейший показатель тесноты связи, основанный на сравнении поведения отклонений индивидуальных значений каждого признака (x и y) от своей средней величины. При этом во внимание принимаются не величины отклонений () и (), а их знаки («+» или «–»). Определив знаки отклонений от средней величины в каждом ряду, рассматривают все пары знаков и подсчитывают число их совпадений (С) и несовпадений (Н). Тогда коэффициент Фехнера рассчитывается как отношение разности чисел пар совпадений и несовпадений знаков к их сумме, т.е. к общему числу наблюдаемых единиц:

.(82)

Очевидно, что если знаки всех отклонений по каждому признаку совпадут, то КФ=1, что характеризует наличие прямой связи. Если все знаки не совпадут, то КФ=–1(обратная связь). Если же åС=åН, то КФ=0. Итак, как и любой показатель тесноты связи, коэффициент Фехнера может принимать значения от 0 до 1. Однако, если КФ=1, то это ни в коей мере нельзя воспринимать как свидетельство функциональной зависимости между х и у.

В нашей задаче ; .

В двух последних столбцах таблицы 10 приведены знаки отклонений каждого х и у от своей средней величины. Число совпадений знаков – 9, а несовпадений – 1. Отсюда КФ==0,8. Обычно такое значение показателя тесноты связи характеризует сильную зависимость, однако, следует иметь в виду, что поскольку КФ зависит только от знаков и не учитывает величину самих отклонений х и у от их средних величин, то он практически характеризует не столько тесноту связи, сколько ее наличие и направление.

 

4.Линейный коэффициент корреляции применяется в случае линейной зависимости между двумя количественными признаками x и y. В отличие от КФ в линейном коэффициенте корреляции учитываются не только знаки отклонений от средних величин, но и значения самих отклонений, выраженные для сопоставимости в единицах среднего квадратического отклонения t:

            и          .

Линейный коэффициент корреляции r представляет собой среднюю величину из произведений нормированных отклонений для x и у:

,              (83)                        или            .          (84)

Числитель формулы (84), деленный на n, т.е. , представляет собой среднее произведение отклонений значений двух признаков от их средних значений, именуемое ковариацией. Поэтому можно сказать, что линейный коэффициент корреляции представляет собой частное от деления ковариации между х и у на произведение их средних квадратических отклонений. Путем несложных математических преобразований можно получить и другие модификации формулы линейного коэффициента корреляции, например:

.(85)

Линейный коэффициент корреляции может принимать значения от –1 до +1, причем знак определяется в ходе решения. Например, если , то r по формуле (85) будет положительным, что характеризует прямую зависимость между х и у, в противном случае (r<0) – обратную связь. Если , то r=0, что означает отсутствие линейной зависимости между х и у, а при r=1 – функциональная зависимость между х и у. Следовательно, всякое промежуточное значение r от 0 до 1 характеризует степень приближения корреляционной связи между х и у к функциональной. Таким образом, коэффициент корреляции при линейной зависимости служит как мерой тесноты связи, так и показателем, характеризующим степень приближения корреляционной зависимости между х и у к линейной. Поэтому близость значения r к 0 в одних случаях может означать отсутствие связи между х и у, а в других свидетельствовать о том, что зависимость не линейная.

В нашей задаче для расчета rпостроим вспомогательную таблицу 2.

 

Таблица2.

Вспомогательные расчеты линейного коэффициента корреляции

 

i

xi

yi

tx

ty

tx ty

1

12

28

1600

5184

-1,36526

-1,10032

1,502223

288

33,6

2

16

40

1296

3600

-1,22873

-0,91693

1,126667

216

64

3

25

38

729

3844

-0,92155

-0,9475

0,873167

167,4

95

4

38

65

196

1225

-0,47784

-0,53488

0,255587

49

247

5

43

80

81

400

-0,30718

-0,30564

0,093889

18

344

6

55

101

9

1

0,102394

0,015282

0,001565

0,3

555,5

7

60

95

64

25

0,273052

-0,07641

-0,02086

-4

570

8

80

125

784

625

0,955681

0,382056

0,365124

70

1000

9

91

183

1521

6889

1,331128

1,268425

1,688436

323,7

1665,3

10

100

245

2304

21025

1,638311

2,215924

3,630373

696

2450

Итого

520

1000

8584

42818

 

 

9,516166

1824,4

7024,4

 

В нашей задаче: = =29,299; ==65,436. Тогда по формуле (83)r = 9,516166/10 =  0,9516. Аналогичный результат получаем по формуле (84): r = 1824,4/(29,299*65,436) = 0,9516 или по формуле (85): r = (7024,4 – 52*100) / (29,299*65,436) = 0,9516, то есть связь между величиной основных фондов и валовым выпуском продукции очень близка к функциональной.

Проверка коэффициента корреляции на значимость (существенность). Интерпретируя значение коэффициента корреляции, следует иметь в виду, что он рассчитан для ограниченного числа наблюдений и подвержен случайным колебаниям, как и сами значения x и y, на основе которых он рассчитан. Другими словами, как любой выборочный показатель, он содержит случайную ошибку и не всегда однозначно отражает действительно реальную связь между изучаемыми показателями. Для того, чтобы оценить существенность (значимость) самого r и, соответственно, реальность измеряемой связи между х и у, необходимо рассчитать среднюю квадратическую ошибку коэффициента корреляции σr. Оценка существенности (значимости) r основана на сопоставлении значения r с его средней квадратической ошибкой: .

Существуют некоторые особенности расчета σr в зависимости от числа наблюдений (объема выборки) – n.

1.      Если число наблюдений достаточно велико (n>30), то σr рассчитывается по формуле (86):

.(86)

Обычно, если >3, то r считается значимым (существенным), а связь – реальной. Задавшись определенной вероятностью, можно определить доверительные пределы (границы)r = (*), где t – коэффициент доверия, рассчитываемый по интегралу Лапласа (см. таблицу 4).

2.      Если число наблюдений небольшое (n<30), то σr рассчитывается по формуле (87):

,(87)

а значимость r проверяется на основе t-критерия Стьюдента, для чего определяется расчетное значение критерия по формуле (88) и сопоставляется ctТАБЛ.

.(88)

Табличное значение tТАБЛ находится по таблице распределения t-критерия Стьюдента (см. приложение 2) при уровне значимости α=1-β и числе степеней свободы ν=n–2. Если tРАСЧ>tТАБЛ ,то r считается значимым, а связь между х и у – реальной. В противном случае (tРАСЧ<tТАБЛ) считается, что связь между х и у отсутствует, и значение r, отличное от нуля, получено случайно.

В нашей задаче число наблюдений небольшое, значит, оценивать существенность (значимость) линейного коэффициента корреляции будем по формулам (87) и (88): = 0,3073/2,8284 = 0,1086; = 0,9516/0,1086 = 8,7591. При вероятности 95% tтабл=2,306, а при вероятности 99% tтабл=3,355, значит, tРАСЧ>tТАБЛ, что дает возможность считать линейный коэффициент корреляции r= 0,9516 значимым.

 

5. Подбор уравнения регрессии представляет собой математическое описание изменения взаимно коррелируемых величин по эмпирическим (фактическим) данным. Уравнение регрессии должно определить, каким будет среднее значение результативного признака у при том или ином значении факторного признака х, если остальные факторы, влияющие на у и не связанные с х, не учитывать, т.е. абстрагироваться от них. Другими словами, уравнение регрессии можно рассматривать как вероятностную гипотетическую функциональную связь величины результативного признака у со значениями факторного признака х.

Уравнение регрессии можно также назвать теоретической линией регрессии. Рассчитанные по уравнению регрессии значения результативного признака называются теоретическими.Они обычно обозначаются (читается: «игрек, выравненный по х») и рассматриваются как функция от х, т.е. = f(x). (Иногда для простоты записи вместо пишут .)

Найти в каждом конкретном случае тип функции, с помощью которой можно наиболее адекватно отразить ту или иную зависимость между признаками х и у, — одна из основных задач регрессионного анализа. Выбор теоретической линии регрессии часто обусловлен формой эмпирической линии регрессии; теоретическая линия как бы сглаживает изломы эмпирической линии регрессии. Кроме того, необходимо учитывать природу изучаемых показателей и специфику их взаимосвязей.

Для аналитической связи между х и у могут использоваться следующие простые виды уравнений:

– прямая линия;                         – парабола;

 – гипербола;                               – показательная функция;

– логарифмическая функция и др.

Обычно зависимость, выражаемую уравнением прямой, называют линейной (или прямолинейной), а все остальные — криволинейными зависимостями.

Выбрав тип функции, по эмпирическим данным определяют параметры уравнения. При этом отыскиваемые параметры должны быть такими, при которых рассчитанные по уравнению теоретические значения результативного признака были бы максимально близки к эмпирическим данным.

Существует несколько методов нахождения параметров уравнения регрессии. Наиболее часто используется метод наименьших квадратов (МНК). Его суть заключается в следующем требовании: искомые теоретические значения результативного признака должны быть такими, при которых бы обеспечивалась минимальная сумма квадратов их отклонений от эмпирических значений, т.е.

.

Поставив данное условие, легко определить, при каких значениях ,  и т.д. для каждой аналитической кривой эта сумма квадратов отклонений будет минимальной. Данный метод уже использовался нами в методических указаниях к теме 4 «Ряды динамики», поэтому, воспользуемся формулой (57)для нахождения параметров теоретической линии регрессии в нашей задаче, заменив параметр t на x.

(89)

Исходные данные и все расчеты необходимых сумм представим в таблице 3.

 

Таблица 3.

Вспомогательные расчеты для решения задачи

 

i

x

y

x*x

y*x

y'

1

12

28

144

336

15

5184

7225

2

16

40

256

640

23,5

3600

5852,25

3

25

38

625

950

42,625

3844

3291,891

4

38

65

1444

2470

70,25

1225

885,0625

5

43

80

1849

3440

80,875

400

365,7656

6

55

101

3025

5555

106,375

1

40,64063

7

60

95

3600

5700

117

25

289

8

80

125

6400

10000

159,5

625

3540,25

9

91

183

8281

16653

182,875

6889

6868,266

10

100

245

10000

24500

202

21025

10404

Итого

520

1000

35624

70244

1000

42818

38762,125

 

;       ;       ;

 

;      ;   ;   =100–52*2,125 = – 10,5.

Отсюда искомая линия регрессии:=–10,5+2,125x. Для иллюстрации построим график эмпирической (маркеры-кружочки) и теоретической (маркеры-квадратики) линий регрессии.

Рис.6. График эмпирической и теоретической линий регрессии.

 

6. Теоретическое корреляционное отношение представляет собой универсальный показатель тесноты связи. Измерить тесноту связи между коррелируемыми величинами – это значит определить, насколько вариация результативного признака обусловлена вариацией факторного признака. Ранее были рассмотрены показатели, с помощью которых можно выявить наличие корреляционной связи между двумя признаками x и y и измерить тесноту этой связи: коэффициент Фехнера и линейный коэффициент корреляции.

Наряду с ними существует универсальный показатель – корреляционное отношение (или коэффициент корреляции по Пирсону), применимое ко всем случаям корреляционной зависимости независимо от формы этой связи. Следует различать эмпирическое и теоретическое корреляционные отношения. Эмпирическое корреляционное отношениерассчитывается на основе правила сложения дисперсий как корень квадратный из отношения межгрупповой дисперсии к общей дисперсии, т.е.

.(90)

Теоретическое корреляционное отношение  определяется на основе выравненных (теоретических) значений результативного признака , рассчитанных по уравнению регрессии.  представляет собой относительную величину, получаемую в результате сравнения среднего квадратического отклонения в ряду теоретических значений результативного признака со средним квадратическим отклонением в ряду эмпирических значений. Если обозначить дисперсию эмпирического ряда игреков через , а теоретического ряда – , то каждая из них выразится формулами:

,(91)

.(92)

Сравнивая вторую дисперсию с первой, получим теоретический коэффициент детерминации:

,(93)

который показывает, какую долю в общей дисперсии результативного признака занимает дисперсия, выражающая влияние вариации фактора x на вариацию y. Извлекая корень квадратный из коэффициента детерминации, получаем теоретическое корреляционное отношение:

.(94)

Оно может находиться в пределах от 0 до 1. Чем ближе его значение к 1, тем теснее связь между вариацией y и x. При <0,3 говорят о малой зависимости между коррелируемыми величинами, при 0,3<<0,6 – о средней, при 0,6<<0,8 – о зависимости выше средней, при >0,8 – о большой, сильной зависимости. Корреляционное отношение применимо как для парной, так и для множественной корреляции независимо от формы связи. При линейной зависимости .

В нашей задаче расчет необходимых сумм для использования в формуле (93) приведен в последних двух столбцах таблицы 12. Тогда теоретический коэффициент детерминации по формуле (93) равен:2теор = 38762,125 / 42818 = 0,9053, то есть дисперсия, выражающая влияние вариации фактора x на вариацию y, составляет 90,53%.

Теоретическое корреляционное отношение по формуле (94) равно: теор== 0,9515, что совпадает со значением линейного коэффициента корреляции и, следовательно, можно говорить о большой, сильной зависимости между коррелируемыми величинами.

 


Практическое занятие  (2 часа)

 

Задание 1. На основе исходных данных определить наличие и характер корреляционной связи между признаками x и y 6-ю методами.

При-знак

Вариант

1

2

3

4

5

6

7

8

9

10

x

Рост

Доход

Возраст

IQ

Доход

Возраст

рост/вес

Стаж

Доход

IQ

y

Вес

Вес

Доход

Доход

Тетрадь

рост/вес

Кол-во друзей

Доход

Кол-во друзей

Время решения

 

Внеаудиторная самостоятельная работа (6часов)

Задание 1.                                                                                                                                                                                                                                                                                                                                                                                                          

1.      Составить глоссарий по дисциплине Статистика

2.      Составить итоговый кроссворд по темам дисциплины

3.      Решить тест.

        1. К современным значениям термина «статистика» не относится:

а) отрасль практической деятельности людей, по сбору, обработки и анализу данных, характеризующих состояние экономики и культуры страны

б) общественная наука, разрабатывающая теоретические положения и методы, используемые статистической практикой

в) статистические данные, представляемые в отчетности предприятий

г) обследование нелегальных видов деятельности

        2. К основным стадиям экономико-статистических исследований не относится:

а) планирование и организация

б) сбор информации методом массового статистического наблюдения

в) обработка информации методом статистических группировок

г)анализ статистической информации на основе расчета обобщающих статистических показателей абсолютных, относительных и средних величин

        3. Статистической информаций является:

а) расчетный материал

б) первичный статистический материал о социально-экономических явлениях, формирующийся в процессе статистического наблюдения, которые, затем подвергается систематизации, сводке, анализу и обобщению

в) вариационный ряд распределения

г) обработанный материал

         4. Основные свойства статистической информации:

а) постоянство и незаконность

б) периодичность динамичность

в) массовость и стабильность

г) единовременность

       5 Статистическим наблюдением является:

а) научно организованный сбор информации о моментных процессах

б) научно организованный сбор информации о стабильных процессах

в) научно организованный сбор информации о массовых общественных явлениях и процессах общественной жизни

г) научно организованный сбор информации об единичных явлениях

        6. Статистическое наблюдение не может проводиться:

а) органами государственной статистики

б) научно-исследовательскими институтами

в) экономическими службами банков, бирж, фирм

г) частными лицами

         7. Основные формы статистического наблюдения:

а) отчетность и специально организованные наблюдения

б) отчетность и атрибутивные ряды распределения

в) вариационные ряды распределения и специально организованные наблюдения

г) выборочные и специально организованные наблюдения

         8. Специально организованное статистическое наблюдение это…

а) сбор сведений с помощью специально организованных переписей, единовременных учетов и обследований

б) сбор сведений с помощью опроса только менеджеров предприятий

в) сбор сведений о деятельности только строительных организаций

г) сбор сведений о деятельности только домашних хозяйств

         9. Какая форма не является специально организованным наблюдением?

а) отчетность

б) мониторинг

в) бизнес-обследование

г) перепись остатков сырья и материалов

         10. Какие отчетные документы деятельности предприятия представляются в органы государственной статистики?

а) декларация по страховым взносам на обязательное пенсионное страхование

б) расчетная ведомость по средствам фонда социального страхования

в) баланс и отчет о прибылях и убытках

г) сведения о затратах на производство и продажу продукции

           11. Статистический ряд распределения это…

а) бессистемное распределение единиц изучаемой совокупности

б) упорядоченное распределение единиц изучаемой совокупности на группы по определенному варьирующему признаку

в) хаотичное распределение единиц изучаемой совокупности

г) упорядоченное распределение единиц изучаемой совокупности по баллам

           12. Как называется ряд распределения, построенный по качественному признаку?

а) дискретный

б) атрибутивный

в) вариационный

г) интервальный

           13. В чем отличие дискретного ряда распределения от интервального?

а) варианты имеют значения целых чисел

б) варианты имеют значения дробных чисел

в) варианты имеют значения отрицательных чисел

г) варианты имеют значения комплексных чисел

           14. Какие показатели не входят в состав обобщающих показателей?

а) абсолютные показатели

б) относительные показатели

в) средние величины

г) атрибутивные показатели

           15. К какому классу относятся средняя арифметическая, средняя гармоническая, средняя геометрическая?

а) к классу структурных средних

б) к классу порядковых средних

в) к классу степенных средних

г) к классу промежуточных средних.

           16. Понятие средней величины.

а) обобщающий показатель, характеризующий структурные сдвиги

б) частный показатель, характеризующий индекс цен

в) частный показатель, характеризующий развитие явления

г) обобщающий показатель, характеризующий типичный уровень явления в конкретных условиях места и времени

            17. Основное условие правильного расчета средних величин.

а) рассчитываются для качественно однородных совокупностей

б) рассчитываются для разнокачественных совокупностей

в) рассчитываются для качественно не однородных совокупностей

г) рассчитываются для разнородных совокупностей по существенным признакам

          18. Связана ли доходность финансовой операции с риском при проведении этой операции:

а) никак не связана

б) чем больше риск, тем меньше доходность

в) чем больше риск, тем больше доходность

г) независимо от риска доходность остается постоянной

           19. Обозначение 365/365 означает:

а) обыкновенные проценты с приблизительным числом дней предоставления ссуды

б) точные проценты с приблизительным числом дней предоставления ссуды

в) точные проценты с точным числом дней предоставления ссуды

г) обыкновенные проценты с точным числом дней предоставления ссуды

            20. Сравнительная эффективность финансовых операций с использованием сложных процентов может быть выявлена с помощью:

а) эффективных ставок;

б) номинальных ставок;

в) любых из упомянутых ставок;

г) номинальных ставок, если речь идет о краткосрочных операциях.

            21. Точные проценты определяются исходя из:

а) точного числа дней в году

б) точного числа дней предоставления ссуды

в) точного числа дней в году и приблизительного числа дней предоставления ссуды

г) точного числа дней предоставления ссуды и приблизительного числа дней в году

            22. Обыкновенные проценты определяются исходя из:

а) приблизительного числа дней предоставления ссуды

б) приблизительного числа дней в году

в) приблизительного числа дней в году и точного числа дней предоставления ссуды

г) приблизительного числа дней предоставления ссуды и точного числа дней в году         

            23. Денежный поток, каждый элемент которого относится к концу соответствующего временного интервала, называется:

а) потоком пренумерандо;

б) потоком постнумерандо;

в) потоком авансовым;

г) аннуитетом.

            24. Денежный поток, каждый элемент которого относится к началу

соответствующего временного интервала, называется:

а) потоком пренумерандо;

б) потоком постнумерандо;

в) потоком авансовым;

г) аннуитетом.

            25. Верно ли утверждение: «При учете влияния инфляции на начисление простых процентов необходимо инфляцию учитывать по сложным процентам»:

а) да; б)  нет

            26. Чтобы определить член аннуитета, достаточно знать:

а) приведенную стоимость аннуитета и его срок;

б) будущую стоимость аннуитета, его срок и ставку;

в) приведенную и будущую стоимости аннуитета;

г) срок аннуитета и ставку.

            27. Если продолжительность финансовой операции длится более п периодов начисления процентов, но менее (п+1) периодов начисления процентов, то для кредитора более выгодным является применение:

а) сложных процентов для целого числа базисных периодов и простых процентов для дробной части базисного периода;

б) сложных процентов для дробной части базисного периода и простых процентов для целого числа базисных периодов;

в) сложных процентов для всей операции;

г) простых процентов для всей операции.

            20. Если период p-срочного аннуитета один год, то это:

а) аннуитет с денежными поступлениями р раз в году;

б) аннуитет сроком р лет;

в) аннуитет, при оценке которого используется сложная процентная ставка с начислением процентов p раз за год;

г) аннуитет, при оценке которого используется сила роста.

            21. Средняя арифметическая простая величина равна:

а) сумме произведений вариантов признака и частот, деленной на сумму частот;

б) сумме всех значений признака, деленной на их число;

в) корню степени n из произведения n вариантов признака.

            22. Средняя арифметическая взвешенная величина равна:

а) сумме произведений вариантов признака и частот, деленной на сумму частот;

б) сумме всех значений признака, деленной на их число;

в) корню степени n из произведения n вариантов признака.

            23. Средняя геометрическая величина равна:

а) сумме произведений вариантов признака и частот, деленной на сумму частот;

б) сумме всех значений признака, деленной на их число;

в) корню степени n из произведения n вариантов признака.

            24. Среднее линейное отклонение характеризует:

а) среднее значение квадрата отклонений вариантов признака от средней величины;

б) среднее отклонение вариантов признака от средней величины;

в) квадратный корень из среднего квадрата отклонений.

            25. Дисперсия характеризует:

а) среднее значение квадрата отклонений вариантов признака от средней величины;

б) среднее отклонение вариантов признака от средней величины;

в) квадратный корень из среднего квадрата отклонений.

            26. Среднее квадратическое отклонение характеризует:

а) среднее значение квадрата отклонений вариантов признака от средней величины;

б) среднее отклонение вариантов признака от средней величины;

в) квадратный корень из среднего квадрата отклонений.

            27. Дисперсия признака равна 3600, коэффициент вариации равен 50%. Чему равна средняя величина признака?

а) 1200; б) 600; в) 300; г) 7200

            28. Значение признака, делящее данную совокупность на две равные части, в статистике называют

а) децилем; б) модой; в) медианой; г) квартилем

            29. .Колеблемость, многообразие, изменчивость значения признака у отдельных единиц совокупности называется:

а) разбросом

б) рассеиванием

в) множеством

г) вариацией

            30. Коэффициент вариации является ___________ показателем вариации

а) средним

б) абсолютным

в) относительным

г) натуральным

            31. Определите дисперсию признака, если средняя величина признака равна 2600, а коэффициент вариации равен 30%

а) 780; б) 608400; в) 7500; г) 751111

            32. Размахом вариации называется: ________ максимального и минимального значений признака

а) разность

б) произведение

в) сумма

г) частное от деления

            33. Средний квадрат отклонений индивидуальных значений признака от средней величины называется:

а)  размахом вариации

б) дисперсией

в) средним квадратическим отклонением

г) средним линейным отклонением

            34. Уровень однородности статистической совокупности определяется значением

а) размаха вариации

б) дисперсией

в) среднего квадратического отклонения

г) коэффициента вариации

            35. Абсолютные показатели вариации:

а) дисперсия

б) коэффициент вариации

в) размах вариации

г) среднее квадратическое отклонение

            36. Для значений признака: 3, 5, 6, 9, 11, 12, 13 мода равна

а) 9; б) 13; в) Отсутствует

            37. Для следующих значений признака: 3, 3, 3, 4, 4, 6, 7, 9, 9 мода равна

а) 4; б) 3; в) 9

            38. Имеется ряд распределения: Тарифный разряд рабочих: 2 3 4 5 6. Число рабочих: 8 16 17 12 7. Вид данного ряда:

а) интервальный; б) дискретный.

            39. К относительным показателям вариации относятся:

а) мода; б) медиана; в) размах; г) коэффициент вариации

            40. Медианой называется:

а) наиболее часто встречающееся значение признака в данном ряду

б) значение признака, делящее совокупность на две равные части

в) различие в значениях какого-либо признака у разных единиц данной совокупности в один и тот же период или момент времени

г) средняя взвешенная из варьирующих обратных значений признака

            41. Мода это:

а) Самое встречающееся значение признака в данном ряду

б) значение признака, разделяющее совокупность на 2 равные части

в) различие в значениях определенного признака у различных единиц данной совокупности в один и тот же период

г) средняя взвешенная из варьирующих обратных значений признака


Контрольные вопросы по темам

 

Тема 1. Предмет, метод и задачи статистики

1. Что является предметом статистического исследования?

2.Что является объектом статистического исследования?

3.Что такое единица и объём статистической совокупности?

4.Что является целью статистического исследования?

5.Назовите этапы статистического исследования.

 

Тема 2. Статистическое наблюдение

1.Какие виды статистического наблюдения вы знаете?

2.Какие способы собирания статистических сведений вы знаете?

3.Какие программно-методологические вопросы плана статистического наблюдения вы знаете?

4.Какие организационные вопросы плана статистического наблюдения вы знаете?

5.Какую статистическую отчетность, принципы ее организации, программа и виды вы знаете?

6.Как организовывается перепись и другие виды специально организованных статистических наблюдений?

7.В чём суть статистического наблюдения?

8.Назовите этапы статистического наблюдения.

9.Каковы организационные формы статистического наблюдения?

 

Тема 3. Статистическая сводка и группировка

1.Какие погрешности (ошибки) статистического наблюдения существуют?

2.Какие методы проверки достоверности статистических данных вы знаете?

3.Что такое сводка, как вторая стадия статистического исследования. Ее задачи, программа, план и техника?

4.Что такое группировка, ее задачи и виды?

5.Какие методологические вопросы построения группировок вы знаете?

6.Какие важнейшие группировки и классификации, применяемые в статистике вы знаете?

 

Тема 4. Графическое представление статистической информации

1.Что такое статистическая таблица?

2.Назовите основные виды статистических таблиц.

3.Что такое статистический график?

4.Назовите основные виды статистических графиков по поставленным задачам.

Назовите основные виды статистических графиков по форме графического образа

 

Тема 5. Абсолютные, относительные и средние статистические показатели

1.Что такое абсолютная величина?

2.Назовите единицы изменения абсолютной величины.

3.Что такое относительная величина?

4.Назовите формы выражения и основные виды относительной величины

5.Какова сущность и значение средних величин?

6.Какие основные научные положения теории средних вы знаете?

7.Как найти определяющее свойство средней?

8.Средняя арифметическая, ее основные математические свойства и методы расчета.

9.Что такое средняя гармоническая и другие виды средних?

10.Что означает обусловленность выбора средней характером исходной информации?

11.Что значит мода и медиана, их смысл и значение в социально-экономических исследованиях, способы вычисления?

12.Что такое дисперсия альтернативного признака?

 

Тема 6. Показатели вариации

1.Какова сущность и значение средних величин?

2.Какие основные научные положения теории средних вы знаете?

3.Как найти определяющее свойство средней?

4.Средняя арифметическая, ее основные математические свойства и методы расчета.

5.Что такое средняя гармоническая и другие виды средних?

6.Что означает обусловленность выбора средней характером исходной информации?

7.Что значит мода и медиана, их смысл и значение в социально-экономических исследованиях, способы вычисления?

8.Что такое дисперсия альтернативного признака?

9.Чем объясняется необходимость изучения вариации признака?

10.Как рассчитываются основные показатели вариации?

 

Тема 7. Выборочное наблюдение

1.Какова сущность выборочного наблюдения и его теоретические основы?

2.Какие виды и способы отбора единиц в выборочную совокупность вы знаете?

3.Какие ошибки выборки и методы их расчета по среднему значению выборочного показателя и по доле признака выборочной совокупности вы знаете?

4.Каковы особенности выборочного наблюдения?

5.Назовите виды выборочного наблюдения.

6.Как исчислить предельную ошибку простой случайной выборки для средней величины признака?

7.Как исчислить предельную ошибку простой случайной выборки для доли единиц, обладающих альтернативой изменчивостью признака (для повторного и бесповторного отбора)?

8.Как рассчитать необходимый объём выборки?

9.Укажите особенности расчёта предельной ошибки для механической, типической и серийной выборки.

 

Тема 8. Статистические методы изучения взаимосвязей социально-экономических явлений

1.В чем заключается измерение связей между социально-экономическими явлениями — важнейшая задача статистики?

2.Какие формы и виды взаимосвязей вы знаете?

3.Какие статистические методы изучения связей: метод сравнения параллельных рядов, метод аналитических группировок, графический метод, балансовый метод вы можете описать?

4.Каковы особенности измерения связей неколичественных переменных?

5.В чём сущность метода оценки значимости корреляционной связи с использованием критерия Фишера?

6.Какие показатели используются для оценки силы корреляционной связи при криволинейной зависимости и как они рассчитываются?

7.Что показывает линейный коэффициент корреляции и линейный коэффициент детерминации и как они рассчитываются?

8.В чём состоит основное содержание корреляционно-регрессивного анализа?

9.Назовите основные методы выявления корреляционной связи.

10.В чём сущность корреляционной связи между признаками?

 


Список использованной литературы

 

Основные источники:

1.      Балдин, К.В. Общая теория статистики: Учебное пособие/К.В.Балдин А.В. Рукосуев. –М.: Дашков и К, 2012. -312с.

2.      Батракова,Л.Г. Теория статистики: Учебное пособие/Л.Г.Батракова. –М.:КноРус, 2013. -528с.

3.      Громыко, Г.Л. Теория статистики: Практикум/ Г.Л. Громыко. –М.:НИЦ ИНФРА-М, 2013. -238 с.

4.      Гусаров, В.М. Общая теория статистики: Учебное пособие для студентов вызов/В.М.Гусаров, С.М.Проява. – М.:ЮНИТИ-ДАНА, 2008. -207 с.

5.      Лысенко, С.Н. Общая теория статистики: Учебное пособие/С.Н. Лысенко, И.А. Дмитриева. –М.: ИД ФОРУМ, НИЦ ИНФРА-М, 2013. -208 с.

6.      МаличенкО, И.П. Общая теория статистики: Курс лекций с практическими примерами / И.П. Маличенко, О.Е.Лугинин. –Рн/Д: Феникс, 2010. – 187 с.

7.      Рыбаковский, О.Л. Теория статистики: Учебное-методическое пособие / О.Л. Рыбаковский. –М.: РАГС, 2008. -124 с.


Дополнительные источники:

1.      Елисеева И.И., Юзбашев М.М. Общая теория статистики: Учебник/Под. ред. чл.-корр. РАН И.И.Елисеевой – М.: Финансы и статистика, 2012.

2.      Ефимова М.Р., Петрова Е.В., Румянцев В.Н. Общая теория статистики: Учебник.-М.:ИНФРА-М, 2013.

3.      Практикум по теории статистики: Учеб. пособие /Под.ред.проф. Р.А.Шмойловой.-М.:Финансы и статистика, 2014.

4.      Статистический словарь/Гл.ред. М.А.Королев. –М.:Финансы и статистика, 1989.

 

Интернет-ресурсы:

1.www.statsoft.com/textbook/stathome.html

2. www.statsoft.ru/home/portal

3.distance.ru/4stud/umk/stat/stat.htm

4.  http://www.minfin.ru/

5. http://www.nalog.ru/

 

 

 

 

 

 

 

 



[1]Если в выборке более 30 единиц генеральной совокупности

Просмотрено: 0%
Просмотрено: 0%
Скачать материал
Скачать материал "Методическое пособие по дисциплине ОП. 03 Статистика для специальности 21.02.05"

Методические разработки к Вашему уроку:

Получите новую специальность за 3 месяца

Клининговый менеджер

Получите профессию

Фитнес-тренер

за 6 месяцев

Пройти курс

Рабочие листы
к вашим урокам

Скачать

Скачать материал

Найдите материал к любому уроку, указав свой предмет (категорию), класс, учебник и тему:

6 626 985 материалов в базе

Скачать материал

Другие материалы

Вам будут интересны эти курсы:

Оставьте свой комментарий

Авторизуйтесь, чтобы задавать вопросы.

  • Скачать материал
    • 22.03.2018 3947
    • DOCX 630 кбайт
    • Оцените материал:
  • Настоящий материал опубликован пользователем Леденева Екатерина Владимировна. Инфоурок является информационным посредником и предоставляет пользователям возможность размещать на сайте методические материалы. Всю ответственность за опубликованные материалы, содержащиеся в них сведения, а также за соблюдение авторских прав несут пользователи, загрузившие материал на сайт

    Если Вы считаете, что материал нарушает авторские права либо по каким-то другим причинам должен быть удален с сайта, Вы можете оставить жалобу на материал.

    Удалить материал
  • Автор материала

    • На сайте: 6 лет и 2 месяца
    • Подписчики: 0
    • Всего просмотров: 103800
    • Всего материалов: 20

Ваша скидка на курсы

40%
Скидка для нового слушателя. Войдите на сайт, чтобы применить скидку к любому курсу
Курсы со скидкой

Курс профессиональной переподготовки

Секретарь-администратор

Секретарь-администратор (делопроизводитель)

500/1000 ч.

Подать заявку О курсе

Курс повышения квалификации

Специалист в области охраны труда

72/180 ч.

от 1750 руб. от 1050 руб.
Подать заявку О курсе
  • Сейчас обучается 42 человека из 21 региона

Курс профессиональной переподготовки

Библиотечно-библиографические и информационные знания в педагогическом процессе

Педагог-библиотекарь

300/600 ч.

от 7900 руб. от 3950 руб.
Подать заявку О курсе
  • Сейчас обучается 457 человек из 66 регионов

Курс профессиональной переподготовки

Организация деятельности библиотекаря в профессиональном образовании

Библиотекарь

300/600 ч.

от 7900 руб. от 3950 руб.
Подать заявку О курсе
  • Сейчас обучается 281 человек из 66 регионов

Мини-курс

Психология общения: эффективное общение и решение конфликтов

6 ч.

780 руб. 390 руб.
Подать заявку О курсе
  • Сейчас обучается 509 человек из 69 регионов

Мини-курс

История и основы галерейного бизнеса

3 ч.

780 руб. 390 руб.
Подать заявку О курсе

Мини-курс

Финансы и управление в медиакоммуникациях

3 ч.

780 руб. 390 руб.
Подать заявку О курсе