ВІКІСТОРІНКА
Навигация:
Інформатика
Історія
Автоматизація
Адміністрування
Антропологія
Архітектура
Біологія
Будівництво
Бухгалтерія
Військова наука
Виробництво
Географія
Геологія
Господарство
Демографія
Екологія
Економіка
Електроніка
Енергетика
Журналістика
Кінематографія
Комп'ютеризація
Креслення
Кулінарія
Культура
Культура
Лінгвістика
Література
Лексикологія
Логіка
Маркетинг
Математика
Медицина
Менеджмент
Металургія
Метрологія
Мистецтво
Музика
Наукознавство
Освіта
Охорона Праці
Підприємництво
Педагогіка
Поліграфія
Право
Приладобудування
Програмування
Психологія
Радіозв'язок
Релігія
Риторика
Соціологія
Спорт
Стандартизація
Статистика
Технології
Торгівля
Транспорт
Фізіологія
Фізика
Філософія
Фінанси
Фармакологія


Распределение опрошенных по признаку «доход»

Показатель Номер интервала   Всего
Граница интервала, руб.
до 65 65-74 75-84 85-94 95-104 105 и выше
Частота

75—85, 85—95, 95—105, 105 и выше. В этом случае 74,5; 74,8; 74,9, например, относятся к интервалу 65 — 75, а значения 75,0; 75,1 и т.д.— к интервалу 75 — 85. (Это важное замечание будет учтено при выводе формул для вычисления медианы и квантилей).

Для описания вариационных рядов введем следующие обозначения. Значения признака X у отдельных индивидов, т.е. варианты, обозначим через xi , i= 1, 2, ..., N, где N — общее число индивидов, или объем совокупности. (Для краткости в дальнейшем мы будем писать i = ). Некоторые варианты могут повториться: например, на предприятии имеется ряд работников с образованием 10 классов и т.д. Пусть различных вариантов k (k<N), а обозначение xi при i= соответствует теперь различным вариантам. Общее число индивидов с X = хi мы будем обозначать N (Хi) или просто Ni (пока рассматривается один признак это возможно). Ясно, что .. Величина Ni является частотой, a vi=Ni/N – частота варианта xi. Очевидно, что .

 

[21]

 

Варианты вместе с частотами образуют вариационный ряд (одномерное распределение признака), который может быть дискретным (в случае номинальных и порядковых признаков, а также для некоторых метрических, например, «число детей в семье», «разряд» для рабочих и т.п.) или непрерывным (для метрических признаков). В случае, если варианты расположены в порядке убывания или возрастания, вариационный ряд называется упорядоченным (ранжированным). Как правило, непрерывные признаки указанным способом преобразуют в дискретные путем введения интервалов. Величина интервала называется интервальной разностью.

Если обозначить левую границу некоторого l-го интервала через , а правую — через , то ширина интервала, или интервальная разность, равна . Эта формула верна лишь в случае, если границы соседних интервалов совпадают, т.е. . Когда границы интервалов не совпадают (как в табл. 3), то . Например, ширина 3-го интервала равна не 84—75=9, а 10, так как в интервал попадают, как указывалось выше, значения от 74,5 до 84,5 (84,5—74,5=84—75+1=10). Величину ( + ) (для интервалов с совпадающими границами) или ( + +1) (для интервалов с несовпадающими границами) назовем серединой или центром интервала. Для нашего примера середина интервала равна (84+75+1)=80.

Основным приемом представления и анализа социологических данных является построение одномерных (вариационные ряды) и двумерных распределений признаков (реже 3-мерных и n-мерных распределений) или, другими словами, распределений опрошенных по одному, двум, трем и более признакам.

Одномерное распределение

А. Классификационные и качественные признаки (номинальные и порядковые шкалы). Допустим, что нам известно одномерное распределение N респондентов по некоторому признаку X, имеющему k градаций (вариантов):

Вариант x1 x2 xk
Частота N1 N2 Nk

 

[22]

 

Чаще всего одномерное распределение изображается с помощью полигонов и гистограмм распределения. На оси абсцисс откладываются k точек, на оси ординат — значения Ni; соединив их ломаной линией, получим полигон распределения, если же построить столбики высотой Niполучим гистограмму. Полигоны и гистограммы можно строить не только с использованием частот, но и частостей и процентов.

 

Таблица 4

Распределение населения СССР по уровню образования в 1979 г. (см. Население СССР. М., 1980 г.)

Уровень образования Абсолютные показатели, тыс. чел. Процент
Неполное среднее 37,7
Среднее общее 32,4
Среднее специальное 16,9
Высшее незаконченное 2,3
Высшее оконченное 10,7
Всего

 

Рассмотрим на примере, как строятся указанные виды графиков.

Пример 1. Построим полигон и гистограмму распределения для данных, приведенных в табл. 4.

На рис. 1, отражающем эти данные, изображены две оси ординат — на одной из них отложены абсолютные величины, на другой — проценты. Форма графиков не зависит от вида показателя (частоты, частости или проценты), откладываемого на оси ординат. Полигон (по соглашению) изображают как замкнутую кривую.

Б. Количественные признаки (интервальные шкалы и шкалы отношений). Принципиальных различий в построении одномерных распределений количественных признаков по сравнению с изображением качественных признаков нет, но есть некоторые особенности, связанные с тем, что для количественных признаков приобретает смысл понятие ширины интервала. Прежде чем перейти к обсуждению этого вопроса, введем некоторые определения.

Частоту, приходящуюся на единицу интервала (для l-го

 

[23]

 

интервала , назовем плотностью распределении, а частость, приходящуюся на единицу интервала — относительной плотностью распределения. Особо важную роль играет это понятие в случае неравных интервалов, на чем мы в дальнейшем специально остановимся.

Нам также понадобится понятие накопленной, или кумулятивной, частоты (частости). Накопленная частота по-

Рис. 1. Уровень образования населения СССР (1979 г.)

 

казывает число индивидов, у которых варианты не больше (меньше либо равны) данного значения признака.

Скажем, для l-ого интервала накопленная частота показывает, у какого числа индивидов X xl или, другими словами: сколько всего индивидов с X=х1, X=х2,..., X=xl. Очевидно Fk=N. Кумулятивная частость и соответственно fk=1. тогда ρl в процентах равна . 100%.

В конкретных исследованиях нередко используются неравные интервалы. Так как велик диапазон возможных значений, например, возраста работников (свыше 50 лет), то при равных интервалах в случае разумного числа пунктов (10—12) будет слишком большой интервальная разность (около 5 лет), это не позволит достаточно точно изучить по-

 

[24]

 

ведение работников разного возраста, особенно молодых (в старших возрастных группах, как показывают исследования, влияние возрастных различий на поведение несколько ниже) Увеличение же дробности, желательное для детального изучения, приводит к очень большому числу пунктов (25—30), существенно затрудняющему анализ материала. Выходом из этого положения является компромиссный вариант: малые интервалы выбираются для групп молодых

Таблица 5

© 2013 wikipage.com.ua - Дякуємо за посилання на wikipage.com.ua | Контакти