К ИНТЕГРАЛЬНОЙ ОЦЕНКЕ УРОВНЯ ЖИЗНИ В РОССИИ
Кандидат технических наук старший научный сотрудник А.Д.Скачков
Для разработки политики и мер по улучшению жизни населения РФ необходимо постоянно совершенствовать методы слежения за динамикой благосостояния. Методики оценки уровня жизни в целом по стране должны иметь интегральный характер и учитывать территориальные и национальные особенности субъектов Федерации. Основой для таких оценок выступают статистические распределения реального спроса населения на продукты потребления.
В настоящее время в практике государственной статистики разработан и действует ряд методов оценки уровня жизни, основанных на распределениях населения по среднедушевым расходам (доходам). Это методы параметрических характеристик распределений, подходы К.Джини, О.Лоренца, коэффициенты фондов и многие другие [ 1. ]. Однако информация, содержащаяся в этих распределениях в том виде, как она используется, не учитывается в полной мере. Развитие методов оценки уровня жизни в целом по стране возможно с привлечением математического аппарата К.Шеннона [ 2. ] и методов многомерной статистики.
Конечной целью такого рода исследований является создание масштабной методики оценки качества жизни. Качество жизни является многогранным понятием и более широким, чем уровень жизни. Это внешняя и внутренняя безопасность, здоровая среда, экономическая стабильность, условия для удовлетворения первоочередных потребностей человека, возможности для физического и духовного развития личности. Уровень жизни, как и качество жизни, это итог психического восприятия потребителем совокупности условий жизнедеятельности, это степень удовлетворенности предметами потребления, потребительная стоимость товаров и услуг .В данном исследовании использованы следующие показатели (статистические ряды), взятые из сборников Госкомстата «Социальное положение и уровень
жизни населения России» за 2002 и 2005 годы:
1. Продукты питания (2002 г. – раздел 07.20, 2005 г.- 07.20).
2. Алкогольные напитки (разделы 07.20).
3. Непродовольственные товары (разделы 07.20)*.
4. Услуги (разделы 07.20).
5. Здравоохранение (2002 г.- раздел 10.30, 2005 г.- 07.20).
6. Транспорт (2002 г.- 07.23, 2005 г.- 07.20).
7. Связь (2002 г.- раздел 13.16, 2005 г.-07.20).
8. Организация отдыха и культура (2002 г.- раздел 12.17, 2005 г.- 07.20)
9. Просвещение и образование (2002 г.- разделы 11.26 – 11.28, 2005 г.- 11.32 – 11.35).
10. Жилищные условия (2002 г.- раздел 09.17, 2005 г.- 09.16).
11. Атмосфера, прошедшая очистку (разделы 15.10). *) Показатель 3 (непродовольственные товары) для 2005 года объединил графы раздела 7.20 «одежда и обувь» и «промышленные товары» широкого потребления Во всех показателях (потребительские товары) проценты переведены в денежные эквиваленты в соответствии с действующими ценами. Конечно, этот перечень не включает в себя всех аспектов качества жизни, но отвечает требованию комплексности.
На рис.1 приведены гистограммы распределения с аппроксимирующей (ожидаемой) нормальной плотностью по показателям «питание» и «образование».На левом рисунке по оси абсцисс отложены расходы на приобретение продуктов питания одним домашним хозяйством в месяц за 2005 год.. По оси ординат указано число регионов в процентах от их общей численности (79 без учета Чеченской республик и автономных образований, входящих в тот или иной регион), выпавшее на некоторый интервал шкалы измерения. Так, в интервал 1300-:-1500 по оси абсцисс попадает 15 регионов-19% от их общего числа.
Рис.1. Плотность распределения расходов на конечное потребление по показателям «питание» (слева) и «образование» (справа) за 2005 год.
Гистограммы (частотные распределения [ 3.]) содержат в пределах точности проводимых измерений практически полную информацию об исследуемых статистических объектах. Для распределений нормального вида полная информация определяется через среднее значение показателя и его стандартное отклонение. Для распределений, далеких от нормальных, целесообразно использовать универсальный критерий информативности, выражаемый формулой К.Шеннона:
N N
H = - ∑ Pi*log Pi ; ∑ Pi =1 , ( 1 )
где Pi - вероятность попадания показателя в пределы некоторого интервала i, а N – число интервалов; Pi = (0 ÷ 1).
Формула К.Шеннона была разработана им в интересах теории передачи информации по каналам связи и создания соответствующих технических систем. Она определяет уровень неопределенности значений некоторого показателя и на этой основе - требования к каналам связи для передачи соответствующего объема информации. Однако эта формула имеет более широкое методологическое значение, позволяя оценивать полный объем информации о любых статистических объектах.
В рассматриваемой системе с помощью этой формулы можно выявить все разнообразие отношений потребителя к ценности приобретаемых товаров и услуг, степень его удовлетворенности их потребительскими свойствами. Очевидно, что ценностные ориентации жителей Чукотского АО, например, могут заметно отличаться от характера восприятия товаров и услуг у населения Калининградской области. При равенстве ценностных ориентаций потребителей и соответствии поставляемых товаров и услуг установленным нормам признак H = 0 (Pi = 1; i ≠ j, j = 1,…,N), что соответствует обеспечению условий для нормальной жизнедеятельности. Для приведенного выше распределения (рис.1) H равно 3,145
. Максимальное значение H = 6,304 соответствует распределению Pi = 1/79; i = 1,…,N. При Pi < 1 признак H принимает отрицательное значение (log Pi ), что можно оценить как состояние неудовлетворенности потребителя. Тем не менее в дальнейшем при вычислении H «минус» будет лишь подразумеваться.
Исходные показатели, соответствующие отдельным аспектам уровня жизни, независимо от принятых систем их измерения преломляются в сознании человека как удовлетворенность или неудовлетворенность потребительскими свойствами предмета потребления. При снижении объема и качества товаров и услуг по отношению к установленным нормам растет состояние неудовлетворенности (рост Н). Фактически формула К.Шеннона преобразует шкалы измерения исходных показателей в нормированную и безразмерную шкалу, соответствующую восприятию потребителем ценности товаров и услуг, а в целом она определяет усредненную степень восприятия некоторого предмета потребления. К тому же формула выполняет двоякую роль: она оценивает текущую неравномерность обеспечения регионов тем или иным предметом потребления , и, с другой стороны, степень неудовлетворенности обеспечиваемыми условиями жизни.
. В таблице 1 представлены в приведенном ранее порядке вычисленные значения Hk (k=1,…,11), соответствующие признакам за 2002 и 2005 годы.
Таблица 1
Вычисленные значения Hk при независимых исходных показателях
Показатели
«питание»
1 «алкоголь»
2 «промтов»
3 «услуги»
4 «здрав»
5 «трансп»
6
2002 год 2,569 3,156 2,469 2,678 2,002 2,034
2005 год 3,145 3,275 2,686 2,950 3,092 2,403
«связь»
7 «отдых»
8 «образ-ние»
9 «жилье»
10 «атмосфера»
11 11
H0 = ∑ Hk
3,592 1,297 3,635 3,010 0,453 26,895
2,398 1,996 3,066 3,194 0,993 29,198
Данные вычисления произведены при допущении равенства восприятия потребителями ценности товаров и услуг. При учете национальных и религиозных, а также территориальных (северные, южные регионы) особенностей регионов необходима корректировка исходных распределений.
Если бы исходные показатели были независимы, уровень жизни в России (Ho) мог бы оцениваться как сумма частных признаков Hk; в 2002 году – 26,895, в 2005 году – 29,198
. В действительности корреляционные связи между исходными показателями существенны. Для решения этой проблемы можно привлечь без заметной потери информативности аппарат факторного анализа [ 4.], с помощью которого путем ортогонального преобразования исходной
матрицы по методу главных компонент вычисляется матрица нагрузок размером 5х11,практически независящая от способа вращения факторных координат (Varimax, Quartimax
и др.). Нагрузка по существу представляет собой коэффициент корреляционной связи между исходным показателем и некоторым вычисленным фактором: по строкам матрицы она указывает на роль отдельного показателя при формировании независимых факторов, по вертикали – роли исходных показателей при формировании некоторого фактора.
На рис.2 для иллюстрации метода приведен точечный график, отражающий участие исходных показателей (переменных) в формировании двух первых главных факторов. Из графика видно, что наибольший вклад при формировании первого фактора вносят показатели
Фактор 2
Фактор 1
Рис. 2. Точечный график, отражающий участие исходных показателей в формировании двух
главных факторов.
1, 2, 3 и 4 (питание, алкоголь и табачные изделия, непродовольственные товары, услуги). Углы между лучами, проведенными из начала отсчета к точкам этого кластера, в силу своей малости проявляют высокие корреляции между показателями, что и определяет их основную роль среди других показателей.
На основе решения обратной задачи факторного анализа [ 4.] вычисляется матрица независимых факторов размером 5 х 79 которая фактически представляет собой «сжатую» матрицу исходных показателей. Параметры распределения этих факторов: среднее значение равно нулю, стандартное отклонение – 1. . «Сжатая» матрица независимых факторов размером (5 х 79), полученная путем ортогонального преобразования исходной матрицы размером (11 х79), содержит более чем на 90% информацию, содержащуюся в исходной матрице. Применяя ту же технологию (формула К.Шеннона), что и для исходной матрицы, получаем новые уже независимые показатели удовлетворенности предметами потребления. В таблице 2 представлены
их значения для данных за 2002 и 2005 годы
Таблица 2 Вычисленные значения независимых признаков уровня жизни
Hq
1
2
3
4
5 5
Ho =∑ Hq
2002 год 1,880 2,881 1,283 1,921 1,522 9,487
2005 год 2,243 2,868 2,089 1,115 2,778 11,093
Последняя колонка таблицы 2 представляет итоговые оценки уровня жизни населения в 2002 и 2005 годах. Эти оценки при допущении принятых выше условий отражают реальный уровень восприятия населением текущих аспектов жизни с учетом возможной взаимозаменяемости потребляемых продуктов. По состоянию удовлетворенности уровень жизни населения в 2005 году снизился по сравнению с 2002 годом на 16 %.
Как видно из этой таблицы, итоговые значения Ho для «сжатой» матрицы почти в три раза меньше итоговых значений Ho из таблицы 1. Ортогонализация исходной матрицы
образует отдельные кластеры высоко коррелированных показателей, которые играют основную роль в формировании виртуального показателя (фактора), передавая ему близкие по ценностной ориентации потребительские свойства. .
Однако обсуждаемый подход не ограничивается оценкой восприятия населением условий жизни. Он дает также возможность интегральной оценки неравномерности социального развития регионов, уровня концентрации показателя уровня жизни относительно состояния удовлетворенности (Ho = 0). Отклонение от этого состояния может служить критерием при решении проблем выравнивания условий жизни в регионах. Наряду с итоговыми данными таблицы 2, неравномерность состояния регионов можно проиллюстрировать точечными графиками значений уровня жизни по регионам для двух главных факторов, представленными ниже.
Рис.3. Точечные графики разброса наблюдений (регионов) в двумерном пространстве для первых двух главных факторов исходной матрицы.
Здесь нумерация регионов дается в порядке, предусмотренном Госкомстатом. Эллипсы на рисунках определяют доверительные границы, соответствующие 80 % вероятности попадания в них наблюдений (регионов). Как видно из графиков, в 2005 году вне границ оказывается значительно большее число регионов. Характерно, что в число этих регионов и в 2002 и 2005 годах вошли г.Москва (регион 18), г.Санкт-Петербург -28, Чукотский АО -79. Эти регионы отличаются, как следует из анализа, более высоким уровнем удовлетворения первоочередных потребностей, хотя, конечно, высокие показатели потребления не всегда определяют и высокое качество жизни. Эти выводы подтверждаются также вычисленными коэффициентами О.Лоренца [1.]по суммарному показателю среднедушевых расходов населения на конечное потребление. Для 2002 года этот коэффициент равен 2,05, для 2005 года – 2,88.
Таким образом, оценка уровня жизни может быть получена на основе вычисленной матрицы виртуальных показателей (факторов) размером 5 х 79 и аппарата К.Шеннона. Уровень жизни определяется структурой потребления, средой обитания населения и другими факторами, обуславливающими в конечном итоге демографические показатели (динамика изменения численности населения, его половозрастная структура, рождаемость и другие показатели). Зависимость демографии от причин ее обуславливающих может выявляться с помощью множественного регрессионного анализа [ 5. ]. В данном исследовании в качестве зависимой переменной использованы статистические ряды по численности населения за 2002 и 2005 годы по регионам (раздел 02.16 – 2002 г., раздел 02.17 – 2005 г из указанных выше сборников Госкомстата), а в качестве независимых- вычисленные факторы. Ниже приведены основные группы исходных показателей, формирующих главные факторы (для факторных нагрузок > 0,7).
Таблица 3
Кластеры исходных показателей, формирующих главные факторы
Фактор 1
Фактор 2
Фактор 3
Фактор 4
Фактор 5
2002 год
1, 2, 3, 4
5, 8, 9
11
7,10
6
2005 год 1, 2, 3, 4,
5, 7, 8
10
11
9
6
, Фактор с одним формирующим его исходным показателем можно поименовать именем этого
показателя, поскольку соответствующая показателю факторная нагрузка значительно доминирует над другими нагрузками по вертикали фактора. Отсюда для 2002 года: фактор 3 можно именовать как атмосферная среда, фактор 4 – связь, фактор 5 – транспорт; для 2005 года: фактор 2 – жилищные условия, фактор 3- атмосферная среда, фактор 4 – образование, фактор 5 – транспорт. Выявленная структура потребления отражает текущие тенденции экономического и социального развития страны. При этом первые главные факторы строятся прежде всего на основе первоочередных потребностей населения. Ниже приведены результаты регрессионного анализа
1
Таблица 4
Регрессионная зависимость численности населения от факторов -2002 и 2005 годы..
2002 год 2005 год
Факторы B p-level Факторы
B p-level
intercept 1803,5 ,00000 intercept 1792,3 ,00000
Ф 1 647,1 ,00000 Ф 1 850,1 ,00000
Ф 2 962,6 ,00000 Ф 2 -203,5 ,144
Ф 3 138,5 ,0878 Ф 3 171,1 ,218
Ф4 6,4 ,937 Ф 4 533,6 ,0023
Ф 5 59,6 ,459 Ф 5 408,5 ,0041
F(5,73) =42,7; R = ,863 F(5,73) =13,1; R = ,688
B таблице B –коэффициенты регрессии, R-коэффициент множественной корреляции, F- статистика по Фишеру, определяющая степень адекватности регрессионной модели, p –вероятность нахождения оценок вне зоны толерантности. Intercept (свободный член) –постоянная величина. С ростом числа учитываемых в модели значимых факторов (регрессоров) и ростом числа наблюдений она снижается при одновременном росте статистики R (стремится к 1). Учитывая независимость факторов, эта величина равна средней по регионам численности населения: для 2002 года – 1803,5 ., для 2005 года – 1792,3 тыс.чел. По приведенным в таблице 4 результатам наибольшее влияние на динамику численности населения оказывают:
2002 год - фактор 1 с коэффициентом B = 647,1 (исходные показатели 1, 2, 3, 4); фактор 2: B = 962,6 (показатели 8, 9); фактор 3: B = 138,5 (показатель 11),
2005 год - фактор 1: B = 850,1 {показатели 1, 2, 3, 4, 5, 7,
; фактор 4: B = 533,6 (показатель 9); фактор 5: B = 408,5 (показатель 6).
Для 2002 года в целях снижения эффекта мультиколлинеарности в анализе использован корректирующий коэффициент µ = 0,2.
Однако проведенный регрессионный анализ не отражает влияния на динамику численности населения отдельных исходных показателей. Прямая регрессия численности населения на показатели связана со значительными ошибками из-за ограниченности числа наблюдений (регионов). Госкомстат, располагая возможностями расширения базы наблюдений путем привлечения статистик более мелких административных образований, может провести более масштабные исследования. Тем не менее в данных условиях анализа можно предложить другой способ. Задача состоит в том, чтобы «расщепить» коэффициент регрессии B на доли, соответствующие влиянию на численность населения отдельных показателей. Для этого могут быть использованы вычисляемые факторные нагрузки, отражающие роли исходных показателей в формировании того или иного фактора. В таблице 5, как пример, представлены оценки влияния на численность населения исходных показателей: питание (фактор 1),
жилищные условия (2002 г. –фактор 4, 2005 г. –фактор 2), здравоохранение (2002 г. -фактор 2, 2005 г. –фактор 1), образование (2002 г. –фактор 2, 2005 г. фактор 4).
Таблица 5
Приближенные оценки влияния исходных показателей на численность населения.
Факторная нагрузка Доля нагрузки в общем факторе Доля коэффициента
регрессии B Динамика числ. населения при сдвиге
исходного.показателя на 10%
(в тыс.чел.)
2002г. 2005г. 2002г. 2005г. 2002г. 2005г. 2002г. 2005г.
Питание ,95 ,92 ,19 ,12 122,9 102 12,3 10,2
Жилье ,91 ,99 ,41 ,80 2,62 -163 ,26 -16,3
Здравоохранение ,65 ,76 ,22 ,10 142,4 85,0 14,2 8,5
Образование ,78 ,85 ,26 ,27 250,3 143,9 25,0 14,4
Во второй колонке таблицы приводится доля нагрузки показателя в сумме нагрузок на соответствующий общий фактор (результаты факторного анализа не приводятся!). Эта доля определяет часть коэффициента регрессии B (таблица 4) для соответствующего фактора,
которая исполняет функцию частного коэффициента регрессии. При сдвиге исходного показателя на некоторую величину(в таблице это 10%) относительно среднего значения по регионам получаем в результате средний прирост или снижение численности населения (в тыс. чел.). Например, рост среднедушевого расхода на продукты питания в 2002 году в среднем на 95 рублей относительно среднего расхода по стране (948 рублей в месяц) при неизменности других показателей обеспечивает прирост численности населения на 12,3 тысяч человек в среднем на регион. Согласно таблице 5, можно отметить возросшие к 2005 году проблемы в области обеспечения населения питанием, создания жилищных условий, здравоохранения и образования. Аналогичные вычисления можно провести и для других включенных в таблицу 3 значимых показателей.
Не претендуя на полноту учета всех аспектов благосостояния, предпринимаются шаги по поиску способа комплексной (интегральной) оценки уровня жизни на основе ряда показателей
жизнедеятельности. Оценка осуществляется на базе распределения отдельного показателя и величины -признака, вычисляемого по формуле К.Шеннона и определяющего усредненную степень восприятия населением того или иного предмета потребления. При независимости показателей потребления уровень жизни вычисляется как сумма отдельных признаков. Однако с учетом значительной корреляции между исходными показателями уровень жизни вычисляется как сумма признаков по той же технологии, но уже для независимых факторов, выявляемых в результате факторного анализа. Уровень жизни определяет динамику численности населения. Его влияние оценивается регрессионным анализом действия независимых факторов на показатель численности населения. Получаемые в результате анализа коэффициенты регрессии формируются под влиянием кластеров исходных показателей, формирующих, в свою очередь, соответствующий им фактор. В силу ограниченной возможности для принятых условий прямой оценки влияния показателей предлагается приближенный способ «расщепления» базового коэффициента регрессии на частные коэффициенты, отражающие их влияние на численность населения. Все исследования проводятся путем сравнения полученных результатов по 2002 и 2005 годам. Для оценки динами-
ки изменения уровня жизни (УР) может быть использован показатель –индекс УР, вычисляемый в процентах от достигнутого уровня.
ЛИТЕРАТУРА
1. Статистика. Учебник / Под ред. И.И.Елисеевой. – М. : КНОРИС, 2006.
2. Шеннон К. Работы по теории информации и кибернетике.-М: ИЛ, 1963.
3. Кендалл М.,Стьюарт А. Теория распределений.- М: «Наука», 1965.
4. Айвазян С.А. и др. Прикладная статистика.- М: «Финансы и статистика», 1989.
5. Вучков И. и др. Прикладной линейный регрессионный анализ. –М: «Финансы и статистика», 1987.
.
СВЕДЕНИЯ ОБ АВТОРЕ
Скачков Анатолий Дмитриевич, 1938 года рождения, кандидат технических наук, старший научный сотрудник (ВАК), работал во ВНИИ проблем организации и
управления ГКНТ, во ВНИИ проблем вычислительной техники и информатики ГКинформ, во ВНИЦ профилактической медицины МЗ РФ.
A P P E N D I X
Формула 1 может быть также использована для выявления роли отдельных регионов в формировании некоторого признака H. Так, для 2002 года в интервавл значений в частотном распределении по показателю «питание» [1500-2000] попадают г.Санкт-Петербург, Самарская область, Чукотская АО, а в интервал [5500 – 6000]- г.Москва. Соответствующие слагаемые в сумме формулы 1 (части признака H1) будут равны 0,18 для группы указанных выше регионов и 0,08 для г.Москвы. Соответственно их доли в формировании признака H1 равны 0,07 (7%) и 0,03 (3%). Для 2005 года в интервал [2200 – 2400} попадают Московская область, г.Санкт-Петербург, Республика Саха, а в интервал [5000 – 5200]- г.Москва. Части признака равны 0,152 для группы регионов и 0,066 для г.Москвы. Доли в формировании признака: 0,048 (4,8%) для кластера и 0,021 (2,1%) для г.Москвы.
ПРИЛОЖЕНИЕ
К статье «К интегральной оценке уровня жизни в России»
(для поддержки текста: не предлагается к публикации)
1. Результаты факторного анализа по данным за 2002 и 2005 годы..
Factor Loadings (Varimax raw) (integr.sta)
Extraction: Principal components
(Marked loadings are > ,700000)
Показатели Фактор 1
Фактор 2
Фактор 3
Фактор 4
Фактор 5
2002 2005 2002 2005 2002 2005 2002 2005 2002 2005
Питание ,95* ,92* ,15 ,14 -,05 -,07 ,18 ,24 ,03 ,03
Пром. тов.. ,91* ,82* ,12 ,05 ,15 ,31 ,08 ,23 ,27 ,21
Алкоголь ,88* ,90* -,009 ,16 ,10 ,13 ,14 ,11 -,04 ,16
Услуги ,95* ,85* ,13 ,11 ,02 ,02 ,12 ,41 ,18 ,12
Жилье ,11 ,11 ,07 ,99* -,05 -,03 ,91 -,03 -,13 -,03
Образование ,44 ,46 ,78* -,06 ,19 ,16 -,07 ,85 ,05 ,16
Транспорт ,19 ,69* ,08 -,15 ,17 ,12 -,04 ,32 ,95* ,58
Связь ,46 ,84* -,02 ,02 ,02 ,17 ,75 ,35 ,16 ,11
Атмосфера ,07 ,09 ,06 -,05 ,98* ,98 -,03 ,10 ,15 ,05
Отдых -,09 ,81 ,90 -,09 -,08 ,09 ,09 ,30 ,06 ,40
Здравооохр. ,64 ,76 ,65 ,11 ,18 ,09 ,08 ,29 ,07 ,44
Expl.Var 4,29 5,69 1,9 1,08 1,1 1,17 1,5 1,42 1,1 ,81
Prp.Totl ,39 ,52 ,17 ,10 ,10 ,11 ,13 ,13 ,10 ,07
•