Основы решения эконометрических задач
Содержание
Задание 1
1. Определите, на какой диаграмме показаны временные данные, а на какой пространственные (рис.1 и рис. 2).
Рисунок 1 – Структура использования денежных доходов за 2001 г
Рисунок 2 – Структура использования денежных доходов за 2001 г
Ответ:
Прогнозы часто осуществляются на основе некоторых статистических показателей, которые изменяются во времени. Если эти показатели имеют значения на определенные промежутки времени, следующие друг за другом, то образуются некоторые ряды данных с определенными тенденциями. Ряд расположенных в хронологической последовательности значений статистических показателей, представляют собой временной (динамический) ряд.
Динамическим рядом называется ряд чисел или ряд однородных статистических величин, показывающих изменения размеров какого-либо явления или признака во времени.
Каждый временной ряд состоит из двух элементов: отрезки времени (периоды), в рамках которых был зафиксирован определенный статистический показатель и статистические показатели, характеризующие объект исследования (уровни ряда). Эти данные представлены на рис. 1.
На рис. 2 представлены пространственные данные, т.е. совокупность каких-либо параметров (в данном случае структуры денежных расходов) за один временной период (за декабрь).
2. Дайте определение регрессии.
Исследуя природу, общество, экономику, необходимо считаться со взаимосвязью наблюдаемых процессов и явлений. При этом полнота описания так или иначе определяется количественными характеристиками причинно-следственных связей между ними. Оценка наиболее существенных из них, а также воздействия одних факторов на другие является одной из основных задач статистики.
Задачи регрессионного анализа лежат в сфере установления формы зависимости, определения функции регрессии, использования уравнения для оценки неизвестных значений зависимой переменной.
Аппроксимация данных с учетом их статистических параметров относится к задачам регрессии. Они обычно возникают при обработке экспериментальных данных, полученных в результате измерений процессов или физических явлений, статистических по своей природе (как, например, измерения в радиометрии и ядерной геофизике), или на высоком уровне помех (шумов). Задачей регрессионного анализа является подбор математических формул, наилучшим образом описывающих экспериментальные данные.
Математическая постановка задачи регрессии заключается в следующем. Зависимость величины (числового значения) определенного свойства случайного процесса или физического явления Y от другого переменного свойства или параметра Х, которое в общем случае также может относиться к случайной величине, зарегистрирована на множестве точек xk множеством значений yk, при этом в каждой точке зарегистрированные значения yk и xk отображают действительные значения Y(хk) со случайной погрешностью sk, распределенной, как правило, по нормальному закону. По совокупности значений yk требуется подобрать такую функцию f(xk, a0, a1, … , an), которой зависимость Y(x) отображалась бы с минимальной погрешностью. Отсюда следует условие приближения:
yk = f(xk, a0, a1, … , an) + sk.
Функцию f(xk, a0, a1, … , an) называют регрессией величины y на величину х. Регрессионный анализ предусматривает задание вида функции f(xk, a0, a1, … , an) и определение численных значений ее параметров a0, a1, … , an, обеспечивающих наименьшую погрешность приближения к множеству значений yk. Как правило, при регрессионном анализе погрешность приближения вычисляется методом наименьших квадратов (МНК). Для этого выполняется минимизация функции квадратов остаточных ошибок:
sa0, a1, … , an) =(f(xk, a0, a1, … , an) - yk)2.
Для определения параметров a0, a1, … , an функция остаточных ошибок дифференцируется по всем параметрам, полученные уравнения частных производных приравниваются нулю и решаются в совокупности относительно всех значений параметров. (3)
Таким образом, регрессия – это односторонняя вероятностная зависимость между случайными величинами: y = f(x)
3. Определите виды регрессий:
y = 12,5 – 1,44 x1 + 5 x2 – 2.27 x3 + e
y = 1/ (11+10,.45x1 – 9,44 x2 + 3.33 x3 – 1.37x4 + e)
y = e45.45+100x + e
Покажите, где здесь результирующая, а где объясняющие переменные. Что обозначает е в уравнениях регрессии?
Виды регрессии обычно называются по типу аппроксимирующих функций: полиномиальная, экспоненциальная, логарифмическая и т.п.
Таким образом, можно говорить о том, что
y = 12,5 – 1,44 x1 + 5 x2 – 2.27 x3 + e – это полиномиальная регрессия
y – результирующая переменная
x1, x2, x3 - объясняющие переменные
e – ошибка регрессии
y = 1/ (11+10,.45x1 – 9,44 x2 + 3.33 x3 – 1.37x4 + e) - это гипербола
y – результирующая переменная
x1, x2, x3, х4 - объясняющие переменные
e – ошибка регрессии
y = e45.45+100x + e – это экспоненциальная регрессия
y – результирующая переменная
x - объясняющая переменные
e – ошибка регрессии
Задание 2
1. Дайте определение парной регрессии.
Аналитическое выражение связей между признаками может быть представлена виде уравнений регрессии:
yx = a0+a1x
где х – значение факторного признака
у – значение результативного признака (эмпирические)
ух – теоретические значения результативного признака, полученные по уравнению регрессии.
а0 и а1 – это коэффициенты регрессии, которые определяются путем решения следующей системы уравнений:
na0+a1∑x = ∑y
a0∑x+a1∑x = ∑xy2
В основе решения данной системы уравнений лежит метод наименьших квадратов, сущность которого заключается в минимизации суммы квадратов отклонений эмпирических значений признака от теоретических, полученных по уравнению регрессии:
∑(yi-yx)2 → min
а0 - показывает влияние неучтенных в модели факторов и четкой интерпретации не имеет
а1 – показывает на сколько в среднем изменяется значение результативного признака при изменении факторного признака на единицу собственного измерения (5)
2. По Российской Федерации за 2001 год известны значения двух признаков (табл. 1):
Таблица 1
Месяц | Расходы на покупку продовольственных товаров в общих расходах, % (y) | Средний денежный доход на душу населения, руб. (x) |
Январь | 69 | 1954,7 |
Февраль | 65,6 | 2292,0 |
Март | 60,7 | 2545,8 |
Апрель | … | … |
Май | … | … |
Июнь | … | … |
Июль | … | … |
Август | … | … |
Сентябрь | … | … |
Октябрь | 53,3 | 3042,8 |
Ноябрь | 50,9 | 3107,2 |
Декабрь | 47,5 | 4024,7 |
Для оценки зависимости y от x построена парная линейная регрессионная модель с помощью метода наименьших квадратов:
y = a + bx + e, где а = 196/4, b = 1/196
Парный коэффициент корреляции rxy = 1/ (-196) * 78
Средняя ошибка аппроксимации: А = 196/46 + 4,6
Известно, что Fтабл. = 4,96, а Fфакт = 196/2 + 5
Определите коэффициент детерминации. Определите линейную модель через среднюю ошибку аппроксимации и F-критерий Фишера.
Решение:
Найдем коэффициенты парной линейной регрессионной модели:
а = 196/4 = 49
b = 1/196 = 0,0051
Получим уравнение регрессии:
y = 49 + 0,0051x + e,
Значит, с увеличением среднего денежного дохода на 1 руб. доля расходов на покупку продовольственных товаров снижается в среднем на 0,0051 %.
Линейный коэффициент парной корреляции
rxy = 1/ (-196) * 78 = -0,39
(связь умеренная, обратная)
Найдем коэффициент детерминации
rxy2 = (-0,39)2 = 0,158. Вариация результата на 15,8 % объясняется вариацией фактора x.
Средняя ошибка аппроксимации А = 196/46 + 4,6 = 8,86, что говорит о высокой ошибке аппроксимации (недопустимые пределы). В среднем расчетные значения отклоняются от фактических на 8,86 %.
Проверяем F-критерий Фишера. Для этого сравним Fтабл. и Fфакт.
Fтабл. = 4,96
Fфакт.=103
Fтабл. < Fфакт. (4,96<103), значит гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность с вероятностью 0,95.
Вывод: линейная парная модель плохо описывает изучаемую закономерность.
Задание 3
В табл. 2 приведены данные, формирующие цену на строящиеся квартиры в двух различных районах.
Таблица 2
Район, а/б | Жилая площадь, м2 | Площадь кухни, м2 | Этаж, средние/крайние | Дом, кирпич/панель | Срок сдачи, через сколько мес. | Стоимость квартиры, тыс. долл |
1 | 17,5 | 8 | 1 | 1 | 6 | 17,7 |
1 | 20 | 8,2 | 1 | 2 | 1 | 31,2 |
2 | 23,5 | 11,5 | 2 | 2 | 9 | 13,6 |
… | … | … | … | … | … | … |
1 | 77 | 17 | 2 | 1 | 1 | 56,6 |
2 | 150,5 | 30 | 2 | 2 | 2 | 139,2 |
2 | 167 | 31 | 2 | 1 | 5 | 141,5 |
Имеется шесть факторов, которые могут оказывать влияние на цену строящегося жилья:
район, где расположена строящаяся квартира (а или б);
жилая площадь квартиры;
площадь кухни;
этаж (средний или крайний);
тип дома (панельный или кирпичный);
срок сдачи квартиры (через сколько месяцев).
Определите минимальный объем выборки Nmin. Для оценки зависимости y от х построена линейная множественная регрессионная модель с помощью метода наименьших квадратов:
y = a0 + a1x1 + a2x2 + a3x3 + a4x4 + a5x5 + a6x3 + e
где a0 = -196/11,5
a1 = -196/8-10
a2 = 1/196+0,79
a3 = 0,1-1/196
a4 = 196/5 - 16
a5 = 0,12*196
a6 = 1/196-0,4
Какие фиктивные переменные были использованы в модели? Дайте экономическую интерпретацию полученной модели.
Решение:
Найдем минимальный объем выборки Nmin. Число факторов, включаемых в модель, m = 6, а число свободных членов в уравнении n = 1.
Nmin. = 5 (6+1) = 35
Найдем коэффициенты линейной множественной модели:
a1 = -196/8-10 = -34,5
a2 = 1/196+0,79 = 0,79
a3 = 0,1-1/196 = 0,095
a4 = 196/5 – 16 = 23,2
a5 = 0,12*196 = 23,52
a6 = 1/196-0,4 = -0,39
Получили уравнение регрессии:
y = a0 – 34,55x1 + 0,79x2 + 0,095x3 + 23,2x4 + 23,52x5 -0,39x3 + e
Экономическая интерпретация полученной модели: квартиры в районе а стоят на 34,55% дешевле, чем в районе b. При увеличении жилой площади на 0,79 % стоимость квартиры возрастает на 0,095 %. Квартиры на средних этажах стоят на 0,095 % дороже, чем на крайних. Квартиры в кирпичных домах стоят на 23,2 % дороже, чем в панельных. При увеличении срока сдачи дома на 1 % стоимость квартиры уменьшается на 0,39%.
Фиктивные переменные – это район (принимает значения а или б), этаж (средний или крайний); тип дома (панельный или кирпичный).
Задание 4
Постройте модель сезонных колебаний дохода торгового предприятия, используя первую гармонику ряда Фурье, по данным, приведенным в табл. 2, изобразите графически.
Таблица 2
Месяц | Доход, тыс. руб. |
Январь | 58,33+112* (1/196) = 58,90 |
Февраль | 52+112* (1/196) = 52,57 |
Март | 43,67+112* (1/196) = 44,24 |
Апрель | 41,02+112* (1/196) = 41,59 |
Май | 42,77+112* (1/196) = 43,34 |
Июнь | 50,01+112* (1/196) = 50,58 |
Июль | 56,6+112* (1/196) = 57,17 |
Август | 64,74 + 112* (1/196) = 65,31 |
Сентябрь | 71,04+112* (1/196) = 71,61 |
Октябрь | 73,54+112* (1/196) = 74,11 |
Ноябрь | 72,16+112* (1/196) = 72,73 |
Декабрь | 66,3+112* (1/196) = 66,87 |
Воспользуйтесь вспомогательной таблицей 3.
Таблица 3
t | соs t | sin t |
0 | 1,00 | 0,00 |
0,523599 | 0,87 | 0,50 |
1,047198 | 0,50 | 0,87 |
1,570796 | 0,00 | 1,00 |
2,0944395 | -0,50 | 0,87 |
2,617994 | -0,87 | 0,50 |
3,141593 | -1,00 | 0,00 |
3,665191 | -0,87 | -0,50 |
4,18879 | -0,50 | -0,87 |
4,712389 | 0,00 | -1,00 |
5,235988 | 0,50 | -0,87 |
5,759587 | 0,87 | -0,50 |