Особенности эконометрического метода
1. предмет эконометрики
Специфической особенностью деятельности экономиста является работа в условиях недостатка информации и неполноты исходных данных. Анализ такой информации требует специальных методов, которые составляют один из аспектов эконометрики. Центральной проблемой эконометрики является построение эконометрической модели и определение возможности ее использования для описания, анализа, прогнозирования реальных экономических процессов. Эконометрика – быстроразвивающаяся отрасль науки, цель которой состоит в том, чтобы передать количественные меры экономическим отношениям. Термин эконометрика был впервые введен бухгалтером Цьемпой в 1910г. слово «эконометрика» состоит из 2 слов: «экономика» и «метрика». Сам термин подчеркивает специфику науки, т.е. количественное выражение тех связей и отношений, которые раскрыты и обоснованы экономической теорией. Эта наука возникла в результате взаимодействия 3 компонентов: экономической теории, математических методов, статистических методов. В последствии к ним присоединились развитие вычислительной техники. В настоящее время эконометрика располагает огромным разнообразием моделей от больших макроэкономических, включающих несколько сот или тысяч уравнений до малых уравнений, предназначенных для решения специфических проблем.
2. Особенности эконометрического метода
Становление и развитие эконометрического метода на методах вычислительной статистики: - на методах парной и множественной корреляции; - выделение тренда и др. компонентов временного ряда; - на статистическом оценивании.
Потребность в причинном объяснении корреляции привела к созданию путевого анализа, - основан на изучении всей структуры причинной связи между переменными, т.е. на построении графа. Его основным положением является то, что оценки стандартизированных коэффициентов и рекурсивной системы уравнений, которые называются коэффициентами влияния, рассчитываются на основе коэффициентов парной корреляции. При работе с временными рядами разных показателей и при изучении взаимосвязи между ними была осознана проблема ложной корреляции, которая возникла под влиянием фактора ЛАГА, т.е. сдвига во времени. Большое внимание в эконометрики уделяется проблеме данных, т.е. специальным методом работы при наличии данных с пропусками, влияние обобщения данных и т.д. информация может отсутствовать по отд. единицам совокупности и быть на уровни только прежней, информация идет не по отд. организациям, а по районам. Результаты могут сильно отличаться. К проблеме данных относится также проблема селективной выборки в микроэкономике. Типичное направление в этой области: рынок труда; выявление факторов, влияющих на решение о выборке работы; какие экономические стимулы влияют на принятие решения о получении образования.
При этом выборка может быть не случайной, а ограничена какими-то определенными ситуациями, а не всеми возможными. Эффект самоселекции возникает тогда, когда объективный отбор подменяется «удобной выборкой». Эконометрическое исследование включает в себя решение сл. Проблем:
1. качественный анализ связей экономических переменных – выделение зависимых Уi и не зависимые Хк переменных. 2. подбор данных. 3. спецификация моделей связи между переменными. 4. оценка параметров модели. 5. проверка гипотез о свойствах распределения вероятностей для случайных компонентов: гипотезы о средней; дисперсии; ковариации. 6. введение фиктивных переменных. 7. выявление автокорреляции, лагов. 8. выявление тренда, циклической и случайной компоненты. 9. проверка остатков на гетероскедастичность (отсутствия норм распределения для регрессионной функции). 10. анализ структуры связей и построение системы одновременных уравнений. 11. моделирование на основе системы временных рядов. 12. построение рекульсивной модели. 13. проблема и идентификация и оценивания параметров.
Эконометрическая модель основана на диалектическом предположении о круге взаимосвязанных переменных. При всем стремлении к наилучшему описанию связи приоритет отдается качественному анализу.
Этапы эконометрического анализа.
1. построение проблемы. 2. получение данных и анализ их качества. 3. спецификация проблем. 4. оценка параметров. 5. интерпретация результатов.
3. Измерения в эконометрики
Понятие эконометрика включает эконометрические измерения. При этом измерение понимаются по-разному. Признаками измерения считают: получение, сравнение, упорядочивание информации.
Измерение предполагает выделение некоторого свойства, по которым производится сравнивание объекта. Др. понимание измерения исходит из числового выражения результатов, т.е. измерение понимается как операция, в результате которой получается числовое выражение величины, причем числа должны соответствовать наблюдаемым свойствам, качествам, закономерностям науки и т.д
Первый подход связан с наличием эталона, это определение измерения в узком смысле. Первый низший уровень изучения предполагает сравнение объектов по наличию или отсутствию исследуемого свойства. На этом уровне используются термины « нумерация», «классификация», « номинация» и т.д.
Второй уровень предполагает сравнение объектов по интенсивности проявляемых свойств. Здесь используются термины «шкалирование», « топология», и «упорядочивание».
Третий уровень – сравнение объектов с эталонами. Здесь термины « измерение» и «квантификация». Все понятия измерения могут быть объединены на базе определения шкалы измерения. Тип шкалы измерения определяется в допустимом преобразовании- преобразование, при котором сохраняется неизменным отношение между элементами системы. Для определения любой шкалы измерения надо дать название объекту, отождествить объект некоторым свойством или группой свойств. Если это преобразование оказывается единственным, то шкала называется шкалой наименования (номинальной). Измерением в этой шкале можно считать любую классификацию, по которой класс объектов получает наименование. Числа на этой шкале играют роль ярлыков и к ним не применимы правила арифметики. Номинальная шкала обладает только свойствами симметричности и транзитивности.
Симметричность означает, что отношения между градациями Х1 и Х2 сохраняются и между Х2 и Х1.
Транзитивность означает, что если Х1=Х2, а Х2=Х3, то Х1=Х3.
Шкала, в которой порядок элементов по уровню проявления некоторого свойств существенен, а количественное выражение не существенно называется порядковой (ранговой). Шкала порядка допускает операции «=», «≠», «>», «<». Порядковые данные возникают, например при определении предпочтений избирателей, экспертиз качества, при оценке землетрясений, оценке уровня интеллекта. Кроме порядковой и номинальной используется интервальная шкала. Измерение в ней более совершенно, чем в порядковой.
Примером интервальной шкалы могут служить измерения большинства эк. Параметров, т.к. производительность труда, себестоимость, рентабельность и т.д. для измерения эк параметров характерны специфические представления о точности. Точность измерения- его адекватность, т.е. соответствие реальным условиям. Проблема точности связана со сл. Проблемами:
1. определение понятия экономической величины.
2. определение эк.показателей.
3. разработка принципов измерения, конструирования, измерителей.
4. основание выбора типа шкал.
5. разработка правил формирования систем показателей.
6. выявление типов и определение методов устранения ошибок измерений.
7. выявление условий сравнимости эк. Величин.
Основной базой для эконометрических исследований служат данные официальной статистики или б.у.
4. парная регрессия и корреляция эконометрических исследований. спецификация моделей
В зависимости от количества факторов, включаемых в уравнение регрессии принято различать парную (простую) и множественную регрессии.
Парная регрессия- зависимость между 2 переменными Х и У, т.е. модель вида , где у зависимая переменная (результативный признак), х – независимая переменная (факторный признак).
Множественная регрессия – зависимости между 2 и более числом факторов и переменной У, т.е. модель вида: .
Любое эконометрическое исследование начинается со спецификации модели, т.е. формулировки вида модели. При этом парная регрессия достаточная, если имеется доминирующий фактор, который используется в качестве объясняющей переменной Х.
Уравнение парной регрессии характеризует связь между 2 переменными, которая проявляется как некоторая закономерность в целом по совокупности наблюдений. Практически же в каждом отдельном случае величина У складывается из 2 слагаемых , где Уj фактическое значение результативного признака, теоретические значение результативного признака исходя из соответствующей матем. функции, Ej случайная величина, характеризуется отклонением реального значения результативного признака от теоретического, найденного из уравнения регрессии, Е- возмущение и включает в себя влияние неучтенных в модели факторов. Ее присутствие в модели порождено 3 источниками:
1. спецификация модели.
2. выборочный характер исходных данных.
3. особенности измерения переменных.
Основные зависимости, относящиеся к парной регрессии
от правильной спецификации зависит величина случайной ошибки. От тем меньше, чем в большей мере теоретические значения подходят к фактическим данным.
для получения хорошего результата из совокупности обычно исключают единицы с аномальными значениями результативного признака. В парной регрессии выбор вида моделей или математической функции возможен 3 способами:
1. графический. 2. аналитический, т.е. исходя из теории изучаемой связи. 3. экспериментальный
при изучении взаимосвязи между 2 переменными графический способ подбора вида уравнений основан на поликорреляции ( исходные данные, обозначенные на плоскости ХОУ).
Основные типы кривых, используемые при количественной оценке связи между 2 переменными.
Аналитический способ типа уравнений основан на изучении материальной природы связи исследуемых признаков.
Например, потребность предприятия в электроэнергии у зависит от объема выполняемой продукции х и всю потребленную энергию можно разделить на 2 части:
1. несвязанную напрямую с производством продукции (а)
2. связанную непосредственно с объемом выпускаемой продукции, которая возрастает пропорционально увеличению объема выпуска (b).
Связь можно изобразить в виде: у=а+bx. При использовании компьютеров для обработки информации выбор вида уравнения осуществляется экспериментальным способом, т.е. путем сравнения величины остаточной дисперсии Дост, которая вычисляется по формуле: где n количество наблюдений исследуемого признака, у- фактические данные, - теоретические данные, полученные по уравнению регрессии. Если уравнение проходит через все точки корреляционного поля, то фактическое значение совпадают с теоретическими. Дост=0.
Практически исследование имеет место некоторая рассеянная точка относительно линии регрессии. Это рассеяние обусловлено влиянием изученных моделей факторов. При экспериментальном способе перебираются разные математические функции в автоматическом режиме и из них выбирается та функция, у которой Дост минимально. Если же Д ост оказывается примерно одинаковой для нескольких функций, то предпочтение отдается более простым функциям.
5. линейная регрессия и корреляция: смысл и оценка параметров
Линейная регрессия сводится к нахождению уравнения вида:
Уравнение вида (1) позволяет по заданным значениям фактора Х найти теоретическое значение результативного признака, представляя в уравнение фактическое значение фактора Х. построение линейной регрессии сводится к оценке этих параметров основан на методе наименьших квадратов (МНК) – позволяет получить также оценки параметров а и b при которых сумма квадратов отклонений теоретических значений результативного признака от фактического значения минимальна, т.е
Это означает, что из всех линий регрессии на графике выбирается так, чтобы сумма квадратов между точками и этой линией по вертикали была минимальна.
Чтобы найти минимум функции нужно вычислить частные производные по каждому из неизвестных параметров a и b и приравнять их к нулю.
Решение системы будут следующие уравнения.
Параметр b называется коэффициентом регрессии если а больше 0, то относительное изменение результата У происходит медленнее чем изменение фактора Х. если а меньше нуля, то происходит опережение изменения результата под изменением фактора.
Уравнение регрессии всегда дополняется коэффициентом или показателем тесноты связи.
При использовании линейной регрессии в качестве показателя тесноты связи используется коэффициент корреляции, который обозначается:
Величина коэффициента корреляции находится в пределах единицы
Если b>0 то коэффициент корреляции (-1;0). Величина линейного коэффициента корреляции оценивает тесноту связи признака Х и У в линейной форме. Но это не означает ,что если коэффициент корреляции равен 0, то между Х и У связи нет. Это означает, что нужно пользоваться др. спецификацией. Для оценки качества подбора линейной функции рассчитывается квадрат линейной корреляции. - коэффициент детерминации. Он обозначает долю депрессии результативного признака У, который объясняется регрессией в общей депрессии результативного признака. Т.е. 1- - величина характеризует долю дисперсии, вызванную влиянием остальных неучтенных в регрессии факторов. Служит одним из критериев для оценки качества линейной модели, т.е. чем больше доля объясненной вариации, тем меньше модель хорошо аппроксимирует исходные данные. Следовательно, можно использовать для прогнозирования результат. Признака.
6. оценка существования параметров линейной регрессии и корреляции
после того, как найдено уравнение регрессии проводится оценка значимости его параметров, а также уравнения в целом. Оценка значимости уравнений проводится с помощью F критерия Фишера. Для этого выдвигается гипотеза Но, которая говорит, что b=0, что при Х не оказывае6т влияние на У. непосредственно расчету критерия предшествует анализ дисперсии. Центральное место в этом анализе занимает разложение общей суммы квадратов на 2 составляющие: объясненную и необъясненную.
первая сумма- общая сумма квадратов отклонений результативного признака от среднего уровня. Вторая сумма – сумма квадратов отклонений, объясненная регрессией (факторная).третья сумма- остаточная сумма отклонений, необъясненная часть.
Если фактор Х не оказывает влияния на результат У, то линия регрессии на графике параллельна ОХ и . это означает что вся дисперсия результативного признака обусловлена воздействием прочих неучтенных регрессией факторов. И тогда общая сумма квадратов отклонений совпадает с остаточной. Если же кр факторы не влияют на результат, то У и Х связаны функционально и остаточная равна нулю. в этом случае общая сумма квадратов отклонений совпадает с суммой квадратов отклонений объясненной регрессией. Т.к. не все точки полекорреляциии лежат на линии регрессии, то всегда имеет место их разброс, вызванный влиянием пр. факторов. Сумма квадратов отклонений связана с числом степеней свободы, т.е. с числом свободы независимого варьирования признака. Число степеней свободы связано с числом единиц совокупности n и числом опр. у ней констант. Существует равенство между степенями свободы общей факторной и остаточной суммы квадратов отклонений. N-1=1+(n-2). Разделив каждую сумму квадратов на соотв. Степени свободы получим средний квадрат отклонений или дисперсию на одну. Степень свободы
Сопоставляя факторную и остаточную дисперсии в расчете на одну степень свободы получаем величину F критерия
После нахождения величины F для определения верности гипотезы Но она сравнивается с табличным значением F-критерия. Fтабличное зависит от соотв. Степени свободы и уровня значимости. Fтабл больше F фактической, то гипотеза Но не может быть отвергнута, т.к. есть риск неправильного вывода о наличии связи. В этом случае уравнение считается статистически незначимым, если выполняется обратное неравенство, то гипотеза Но – отвергается и уравнение считается статистически значимым и надежным. Кроме выяснения значимости уравнения в линейной регрессии оценивается так4же значимость параметров. С этой целью по каждому из параметров вычисляется стандартная ошибка.
S- остаточная сумма квадратов на одну степень свободы или остаточная дисперсия. Величина стандартной ошибки совместна с t- распределением Стьюдента, поэтому для оценки существенности параметра b его величина сравнивается со стандартной ошибкой и вычисляется значение и оно сравнивается см табличным значением t критерия. Выводы такие же как при использовании F критерия. Доверительный интервал для коэффициента регрессии в этом случае определяется следующим образом Стандартная ошибка параметра a
.
процедура оценивания существенности параметра ф аналогично процедуре оценивания параметра b. Значимость линейного коэффициента корреляции проверяется на основе величины ошибки коэффициента корреляции.Фактическое значение t-критерия Стьюдента.
7. интервалы прогнозов по линейному уравнению регрессии
В прогнозах расчета по уравнению регрессии определяется предсказываемое значение Ур при подстановке в уравнение регрессии соотв. Значений Хр=Хк. При подстановке Хр получаем точечный прогноз, который явно нереален. Поэтому он дополняется интервальным прогнозом У*.
Стандартная ошибка прогноза вычисляется по формуле
Величина стандартной ошибки достигает минимума когда Хк=Х ср и возрастает при удалении от Х ср в любом направлении. При прогнозировании на основе уравнения регрессии следует помнить, что величина прогноза зависит не только от стандартной ошибки но и от точности прогнозного значения фактора Х ( т.е. от Хр). Его величина может задаваться на основе анализа других моделей исходя из конкретной ситуации.
8. корреляция для нелинейной регрессии
Также как и в линейной регрессии используется линейный коэффициент корреляции. В нелинейной регрессии служит индекс корреляции.
Р (0;1). Чем ближе к 1 том больше связь между рассматриваемыми признаками и тем надежнее уравнение. Коэффициент детерминации- используется для проверки существенности уравнения линейной регрессии по f-критерию Фишера.
где м –число параметров при переменной х, n –число наблюдений.
Число m характеризует число степеней свободы для факторной суммы квадратов. Величина n-m-1 характеризует число степеней свободы для остаточной суммы квадратов. Для степенной функции для параболы
y=a+bx+cx2 .
9. нелинейная регрессия
Нелинейная регрессия бывает 2 видов:
- регрессии нелинейные, относительно включаемых в анализ объясняющих переменных, но линейные относительно оцениваемых параметров.
- регрессии нелинейные по параметрам.
Примером первого вида являются полиномы различных степеней:
y=a+bx+cx2, y=a+bx+cx2+dx3, y=a+bx+cx2+dx3+…+zxn.’
Сюда же можно отнести равностепенную гиперболу y=a+b/x. Ко второму типу относятся степенная, показательная, экспоненциальная функции. Полиномы любого порядка сводятся к линейной регрессии с ее методами проверки гипотез и оцениванием параметров. Параболу целесообразно применять для оцениваемого интервала значения фактора X, когда меняется характер среди исследуемых признаков. При этом применяется МНК для оценивания неизвестных параметров a,b,c. В результате получается система из 3 линейных уравнений с 3 неизвестными.
Решение данной системы возможно методом Крамера.
Если b>0, c<0, то кривая симметрична относительно высшей точки, т.е. точки перелома кривой, изменяющей направление связи, а именно рост сменяется падением. Такую функцию используют при изучении зависимости з\п работников от возраста. Если b<0, c>0, то кривая симметрична относительно низшей точки и это позволяет определить минимум в точке, меняющей направление связи, а именно падение сменяется ростом.
Такая функция используется при изучении зависимости объема выпуска производства от затрат на производство. Ввиду симметричности кривой второго порядка ее не всегда удобно использовать в конкретных исследованиях, поэтому если на диаграмме рассеивания нет четко выраженной параболы, то использовать ее не нужно, а заменить степенной функцией. Среди нелинейных функций параметры которой можно найти с помощью МНК y-a+b/x можно назвать равносторонней гиперболой. Примером такой функции является кривая Филипса, которая характеризует соотношение между нормой безработицы Х и приростом з\п У. регрессии нелинейные оцениваемые по параметрам делятся также на 2 вида:
- нелинейные модели внутренне линейные.
- Нелинейные модели внутренне нелинейные.
Если модель внутренне линейна, то она с помощью некоторых преобразований может быть приведена к линейному виду. Если модель внутренне нелинейная, то она не может быть приведена к линейному виду. Внутренне линейной можно назвать y=axb. чтобы привести ее к линейному виду нужно ее линеаризовать с помощью логарифмирования.lny=ln(ax)b; lny=Y, lna=c; blnx=X. Далее в помощью МНК находится коэффициенты С и В c=lna; a=ec. к таким моделям относятся показательная, логистическая функции. В экономических исследованиях степенная функция используется для определения коэффициента эластичности.
.
эконометрика регрессия прогноз ошибка
Коэффициенты эластичности для различных математических функций.
Вид функции У | Первая производная | Коэффициент эластичности |
1. линейная y=a+b*x | B | |
2. парабола 2 порядка y=a+b*x+c*x2 | b+2cx | |
3. гипербола y=a+b\x | -b\x2 | |
4. показательная y=a*bx | a*bx*lnb | |
5. степенная y=a*xb | a*b*xb-1 | |
6. полулогарифмическая y=a+b*lnx | b/x | |
7.логистическая y=a\(1+b*e-cx) | ||
8. обратная y=1/(a+bx) | -b\(a+bx)2 |
Если модель внутренне нелинейная, то для оценки параметров используются итеративные процедуры. Решение такого типа задач реализовано в стандартных пакетах прикладных программ.
10. средняя ошибка аппроксимации
Фактические значения результативного признака отличаются от теоретических, рассчитанных по уравнению регрессии. Чем меньше это отличие, тем ближе теоретические значения подходят к эмпирическим данным, тем лучше модель. Величина отклонений фактических данных от теоретических, т.е (y-y^) – ошибка аппроксимации, а т.к. эта величина может быть +\-, то ошибка аппроксимации для каждого наблюдения определяется в % по модулю.
.
Допустимый уровень 8-10%.
11. множественная регрессия и корреляция. спецификация модели
Парная регрессии может дать хороший результат при моделировании, если влиянием др. факторов, воздействующих на объект исследования, можно пренебречь. Множественная регрессия широко используется в решении проблем спроса, доходности акций, при изучении функции издержек производства, в макроэкономических расчетах и т.д. основная цель: построить модель с большим числом факторов, определив при этом влияние каждого фактора в отдельности, а также совокупное влияние на моделирование показателей. Множественная регрессия в общем виде можно записать сл. Уравнением:
y=f(x1,x2,…,xn).
12. отбор факторов множественной регрессии
факторы, включаемые в уравнение множественной регрессии должны удовлетворять сл. Требованиям: - должны быть количественно измеримы, не должны быть интеркоррелированы ( т.е. не должны быть связаны друг с другом и тем более не находиться в функциональной зависимости). Если между факторами существует большая корреляция, то нельзя определить их изолированное влияние на результативный признак. Тогда параметры регрессии оказываются не интерпретируемыми. Насыщение модели линейными факторами не снижает величину остаточной дисперсии и не увеличивает показатель детерминации, зато приводит к статистической не значимости уравнения регрессии. И хотя уравнение множественной регрессии позволит получить большое количество факторов, практически необходимости в этом нет, поэтому отбор факторов производится на основе качественного теоретико-экономического анализа. Отбор факторов обычно производится в 2 стадии. На первой выбираются факторы исходя из сущности проблем. На второй стадии на основе матрицы показателей корреляции определяется t- статистики Стьюдента для параметров уравнения регрессии. Это позволяет исключить из модели дублирующие факторы. Считается, что 2 переменные явно коллинеарные, т.е. зависимы, если коэффициент корреляции между ними больше или равен 0,7. 2 переменные дублируют друг друга, поэтому от одной из них необходимо избавиться. В этом случае предпочтение отдается переменной, для которой наблюдается связь с результатом в наименьшей степени. Наибольшие трудности в использовании множественной регрессии возникают при наличии мультиколлинеарности, когда более чем 2 фактора связаны между собой. Включают в модель мультиколлинеарности факторов т.к.: затрудняется интерпретация параметров (теряют смысл); оценки параметров не надежны и обнаруживают большие нестандартные ошибки. Для оценки мультиколлинеарности используется определитель матрицы парных коэффициентов корреляции между факторами. Например, уравнение множественной регрессии имеет вид:
y=a+b1x1+b2x2+b3x3+E.
если rxixi=1, означает что факторы не колленируют между собой. Если между факторами существует полная линейная зависимость, то det R=0. чем он ближе к нулю, тем сильнее мультиколлинеарность факторов и не надежнее уравнение регрессии. Самый простой способ устранения мультиколлинеарности состоит в исключении одного из факторов из модели. Другой подход связан с преобразованием факторов при котором снижается корреляция между ними. Чтобы учесть внутреннюю корреляцию факторов иногда переходят к совмещенным уравнениям.
Y=a+b1x1+b2x2+b3x3+b12x1x3+b23x2x3+E.
Подходы к отбору факторов на основе показателей корреляции различны, что приводит к построению уравнения множественной регрессии разного вида. Наибольшее распространение получили 3 подхода:
1. метод исключения (отсев факторов из полного его набора).
2. метод включения ( дополнительное введение факторов).
3. шаговый регрессионный анализ ( исключение ранее введенного фактора).
13. выбор формы уравнения регрессии
Как и в парной регрессии возможны различные виды: линейные и нелинейные.
Линейные уравнения множественной регрессии имеют вид: y=a+b1x1+b2x2+…+bpxp, где x1,x2,…,xp –факторы, а b1,b2,…,bp- параметры регрессии, b1,…,bp – коэффициенты чистой регрессии. Эти коэффициенты, стоящие перед переменными Х характеризуют средние изменения результативного признака с изменением соответствующего фактора при неизменных значениях др фактора.
Нелинейные: y=ax1b1x2b2….xpbp степенная множественной регрессии. Параметры bi – коэффициенты эластичности. Они показывают изменении результата с изменением соответствующего фактора на 1% при неизменности др. факторов. Такой вид уравнений множественной регрессии используется в производственных функциях, а также в исследовании спроса и предложения. Для построения множественной регрессии используется также функции:y=e в степени a+b1x1+b2x2+…+bpxp – экспонента.
Y=1\( a+b1x1+b2x2+…+bpxp) – обратная (гипербола).
Стандартные компьютерные программы имеют возможность перебирать возможные функции и выбрать из всех только ту, для которой остаточная дисперсия минимальна и ошибка аппроксимации тоже минимальна. Коэффициент детерминации должен быть приближен к 1. если исследователя не устраивает предполагаемый набор функций регрессии, то можно использовать любые др. функции, приводимые к линейным с помощью преобразования. Однако, чем сложнее функция, тем менее интерпретируемы ее параметры, поэтому использование номинальных моделей очень высокого порядка или сложных функций нежелательно.
14. оценка параметров уравнения множественной регрессии
параметры уравнения множественной регрессии как и для парной регрессии находятся с помощью МНК. При его применении строится система нормальных уравнений, решение которых позволяет получить оценки параметров для уравнения множественной регрессии. Для уравнения множественной регрессии линейного вида получается система нормальных уравнений:
в системе р+1 уравнение и р+1 неизвестная. Решение этой системы возможно методом Крамера. При нелинейной зависимости уравнение множественной регрессии необходимо привести к линейному виду, чтобы затем использовать МНК для нахождения. Например использовать метод линеаризации:
y=ax1b1x2b2….xpbp ; lny= ln(ax1b1x2b2….xpbp); lny= lna+b1lnx1+b2lnx2+…+bplnxp; Y=C+b1X1+b2X2+…+bpXp
15. частные уравнении множественной регрессии
частные линейные уравнения множественной регрессии имеют вид:
Если ввести новое обозначение, то получим
На основе частных уравнений регрессии определяются частные коэффициенты эластичности:
16. множественная корреляция
показатели множественной корреляции характеризуют тесноту связи, рассматриваемого набора фактора с исследуемым признаком, т.е. оценивает тесноту связи совместного влияния фактора на результат. Независимо от формы связи показатель множественной корреляции может быть найден как индекс множественной корреляции:
Индекс множественной корреляции как корень лежит в пределах (0;1). Чем ближе к 1, тем теснее связь результативного признака со всем набором исследуемых факторов. При правильном включении фактора в уравнение множественной регрессии величина индекса множественной корреляции будет существенно отличаться от индекса корреляции парной регрессии. Если же дополнительное включение фактора второстепенно, то индекс множественной корреляции будет практически совпадать с индексом корреляции парной зависимости. Расчет индекса множественной корреляции предполагает уравнение регрессии и на его основе остаточной дисперсии.можно пользоваться следующей формулой для индекса множественной корреляции:
17. частная корреляция
частные индексы корреляции характеризуют тесноту связи исследуемого признака и одним из факторов при устранении влияния остальных факторов, включенных в модель. Эти показатели представляют собой отношение сокращения остаточной дисперсии за счет включения доп. Факторов. Если рассматриваемая регрессия с числом факторов Р, то возможны коэффициенты корреляции первого, второго и т.д. Р-1 порядков, т.е.
пример: действие влияния Х1 можно оценить при разных условиях независимого действия др. факторов: ryx1x2 при постоянном действии фактора Х2, ryx1x2x3 при постоянном действии факторов Х2 и Х3. формула в общем виде имеет вид:
18. предпосылки МНК
После построения уравнения множественной регрессии проводится проверка наличия у оценок (y=a+b1x1+b2x2+…+bpxp+E) тех свойств, которые предполагаются при МНК. Это связано с тем, что оценки параметров для уравнения регрессии должны отвечать определенным критериям, а именно: д.б. эффективными, несмещенными, состоятельными.
Несмещенность оценки означает, что математическое ожидание остатков равно нулю. Оценка считается эффективной есл