keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение...

116
ЗАЯВКА на размещение учебно-методических материалов в образовательном портале КЭУ Структура/Кафедра __МЕНД_________________________________________ Автор(ы). Супаева Гульназ Тынаевна ___________________________ (Фамилия Имя Отчество) Вид (тип) материала __Учебно-методический комплекс , лекции_____________ ____________________________________________________________________ (УМК, лекция, лаб.работа, методические указания и т.д.) Предназначен для студентов программ ВПО: Бакалавриат Направление___Экономика Профиль_Финансы и кредит._________ курс III Специалитет (очная форма): Специальность ____________________________ Специализация _____________________________курc ____ Специалитет (заочная форма): Специальность_______________________________ Специализация ______________________________курс__________ Аннотация материала в объеме 2-3 абзаца Формирования фундаментальных экономических знаний на основе эконометрического моделирования. Научить студентов современным эконометрическим методам исследования экономических систем. Первое издание (подчеркнуть) Переиздание (подчеркнуть) Подписи: Автор(ы): ____Супаева Гульназ Тынаевна_________________ Руководитель структуры/Зав кафедрой: __Супаева Г.Т_____________ Дата: 1.09.2014г Виза: ________________ Требования к оформлению: Файл в формате pdf (не более 2 рисунков в формате gif для аннотации) Шрифт: Times New Roman Размер шрифта: 12 пт

Upload: others

Post on 11-Jan-2020

14 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

ЗАЯВКА на размещение учебно-методических материалов в образовательном портале КЭУ Структура/Кафедра __МЕНД_________________________________________ Автор(ы). Супаева Гульназ Тынаевна ___________________________ (Фамилия Имя Отчество) Вид (тип) материала __Учебно-методический комплекс , лекции_____________ ____________________________________________________________________ (УМК, лекция, лаб.работа, методические указания и т.д.) Предназначен для студентов программ ВПО: Бакалавриат Направление___Экономика Профиль_Финансы и кредит._________ курс III Специалитет (очная форма):

Специальность ____________________________

Специализация _____________________________курc ____

Специалитет (заочная форма):

Специальность_______________________________

Специализация ______________________________курс__________ Аннотация материала в объеме 2-3 абзаца Формирования фундаментальных экономических знаний на основе эконометрического моделирования. Научить студентов современным эконометрическим методам исследования экономических систем.

Первое издание (подчеркнуть) Переиздание (подчеркнуть)

Подписи: Автор(ы): ____Супаева Гульназ Тынаевна_________________ Руководитель структуры/Зав кафедрой: __Супаева Г.Т_____________

Дата: 1.09.2014г Виза: ________________

Требования к оформлению: Файл в формате pdf (не более 2 рисунков в формате gif для аннотации) Шрифт: Times New Roman Размер шрифта: 12 пт

Page 2: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ КЫРГЫЗСКОЙ РЕСПУБЛИКИ

СТАНДАРТ ОРГАНИЗАЦИИ

СИСТЕМА МЕНЕДЖМЕНТА КАЧЕСТВА КЫРГЫЗСКОГО ЭКОНОМИЧЕСКОГО

УНИВЕРСИТЕТА ИМ. М. РЫСКУЛБЕКОВА

УТВЕРЖДЕНО

« » 2014 год

Председатель УМС

___________________________

УЧЕБНО-МЕТОДИЧЕСКИЙ КОМПЛЕКС

ПО ДИСЦИПЛИНЕ:

Эконометрика

(наименование дисциплины)

______________экономика, менеджмент, коммерция___________________

(направление, профиль, специальность)

Рассмотрено и одобрено на заседании кафедры

Математики и естественнонаучных дисциплин

от «____» ___________ 2014 г., протокол № ______

Бишкек - 2014

Page 3: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

Введение

Цели и задачи УМК Цели Учебно-методического комплекса (УМК) весьма многоплановы. Главной

целью УМК по дисциплине «Эконометрика» является формирование фундаментальные

экономическое образование студентов на основе современных методов обучения,

способные понимать и анализировать социально- экономические проблемы и процессы,

владеющие эконометрическими методами при проведении теоретических и

экспериментальных исследований, основными навыками математического

моделирования социально-экономических процессов.

Для достижения этой цели постоянно требуется качественное моделирование

образовательной программы, освоение новых образовательных технологий УМК

является планом организации обучения. Здесь четко должен быть отмечены линия

расположения излагаемых тем с учетом межпредметных связей.

Главная задача курса эконометрики состоит в показе заключенных в нем ведущих

идей, основных фактов и положений. Не маловажная задача преподавания курса состоит в

том, чтобы студенты умели создать математические модели экономических процессов и

прогнозировать для описания и объяснения экономических явлений.

Page 4: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ КЫРГЫЗСКОЙ РЕСПУБЛИКИ

КЫРГЫЗСКИЙ ЭКОНОМИЧЕСКИЙ УНИВЕРСИТЕТ ИМ. М РЫСКУЛБЕКОВА

Кафедра: Математики и естественнонаучных дисциплин

ПРОГРАММА

Курса «Эконометрика» по направлениям:

580100 – Экономика

521600 - Менеджмент

580300 - Коммерция

Бишкек 2014

Page 5: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

Программа составлена _____________________________________________________

Научный редактор ________________________________________________________

Одобрено учебно-методическим советом Кыргызского экономического университета им.

М. Рыскулбекова

Page 6: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

Предисловие

Сегодня изучение экономических явлений и процессов стало невозможным не

прибегая к статистическим данным, эконометрическому моделированию и оценке

параметров экономических зависимостей.

«Эконометрика» позволяет проводить количественный анализ реальных

экономических явлений, основываясь на современном развитии теории и наблюдениях,

связанных с методом получения выводов (Самуэльсон). Любая учебная дисциплина имеет

свои пререквизиты, т.е. учебные дисциплины, на которые опирается. Курс

«Эконометрика» прежде всего опирается на курсы «Микроэкономика»,

«Макроэкономика», «Статистика». На основе экономической теории разрабатываются

концепции развития изучаемых процессов. Экономические законы позволяют установить

связи между различными экономическими показателями. Например, микроэкономическая

теория утверждает, что снижение цены товара приводит к увеличению спроса на данный

товар, т.е. устанавливается связь между спросом на товар и ценой на него. Статистика

обеспечивает информационным материалом для построения эконометрической модели.

Изучение эконометрики предполагает, что студенты знакомы базовыми курсами

математического анализа, линейной алгебры, теории вероятностей и математической

статистики. Студент должен знать числовые характеристики а также распределения

дискретных и непрерывных случайных величин.

Программа отражает тот объем знаний, на основании, которого студенты

экономисты могут приобрести достаточно высокую математическую культуру и

фундаментальные знания, необходимые в своих дальнейших работах.

Отмеченные направления требуют знания эконометрики: касающихся методов

построения парной и множественной регрессий, оценивания параметров регрессионных

моделей, оценка значимости параметров с помощью t-теста и F-теста. Уделено

внимание на гетероскедастичноси остатков. Рассматривается эконометрическое

моделирование на основе временных рядов и системы одновременных уравнений.

Каждый раздел имеет собственную нумерацию. Программа курса эконометрики

соответствует требованиям Государственного образовательного стандарта по

направлениям «Экономика» и «Менеджмент».

Page 7: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

Раздел I. Понятие эконометрики и эконометрического моделирования Элементы математической статистики

1.1. Определение эконометрики. Предмет, цель и задачи эконометрики.

1.2. Экономические системы и их моделирование

1.3. Основные этапы эконометрического моделирования

1.4. Данные. Типы переменных. Операции над данными

1.5. Выборочная вариация и правила её расчета

1.6. Точечные и интервальные оценки

1.7. Проверка статистических гипотез

Раздел II. Типы зависимостей. Ковариация и корреляция.

2.1. Типы зависимостей

2.2. Выборочная ковариация и правила её расчета

2.3. Коэффициент корреляции

2.4. Вектор и матрица коэффициентов корреляции. Анализ матрицы коэффициентов

корреляции

Раздел III. Парная регрессия

3.1. Регрессия. Выбор аналитической формы модели.

3.2. Модель парной линейной регрессии. Оценка параметров методом наименьших

квадратов.

3.3. Качество оценивания. Коэффициент детерминации 2R .

3.4. Интерпретация уравнения регрессии.

Раздел IV. Свойства коэффициентов регрессии и проверка гипотез.

4.1. Случайные составляющие коэффициентов регрессии.

4.2. Предположения о случайном члене. Условия Гаусса-Маркова.

4.3. Теорема Гаусса-Маркова.

4.4. Расчет стандартных ошибок коэффициентов регрессии.

4.5. Проверка гипотез относящихся к коэффициентом регрессии.

4.6. Доверительные интервалы

4.7. Нелинейные регрессии и методы их линеаризации.

Page 8: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

Раздел V. Множественная регрессия

5.1. Спецификация модели

5.2. Множественная линейная регрессия. Оценка параметров методом наименьших

квадратов (МНК)

5.3. Оценка значимости модели множественной регрессии и её параметров. F и t -

тесты.

5.4. Мультиколлинеарность

5.5. Спецификация и классификация переменных. Замещающие, фиктивные и

лаговые переменные.

5.6. Метод инструментальных переменных.

5.7. Гетероскедастичность и её последствия.

5.8. Обнаружение гетероскедастичности. Тест ранговой корреляции Спирмена,тест

Голдфелда-Квандта, тест Глейзера.

5.9. Нелинейная множественная регрессия. Производственная функция Кобба-

Дугласа.

Раздел VI. Временные ряды.

6.1. Классификация и компетентный анализ временных рядов.

6.2. Автокорреляция уровней временного ряда. Коррелограмма и её применение.

6.3. Сглаживание временных рядов.

6.4. Динамические эконометрические модели.

6.5. Моделирование тенденции временного ряда.

6.6. Прогнозирование с помощью линейного тренда.

Литературы

Основная

1. Доугерти К. Введение в эконометрику. М.: ИНФРА-1997г. 2. Айвазян С.А., Мхитарян В.С. Прикладная статистика и основа эконометрики:

Учебник для вузов. М.:ЮНИТИ, 1988г. 3. Тихомиров Н.П., Дорохина Е.Ю.Эконометрика. Учебник «Экзамен» М.:2003г. 4. Орлов А.И. Эконометрика. Учебник «Экзамен» М.:2003г. 5. Катышев П.К., Пресецкий А.А. сборник задач к начальному курсу по

эконометрике. М.: дело, 1997г. 6. Кулинич Е.И. Эконометрия. М.: Финансы и статистика,1999г. 7. Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика. Начальный курс-

М.:Дело 1997г.

Page 9: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

8. Андерсон Т. Статистический анализ временных рядов-М.:Мир, 1976. 9. Бриллинджер Д.Временные ряды: Обработка данных и теория-М.:Мир,1980г. 10. Кендал М.Дж., Стьюарт А. Многомерный статистический анализ и временные

ряды-М.:Наука,1976г. 11. Кендал М. Временные ряды-М.:Финансы и статистика,1981г. 12. Феллер Ф. Введение в теорию вероятностей и ее приложения-М.:Мир,Т1,2, 1984г. 13. Менкью Н.Г. Макроэкономика М.:1994г. 14. Макконелл К., Брю С., Экономикс-1992г. 15. Дорнбуш Р., Фишер С. Макроэкономика-М.:1997г. 16. Мхитарян В.С., Архипова М.Ю. и др. Эконометрика, учебник. М.:2008г. 17. Валентинов В.А. эконометрика, учебник. М.: 2008г. 18. Эконометрика. Учебник. Под редакцией члена- корреспондента РАН И.И.

Елисеевой. М.:2009г. 19. Эдвард Новак. Введение в методы эконометрики. Сборник задач М.:2004г. 20. Андерсон Т. Введение в многомерный статистический анализ. М.: Физматгиз,

1963г.

Дополнительная

21. Джонстон Дж. Эконометрические методы М.: Статистика,1980г. 22. Кендалл М.Дж., Стьюарт А. Теория распределений М.: Наука 1966г. 23. Математика в социологии. Моделирование и обработка информации М.:Мир,

1977г. 24. Замков О.О., Черемных Ю.А., Толстопятенко А.В. Математические методы в

экономике –М.:Дело и сервис, 1999г. 25. Селищев А.С.Макроэкономика, Учебник для вузов М.:2000г. 26. Смирнов А.Д. Лекции по макро-экономическому моделированию М.:2000г. 27. Елисеев И.И. и др. Теория статистики с основам и теории вероятностей. Под ред.

И.И. Елисеевой- М.: ЮНИТИ,2001г. 28. Боровков А.А. Математическая статистика. Оценка параметров. Проверка гипотез-

М.:Наука,1984г. 29. Эконометрика. Конспект лекций. М.:Эксмо 2008г. 30. Варюхин А.М., Панхина О.Ю. Яковлева А.В. Эконометрика конспект лекций

М.:Юрайт. 2007г. 31. Яновский Л.П., Буховец А.Г. Введение в эконометрику. Учебное пособие

М.:КНОРУС,2007г. 32. Гладилин А.В.,Герасимов А.Н., Громов Е.И. Эконометрика. Учебное пособие.

М.:КНОРУС,2008г. 33. Эрнст Берндт. Практика эконометрики. М.:ЮНИТИ,2005г.

Page 10: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ КЫРГЫЗСКОЙ РЕСПУБЛИКИ

СТАНДАРТ ОРГАНИЗАЦИИ

СИСТЕМА МЕНЕДЖМЕНТА КАЧЕСТВА КЫРГЫЗСКОГО ЭКОНОМИЧЕСКОГО

УНИВЕРСИТЕТА ИМ. М. РЫСКУЛБЕКОВА

Кафедра Математики и естественнонаучных дисциплин

РАБОЧАЯ ПРОГРАММА

по дисциплине Эконометрика

(наименование дисциплины)

По направлениям _580100 – Экономика, 521600-Менеджмент, 580300-Коммерция

(шифр, наименование специальности)

форма обучения ________________дневная______________________________

(дневная, заочная)

Всего__3__ кредитов

Курс ___3___

Семестр __5___

Количество рубежных контролей (РК) _2__ СРС ___45___ часов,

Экзамен __5__ семестр

Всего аудиторных часов ___45__

Всего внеаудиторных часов _____

Общая трудоемкость ____90___ часов

Бишкек-2014

Page 11: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

Рабочая программа составлена на основании_______________________

_____________________________________________________________________________

_____________________________________________________________________________

___________ /документ кем и когда выдан/

Рабочую программу разработал (а)

_________________________________________________________________

/ФИО, должность, звание/

кафедры________________________________ ________________

/подпись/

Обсуждена и рекомендована на заседании кафедры

Математики и естественнонаучных дисциплин__

«____»______________2014 г. Протокол №____

Зав. кафедрой ___________________ (Ф.И.О.)

Page 12: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

Введение

2. Цели и задачи дисциплины, её место в учебном процессе

Цель дисциплины. Основной целью изучения курса является - разработка способов

моделирования и количественного анализа реальных экономических объектов; дать

студентом четкое представление об эконометрических методах и моделях реальных

экономических явлений; научить студентов интерпретировать и исследовать построенные

модели для количественной оценки и прогнозирования деятельности экономических

субъектов.

Задачи дисциплины

- построение эконометрических моделей для эмпирического анализа;

- оценка параметров построенной модели;

- проверка качества параметров модели самой модели в целом;

- составление прогноза и рекомендаций для конкретных экономических явлений по

результатом эконометрического моделирования. “Эконометрика” рассматривается как

дисциплина объединяющая совокупность результатов, методов и приемов

экономической теории, экономической статистики и математического инструментария

для количественного выражения качественных закономерностей и должна входит в

учебные планы подготовки экономистов всех специальностей в качестве базовой,

обязательной дисциплины. Конкретные задачи, связанные с профессиональным

образованием;

- построение математической модели с учетом свойств экономических объектов;

- определение параметров модели экономического процесса;

- получение точечного и интервального прогноза экономического процесса.

3. Требования к уровню освоения дисциплины

Студент, в результате освоения дисциплину, должен обладать следующими

компетенциями.

Общие компетенции

-владеет математическим инструментарием, способен к обобщению, анализу

полученной информации;

Page 13: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

-способен анализировать экономические проблемы и прогнозировать возможные

направления развития экономического процесса в будущем;

- способен критически оценивать свои достоинства и недостатки;

-осознать социальную значимость своей будущей профессии, обладать высокой

мотивацией к получению высокого профессионального образования;

-владеет основными методами и навыками математического моделирования

экономических процессов;

Профессиональные компетенции.

- Способен собирать и анализировать исходные данные, необходимые для решения

социально-экономических и финансовых задач;

- Способен на основе описать экономических процессов и явлений строить

стандартные теоретические и эконометрические модели;

- Способен анализировать и содержательно интерпретировать полученные результаты;

- Способен понимать роль математики в решении экономических задач;

Уметь:

-оценить параметров построенной модели;

-проверить качество полученных параметров модели

-проверить гипотезы относительно оценённых параметров

-владеет методами корреляционного и регрессионного анализа

-уметь линеаризовать нелинейных регрессий;

-уметь устранить мультиколлинеарности факторов, гетероскедастичности и

автокорреляции остатков.

-уметь сглаживать временные ряды;

-уметь анализировать системы одновременных уравнений.

Page 14: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

4.Объем дисциплины и виды учебной работы

п/п

Вид учебной

работы

Кол-во

часов

Семестры

V VI VII VIII

1 Общая

трудоемкость

дисциплины

90 90

2 Аудиторные

занятия

45 45

3 Лекция (контактные

занятия)

45 45

4 Лабораторно-

практические

занятия

-

-

5 Практические

(семинарские)

занятия

-

-

6 Самостоятельная

работа студентов

45 45

7 Курсовая работа

(проект)

- -

8 Реферат( расчетное-

графические

работы)

11 11

9 Контрольные

работы

4 4

10 Учебная практика - -

11 Вид итогового

контроля

(зачет, экзамен)

3 экзамен

Page 15: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

5. Содержание дисциплины (тематический план)

№ Темы контактных занятий Количество часов Наглядность,

ТСО

Форма

контроля Всего Контакт. СРС

I. Блок. Элементы

выборочной теории.

Регрессия.

1 Предмет эконометрики.

Экономические системы и

их моделирования Этапы

моделирования.

4

2

2

Схемы

Опрос

2 Элементы математической

статистики и теории

вероятностей. Средние

величины. Операции над

данными.

4 2 2 Расчетные

формулы

Опрос,

домашние

задания

3 Выборочная ковариация,

дисперсия и правила их

расчеты.

4 2 2 Расчетные

формулы

Опрос,

домашние

задания

4 Функциональная,

статистическая

корреляционная

зависимости.

Выборочный

коэффициент корреляции.

4

2

2

Графики,

диаграмма

Опрос,

домашние

задания

5 Решение задач 4 2 2

6 Линейная модель парной

регрессии. Оценка

параметров регрессии

методом наименьших

квадратов. Интерпретации

уравнения регрессии.

9

4

5

Графики

Опрос,

домашние

задания

7 Качество оценивания.

Коэффициент

детерминации 2R .

8

4

4

Графики

Опрос,

домашние

задания

Page 16: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

Дисперсия ошибок.

8 Средняя ошибка

аппроксимации 4 2 2

9 Контрольная работа по

1му блоку 2 2

Подведение

итога

контрольной

работы

II Блок. Свойства

коэффициентов регрессии

и проверка гипотез

10

Предложения о случайном

члене в уравнении

регрессии. Условия

Гаусса-Маркова

7

2

5

Графики

схемы Опрос

11

Расчет стандартных

ошибок коэффициентов

регрессии

4 2 2

12 Статистические гипотезы

относительно

коэффициентов регрессии

и их проверка.

8

4

4

Опрос,

домашние

задания

13

Нелинейная регрессия.

Подбор линеаризующего

преобразования.

10 4 6

Графики

разброса

точек

Опрос,

домашние

задания

14

Множественная линейная

регрессия. Оценка

параметров методом

наименьших квадратов.

Мультиколлинеарности и

её последствия

8 4 4 Графики

схемы

Опрос,

домашние

задания

15 Обобщенный метод

наименьших квадратов 3 2 1 Схемы Опрос

16 Решение задач 4 2 2

Page 17: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

17 Контрольная работа по II-

блоку 3 3

Подведение

итоговой к/р

Итого 90 45 45

6. Учебно-методическое обеспечение дисциплины Рекомендуемая литература (хранятся в научной библиотеке КЭУ и в центральной

республиканской библиотеке и в интернете)

Основная

1.Доугерти К.Введение в эконометрику. Учебник 2-е изд.- М.; Инфра - м, 2004

2.Кремер Н.Ш. Путко Б.А Эконометрика .-М.; юнити,2003

3.Эконометрика. Под редакцией И.И.Елисеевой - М.; Финансы и статистика,2005

4.Мхитарян В.С., Архипова М.Ю. и др. Эконометрика – М.; Проспект,2008

5.Валентинов В.А. Эконометрика - М.; 2009.

6.Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика начальный курс. - М.;

Дело,2007.

7.Колемаев В.А Эконометрика - М.; Инфра – М,2005.

8.Практикум по эконометрике. Под редакций Елисеевой И.И – М.; «Финансы и

статистика», 2005.

9.Эдвард Новак. Введение в методы эконометрики. Сборник задач. - М.; «Финансы и

статистика»,2004

Дополнительная.

1.Джонатон Дж. Эконометрические методы. - М.; Статистика,1980

2.Орлов А.И. Эконометрика, Ростов-на-Дону; Феникс,2009

3.Эконометрика, под редакцией И.И. Елисеевой =М.; Проспект,2009

4.Гореева Н.М, Орехов С.А и др. Эконометрика в схемах и таблицах – М.; ЭКСМО,2008

5,Новиков А.И Эконометрика, учебное пособие – М.; Инфра – м, 2008

Page 18: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

6.Эрнст Берндт, Практика эконометрики классика и современность. – М.; ЮНИТИ,2005

7.Катышев П.К., Магнус Я.Р., Пересецкий А.А, Головань С.В. Сборник задач к

начальному курсу эконометрики – М.;Дело,2007

Учебные материалы по эконометрике на английском языке в интернете

1. Herman Bierens (Penn State), http: ekon. La.psu.edu/ /-bbierens/ LECNOTES. HTM.

2. Michael Creel (Barcelona), http// pareto.uab.es / mcreel / Econometrics /ekonometrics. Pdfs.

3. Daniel/ Mc Fadden (Berkeley), http;//elsa.berkeley.edu/users / Powell /e 240b fo2/e 240

b.html.

7. Самостоятельная работа студентов (СРС) № п/п

Содержание работы Трудоемкость, часов

Учебно-методическое обеспечение

Форма контроля

1 Предмет эконометрики.

Экономические системы и

их моделирования Этапы

моделирования.

2

1. Доугерти К. Введение в эконометрику. М.: ИНФРА-1997г.

2. Айвазян С.А., Мхитарян В.С. Прикладная статистика и основа эконометрики: Учебник для вузов. М.:ЮНИТИ, 1988г.

3. Тихомиров Н.П., Дорохина Е.Ю.Эконометрика. Учебник «Экзамен» М.:2003г.

4. Орлов А.И. Эконометрика. Учебник «Экзамен» М.:2003г.

Контрольные

работы

2 Элементы математической

статистики и теории

вероятностей. Средние

величины. Операции над

данными.

2 Контрольные

работы

3 Выборочная ковариация,

дисперсия и правила их

расчеты.

2

Опрос,

Контрольные

работы

4 Функциональная,

статистическая

корреляционная

зависимости.

Выборочный

коэффициент корреляции.

2

Опрос,

Контрольные

работы

5 Линейная модель парной

регрессии. Оценка

5

Контрольные

работы

Page 19: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

параметров регрессии

методом наименьших

квадратов. Интерпретации

уравнения регрессии.

5. Катышев П.К., Пресецкий А.А. сборник задач к начальному курсу по эконометрике. М.: дело, 1997г.

6. Кулинич Е.И. Эконометрия. М.: Финансы и статистика,1999г.

7. Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика. Начальный курс-М.:Дело 1997г.

8. Андерсон Т. Статистический анализ временных рядов-М.:Мир, 1976.

9. Бриллинджер Д.Временные ряды: Обработка данных и теория-М.:Мир,1980г.

10. Кендал М.Дж., Стьюарт А. Многомерный статистический анализ и временные ряды-М.:Наука,1976г.

6 Качество оценивания.

Коэффициент

детерминации 2R .

Дисперсия ошибок.

5

Контрольные

работы

7 Средняя ошибка

аппроксимации 3

Контрольные

работы

8 Предложения о случайном

члене в уравнении

регрессии. Условия

Гаусса-Маркова

5

Контрольные

работы

9 Расчет стандартных

ошибок коэффициентов

регрессии

2 Контрольные

работы

10

Статистические гипотезы

относительно

коэффициентов регрессии

и их проверка.

4

Контрольные

работы

11 Нелинейная регрессия.

Подбор линеаризующего

преобразования.

6

Опрос,

домашние

задания

12

Множественная линейная

регрессия. Оценка

параметров методом

наименьших квадратов.

Мультиколлинеарности и

её последствия

5 Контрольные

работы

13

Обобщенный метод

наименьших квадратов 2

Контрольные

работы

Итого 45

Page 20: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ КЫРГЫЗСКОЙ РЕСПУБЛИКИ

СТАНДАРТ ОРГАНИЗАЦИИ

СИСТЕМА МЕНЕДЖМЕНТА КАЧЕСТВА КЫРГЫЗСКОГО ЭКОНОМИЧЕСКОГО

УНИВЕРСИТЕТА ИМ. М. РЫСКУЛБЕКОВА

Кафедра Математики и естественнонаучных дисциплин

ПРОГРАММА ОБУЧЕНИЯ СТУДЕНТОВ

(Syllabus)

по дисциплине Эконометрика_____

наименование дисциплины

для специальности ______580100 – Экономика, 521600-Менеджмент, 580300-Коммерция

(шифр, наименование специальности)

форма обучения ________________дневная______________________________

(дневная, заочная)

Всего__3__ кредитов

Курс ___3___

Семестр __5___

Количество рубежных контролей (РК) _2__ СРС ___45___ часов,

Экзамен __5__ семестр

Всего аудиторных часов ___45__

Всего внеаудиторных часов _____

Общая трудоемкость ____90___ часов

Бишкек - 2014

Page 21: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

Силлабус составлен на основании________________________________

_____________________________________________________________________________

_____________________________________________________________________________

___________ /документ кем и когда выдан/

Обсужден и рекомендован на заседании кафедры

________________________________________________

«____»_______ 2014г. Протокол №____

Зав. кафедрой ___________________ (Ф.И.О.)

Page 22: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

Название и код дисциплины: Вузовский компонент КПВ «Эконометрика»

ФИО: Супаева Гульназ Тынаевна и.о. доц. кафедры «Математики и естественнонаучных

дисциплин» каб. 103. Стаж работы 17 лет.

Контактная информация: режим пребывания на кафедре все дни недели, кроме

воскресенья

Тел. : раб.0312325120, [email protected]

Количество кредитов: 3

Дата: 2014-15 учебный год, 5-семестр

Цели и задачи дисциплины.

Основной целью изучения курса является - разработка способов моделирования и

количественного анализа реальных экономических объектов; дать студентом четкое

представление о эконометрических методах и моделях реальных экономических явлений;

научить студентов интерпретировать и исследовать построенные модели для

количественной оценки и прогнозирования деятельности экономических субъектов.

Задачи дисциплины

- построение эконометрических моделей для эмпирического анализа;

-оценка параметров построенной модели;

-проверка качества параметров модели самой модели в целом;

- составление прогноза и рекомендаций для конкретных экономических явлений по

результатом эконометрического моделирования. “Эконометрика”

рассматривается как дисциплина объединяющая совокупность результатов, методов и

приемов экономической теории, экономической статистики и математического

инструментария для количественного выражения качественных закономерностей и

должна входит в учебные планы подготовки экономистов всех специальностей в

качестве базовой, обязательной дисциплины. Конкретные задачи, связанные с

профессиональным образованием;

-построение математической модели с учетом свойств экономических объектов;

-определение параметров модели экономического процесса;

Page 23: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

-получение точечного и интервального прогноза экономического процесса.

Описание курса

Эконометрика буквально означает – наука об экономических измерениях. Эконометрика – это научная дисциплина, рассматривающая методы и модели исследования экономических явлений на базе экономической теории, экономической статистики с помощью математического инструментария. Из приведенного описание курса следует, что эконометрика есть единство трех составляющих – статистики, экономической теории и математики. Статистические методы занимают в эконометрике основное место. Многие излагаемые материалы не обладают техническими сложностями. Курс начинается с рассмотрения ковариаций и дисперсий и их свойства. Более детально будет изучен парный регрессионный анализ. На наш взгляд «камнем преткновения» для студента является экономическая интерпретация уравнения регрессии и эксперимента по методу Монте–Карло. В курсе рассматривается различные аспекты множественной регрессии, некоторые обобщения множественной регрессии. Курс заканчивается рассмотрением интерпретации коэффициентов множественной регрессии.

Пререквизиты

Данный курс опирается на курсы «Математики», «Теории вероятностей и математической статистики» которые были пройдены в рамках бакалаврской подготовки. Для понимание этого курса вполне достаточно знание матричной алгебры, распределения случайных величин и их числовых характеристик.

Постреквизиты

Изучив этот курс студенты могут овладевать инструментами эконометрического прогнозирования изучаемых экономических явлений. С помощью эконометрических методов глубже изучаются влияния и взаимосвязь экономических факторов.

Календарно-тематический план распределения часов

с указанием недели, темы

№ Тема Неделя

согласно

графика

учебного

процесса

Часы Литература Форма

контроля

1 Предмет эконометрики.

Экономические

системы и их

моделирования Этапы

моделирования.

1 2 1. Доугерти К. Введение в эконометрику. М.: ИНФРА-2003г.

Контрольная

работа

Page 24: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

2 Элементы

математической

статистики и теории

вероятностей. Средние

величины. Операции

над данными.

1 3 2. Айвазян С.А., Мхитарян В.С. Прикладная статистика и основа эконометрики: Учебник для вузов. М.:ЮНИТИ, 2000г. 3. Тихомиров Н.П., Дорохина Е.Ю.Эконометрика. Учебник «Экзамен» М.:2003г. 4. Орлов А.И. Эконометрика. Учебник «Экзамен» М.:2003г. 5. Катышев П.К., Пресецкий А.А. сборник задач к начальному курсу по эконометрике. М.: дело, 2002г. 6. Кулинич Е.И. Эконометрия. М.: Финансы и статистика,2001г. 7. Магнус Я.Р., Катышев

Контрольная

работа

3 Выборочная

ковариация, дисперсия

и правила их расчеты.

2 2 Контрольная

работа

4 Функциональная,

статистическая

корреляционная

зависимости.

Выборочный

коэффициент

корреляции.

2 3

Контрольная

работа

5 Решение задач 3 3 Контрольная

работа

6 Линейная модель

парной регрессии.

Оценка параметров

регрессии методом

наименьших квадратов.

Интерпретации

уравнения регрессии.

3 3

Контрольная

работа

7 Качество оценивания.

Коэффициент

детерминации 2R .

Дисперсия ошибок.

4 2

Контрольная

работа

8 Средняя ошибка

аппроксимации

4 4

9

Предложения о

случайном члене в

уравнении регрессии.

5 3 Контрольная

работа

Page 25: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

Условия Гаусса-

Маркова

П.К., Пересецкий А.А. Эконометрика. Начальный курс-М.:Дело 2003г. 8. Андерсон Т. Статистический анализ временных рядов-М.:Мир, 2001. 9. Бриллинджер Д.Временные ряды: Обработка данных и теория-М.:Мир,2000г. 10. Кендал М.Дж., Стьюарт А. Многомерный статистический анализ и временные ряды-М.:Наука,2001г.

10

Расчет стандартных

ошибок коэффициентов

регрессии

5 4 Контрольная

работа

11 Статистические

гипотезы относительно

коэффициентов

регрессии и их

проверка.

6 3

Контрольная

работа

12

Нелинейная регрессия.

Подбор

линеаризующего

преобразования.

6 3

Контрольная

работа

13

Множественная

линейная регрессия.

Оценка параметров

методом наименьших

квадратов.

Мультиколлинеарности

и её последствия

7 4

Контрольная

работа

14 Обобщенный метод

наименьших квадратов

8 3 Контрольная

работа

15 Решение задач 8 3 Контрольная

работа

Итого 8 недель 45 часов

График самостоятельной работы студентов № Недели

Месяцы 1 2 3 4 5 6 7 8 Суммы балов

ноябрь декабрь 1 Текущий

контроль 20 баллов

20 баллов 40 баллов

2 Срок сдачи К.Р.

24.11.- 1.12. 14 15.12.- 19.12.14

К.Р. – контрольная работа

Page 26: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

Примечание: Форма контроля и точная дата устанавливается преподавателями ведущие занятия.

Литература Основная

1.Доугерти К.Введение в эконометрику. Учебник 2-е изд.- М.; Инфра - м, 2004

2.Кремер Н.Ш. Путко Б.А Эконометрика .-М.; юнити,2003

3.Эконометрика. Под редакцией И.И.Елисеевой - М.; Финансы и статистика,2005

4.Мхитарян В.С., Архипова М.Ю. и др. Эконометрика – М.; Проспект,2008

5.Валентинов В.А. Эконометрика - М.; 2009.

6.Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика начальный курс. - М.;

Дело,2007.

7.Колемаев В.А Эконометрика - М.; Инфра – М,2005.

8.Практикум по эконометрике. Под редакций Елисеевой И.И – М.; «Финансы и

статистика», 2005.

9.Эдвард Новак. Введение в методы эконометрики. Сборник задач. - М.; «Финансы и

статистика»,2004

Дополнительная.

1.Джонатон Дж. Эконометрические методы. - М.; Статистика,1980

2.Орлов А.И. Эконометрика, Ростов-на-Дону; Феникс,2009

3.Эконометрика, под редакцией И.И. Елисеевой =М.; Проспект,2009

4.Гореева Н.М, Орехов С.А и др. Эконометрика в схемах и таблицах – М.; ЭКСМО,2008

5,Новиков А.И Эконометрика, учебное пособие – М.; Инфра – м, 2008

6.Эрнст Берндт, Практика эконометрики классика и современность. – М.; ЮНИТИ,2005

7.Катышев П.К., Магнус Я.Р., Пересецкий А.А, Головань С.В. Сборник задач к

начальному курсу эконометрики – М.;Дело,2007

Page 27: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

Учебные материалы по эконометрике на английском языке в интернете

1. Herman Bierens (Penn State), http: ekon. La.psu.edu/ /-bbierens/ LECNOTES. HTM.

2. Michael Creel (Barcelona), http// pareto.uab.es / mcreel / Econometrics /ekonometrics. Pdfs.

3. Daniel/ Mc Fadden (Berkeley), http;//elsa.berkeley.edu/users / Powell /e 240b fo2/e 240

b.html.

Политика выставления баллов Баллы итоговой оценки распределяются следующим образом:

Текущая контрольная работа – 40%

Рубежная контрольная работа – 40%

Итоговый контроль (письменный экзамен) –20%

При выведении итоговой оценки будут учитываться активность студентов в решении задач, предлагаемых на занятиях.

Текущая контрольная работа (домашние задания) необходимы для закрепления изученного материала, а также для проверки уровня понимания материала. Домашние задания будут содержать задачи вычисления, использующие основные факты и положения. Выполнение домашних заданий даст возможность студентам понимать на должном уровне пройденный материал.

Рубежная контрольная работа дается для проверки знаний по текущим материалам. Будут предложены расчетные задачи, а также теоретические задания раскрывающие понимание основных определений Правильное выполнение контрольных работ даст студентам приобрести высоких зачетных баллов. Одним из основных условий набора высоких баллов является владение студентом пройденного материала на достаточно высоком уровне. Контрольные работы будут проходить в установленное время. Пересдача контрольных работ не предусматривается.

Итоговый контроль – это письменный экзамен. Получив экзаменационный билет, студент должен в письменной форме изложить ответы на экзаменационные вопросы. Чтобы студенты могли, надлежащим образом подготовиться к экзамену заранее дается перечень экзаменационных вопросов. Ответ считается наилучшим, если теоретические факты будут иллюстрированы конкретными примерами. Примечание. Домашние работы должны быть представлены в точно установленный преподавателем срок. В случае сдачи работ после установленного срока снимается 50% баллов полученных студентом.

Page 28: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

Политика курса для успешной работы преподавателя и студента надо соблюдать следующие правила:

- Не пропускать занятия; - отключить сотовый телефон; - активно участвовать в учебном процессе; - своевременно выполнять домашние задания. Методы преподавания:

- лекции; - дискуссии;

Форма контроля знаний

Оценка знаний будет проводиться на основе европейской системы ECTS. Система ECTS изначально делит студентов между группами «зачтено», «не зачтено», а затем оценивает работу этих двух групп по отдельности.

Студенты, набравшие более 50 баллов, получают оценку «зачтено». Из групп получившие оценки «зачтено» на основании итогового контроля получают оценки «отлично» (от 85 до 100 баллов), «хорошо» (от 70 до 84 баллов), «удовлетворительно» (от 50 до 69 баллов).

Вопросы для подготовки к экзамену

1. Виды случайных величин. Примеры

2. Числовые характеристики дискретных случайных величин. Математическое

ожидание и дисперсия

3. Оценки. Виды оценок

4. Выборочная ковариация как оценка теоретической ковариации. Правила расчета

ковариации

5. Выборочная дисперсия как оценка теоретической дисперсии. Правила расчета

дисперсий.

6. Теоретическое и выборочное коэффициенты корреляции

7. Парная линейная регрессия. Составляющие линейной регрессии

8. Описание случайной составляющей

9. Оценка коэффициентов линейной регрессии методом наименьших квадратов

10. Интерпретация уравнения линейной регрессии

11. Качество оценки линейной регрессии. Коэффициент детерминации

12. Эксперимент по методу Монте-Карло

13. Условия Гаусса-Маркова относительно случайного члена линейной регрессии

Page 29: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

14. Несмещенность коэффициентов регрессии

15. Проверка гипотез, относящихся к коэффициентом регрессии

16. Уровень значимости принятие гипотез

17. t – статистика

18. Доверительные интервалы для коэффициентов регрессии

19. Множественный регрессионный анализ. Примеры из экономики

20. Линейное регрессионное уравнение с двумя переменными

21. Отбор наиболее существенных объясняющих переменных в регрессионной модели

22. Оценка параметров линейной регрессии с двумя независимыми переменными

методом наименьших квадратов

23. t – тесты и доверительные интервалы для коэффициентов множественной

регрессии

24. Мультиколлинеарность

Page 30: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ КЫРГЫЗСКОЙ РЕСПУБЛИКИ

КЫРГЫЗСКИЙ ЭКОНОМИЧЕСКИЙ УНИВЕРСИТЕТ ИМ. М. РЫСКУЛБЕКОВА

Кафедра Математики и естественнонаучных дисциплин

УЧЕБНО-МЕТОДИЧЕСКИЕ МАТЕРИАЛЫ

по дисциплине Эконометрика

наименование дисциплины

по направлениям Экономика, Менеджмент, Коммерция, Бизнес-информатика____

Бишкек - 2014

Page 31: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

Задания для самостоятельной работы студентов

Задание №1

1.Обьем продукции в млн. ден. ед. (у) и объем использованных материалов в млн. ден.

ед ( х ) на предприятии в течении 10лет формировались следующим образом .

Год,t 1 2 3 4 5 6 7 8 9 10

tX 0.9 0.7 0.8 0.8 0.9 0.8 1.0 0.8 1.3 1.0

tX 1.5 1.2 1.4 1.3 1.5 1.3 1.6 1.4 2.2 1.6

Предложить аналитическую форму модели зависимости у от переменой х.

(2б)

2. Переменные 2,1, yxy в течение 9лет принимаем следующие значения

t 1 2 3 4 5 6 7 8 9

ty 32 38 50 52 66 83 85 96 97

x 1t 53 54 54 58 61 66 75 79 88

x 2t 7.0 4.4 4.1 2.7 2.2 2.6 1.8 1.6 2.3

Рассчитайте средние ,y ,2,1 xx ,,, 22

22 xxy вариации ),(),(),( 21 xVarxVaryVar и

ковариации ).(),,(),,( 2,121 xxCovxyCovxyCov

3.Имеется значения двух признаков; расходы на покупку продовольственных товаров в

общих расходы, (% у) и средняя. Заработная плата одного работающего (сом, х) по семи

областям Республики

Области

Чуйская Иссык-

кульская

Нарынская Таласская Жалал-

Абадская

Ошская Баткенская

y % 68,8 59,9 56,7 54,3 55,0 61,2 49,3

xтысяч.

с

9,0 7,8 8,3 6,4 5,2 5,7 4,1

Рассчитать линейный коэффициент корреляции xyr (3б)

Page 32: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

4.По 12 районам имеется данные среднедушевой прожиточный минимум в день одного

трудоспособного, сом (х) и среднедневная заработная плата сом (у)

№ работа 1 2 3 4 5 6 7 8 9 10 11 12

Х 78 82 87 79 89 106 67 88 73 87 76 115

У 133 148 134 154 162 195 139 158 152 162 159 173

Построить линейное уравнение парной регрессии y от x (4б)

Домашнее Задание №2

1.Для пяти предприятий имеется данные зависимость себестоимости единицы издания (у,

тыс. ден. ед.) от величины выпуска продукции ( х , тыс.шт.)

ix 2 3 4 5 6

iy 1,9 1,7 1,8 1,6 1,6

Пологая что между переменными ух, имеет место линейная зависимость вычислить;

а) коэффициент детерминации ;2R

б) дисперсию остатков;

в) стандартные ошибки оценок коэффициентов регрессии. (4б)

2.Если имеет место условия Гаусса-Маркова, то докажите что D(a)=)(

22

xnVarx ;

D(в)=)(

2

xnVar

(5б)

3.В следующей таблице приведены ежегодные значение денежной массы и

национального дохода некоторой гипотетической страны

Год,t 1 2 3 4 5 6 7 8 9 10

Денежная

масса, х

2,0 2,5 3,2 3,6 3,3 4,0 4,2 4,6 4,8 5,0

Национальный

доход

5,0 5,5 6,0 7,0 7,2 7,7 8,4 9,0 9,7 10,0

а) Постройте регрессию национального дохода (у) на денежную массу (х) б) Постройте 95%-ный доверительный интервал для оцениваемых параметров; в) На уровне 5%-ной Значимости, проверьте гипотезы 1) 0;0 H 2) .1;0 H (5б)

Page 33: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

Домашнее задание №3

1.Построить регрессионную зависимость расходов на питание у от доходов х по

следующим данным

ix 2 6 10 14 18

iy 1 2 4 11 12

Предполагается, что зависимость имеет вид uху (5б)

2. Заданы наблюдаемые значения переменных 2,1, xxу

Оценить структурные параметры,

дисперсии случайных отклонений, а

также стандартные погрешности

оценивания структурных параметров линейной модели

uхху 22110 (5б)

3.На основе наблюдаемых значений переменных 1, xу и 2х

Построена регрессия, 21 25,025,125,0 хху а так же матрица дисперсии и

ковариации оценок структурных параметров

t ,tУ 1t

X 2Xt

1 2 0 0

2 2 1 0

3 3 0 0

4 3 1 1

5 5 1 1

t ty 1t

X 2t

X

1 0 0 0

2 0 0 1

3 1 1 1

4 1 1 1

5 3 2 2

Page 34: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

219,015,0094.0

15,015.0031,0094.0031.0094,0

)(2

bbbbD

Для уровня значимости 05.0 исследовать существенность структурных параметров

при переменных 21 хих (4б)

Основные уравнения и расчетные формулы

1.

n

iix

nx

1

1 среднее значение независимой переменной x ;

2.

n

iiy

ny

1

1 среднее значение зависимой переменной y ;

3.

n

iix

nx

1

22 1 - среднее квадрата значений независимой переменной;

4.

i

n

ii yx

nxy

1

1 средняя арифметическая произведения двух величин;

5.

yxxyyyxxn

yxCovn

iii

1

1),( ковариация признаков x и y ;

6.

222

1

1)( xxxxn

xVarn

ii вариация (выборочная дисперсия) x ;

7.

)var()var( yx

yxxyrxy выборочный коэффициент корреляции;

8. Коэффициент корреляции принимает значение от -1 до +1 т.е.

11 xyr

9. Уравнение парной линейной регрессии

uxy 10

где 10 , параметры; u случайная величина;

10. xbby 10ˆ оценка уравнения парной линейной регрессии;

11. Формулы для определения значения параметров

xbybxx

yxxyxVar

yxCovb 10221 ;)()(

),(

Page 35: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

12. Остатки рассчитываются по формуле

iiiii xbbyyye 10ˆ

13. 011

n

iie

ne

14. yy ˆ

15. 0,ˆ eyCov

16. 21ie

neVar

17. Коэффициент детерминации 2R определяется по следующим альтернативным

формулам

2 1ˆ

yyryVareVar

yVaryVarR

18. Условия Гаусса-Маркова:

1) 0iuM для всех наблюдет

2) Дисперсии случайной величины постоянны т.е. constiu 22

3) Остатки некоррелированы между собой: 0, ji uuM для ji

4) Случайный член распределен независимо от переменных, ix т.е.

0, ii xuCov

19. Дисперсия остатков рассчитывается по формуле

2

)(2

1

2

2

n

eeVar

nnS

n

ii

e

20. Для парной регрессии xbby 10 стандартные ошибки коэффициентов

рассчитывают по формулам.

)(

).(.;)(

1).(.2

1

22

0 xnVarSbOC

xVarx

nSbOC ee

21. t статистики для коэффициентов регрессии uxy 10 рассчитываются по

формулам

Page 36: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

).(. 0

000

bocb

t

и ).(. 1

011

bocbt

где 00 и 0

1 некоторые предположительные значения 0 и 1 .

22. крt определяется из таблицы t распределения по уровням значимости и числу

степеней свободы.

23. Доверительные интервалы для параметров регрессии uxy 10 находят по

формулам

kpkp

kpkp

tbocbtbocbtbocbtbocb

).(.).(.

).(.).(.

11111

00000

24. F статистика для проверки общего качества регрессии имеет вид

)1()2(

2

2

RnRF

25. Для проверки статистической значимости коэффициента jb регрессии xbby 10ˆ

используем t статистику

1,0,).(.

jboc

bt

j

jb j

Которые затем сравнивают с табличным значением при определенном уровне

значимости и степеней свободы 2n .

26. Проверка гипотезы о значимости коэффициентов регрессии 0 и 1 с помощью

гипотез

0:;0:)1

01

00

HH

и 0:

;0:)2

11

10

HH

Page 37: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

Если kpb ttj то гипотезы 0H отвергаются, принимаются гипотезы 1H . Это означает

что свободный член уравнения регрессии 0b и коэффициент 1b существенны.

27. Проверка значимости уравнения регрессии в целом осуществляется с помощью

F статистики.

Если критрасч FF то уравнения регрессии признается значимым.

Если критрасч FF то построенное уравнение регрессии признается незначимым.

28.

№ Нелинейные регрессии

Линеаризация

1 u

xy 1

0

uzyx

z 10;1

2 uxy 10

zYuxzyY

uxy

10

00

10

ln;ln;ln;lnlnlnlnln

3 uy x10

xYuyY

uxy

10

1100

10

ln;ln;ln;lnlnlnlnln

29. Уравнение линейной множественной регрессии

uxxy kk 110

где k ,,, 10 параметры модели (коэффициенты регрессии).

u случайная величина.

30. Проводя n наблюдений над переменными kxxxy ,,,; 21 получим систему

niuxxxy iikkiii ,...,2,1,22110 .

Page 38: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

Вводя матрицы

nknk

k

k

nnnu

uu

u

x

xx

x

xx

x

xx

X

y

yy

Y

2

1

1

0

2

1

2

22

12

1

21

11

2

1

,,

1

11

;

предыдущую систему приводим к матричной форме

uXY

31. Оценкой линейного уравнения множественной регрессии по выборке является

kk xbxbxbby 22110ˆ

где вектор Tkbbbb ,,, 10 определяется по формуле

YXXXb TT 1

32. Вектор

ne

ee

e2

1

остатков модели, определяется по формуле

XbYe

33. Дисперсия случайных отклонений

11

1

2

2

kn

e

kneeS

n

iiT

e

где n число наблюдений, k число независимых переменных.

34. Матрица дисперсии и ковариации оценок структурных параметров оценивается по

формуле

122 )( XXSbD T

e

Page 39: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

35. Элементы главной диагонали матрицы )(2 bD , представляют собой дисперсии

kibVar i ,,1,0),( . оценок структурных параметров.

36. Стандартные ошибки параметров kibi ,,1,0, вычисляются по формулам

kibVarboc ii ,,1,0)().(. .

37. Для проверки значимости модели регрессии используется F критерий

kR

knRF)1(

)1(2

2

где n число наблюдений, k число независимых переменных.

38. Коэффициент автокорреляции

n

tt

n

tt

n

ttt

yyyy

yyyy

221

21

2211

)()(

)()(

где 1

,1

21

22

1

n

yy

n

yy

n

tt

n

tt

39. Линейный тренд

btayt

где ba, параметры тренда.

a и b определяются по формулам:

tbya

ttytytb t

tt

,

22

Page 40: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

где

n

t

n

t

n

ttt

nntn

tntn

tyn

y1

22

11 6)12()1(1,

211;1

40. Точечный прогноз. Строится на основе уравнения линейного тренда. Для этого в

построенную модель вместо переменной времени t подставляется номер интервала

прогнозирования Т. Точечный прогноз в этом случае равен:

bTaYT *

41. Средняя погрешность прогноза рассчитывается по формуле:

11

)(

)(

1

2

22

ntt

tTSS n

t

eT

где 2eS дисперсия остатков.

42. Интервал прогнозирования для заданной достоверности прогноза имеет вид

** , TT gydy

где TTT Suydy ** нижняя граница интервала прогнозирования;

TTT Suygy ** верхняя граница интервала прогнозирования.

a величина u выбирается из таблицы функции нормального распределения по заданной

достоверности .

Page 41: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

Лекции Глава I. Понятие эконометрики и эконометрического моделирование

1.1. Определение эконометрики. Предмет, цель и задачи эконометрики

Термин «Эконометрика» впервые был использован П. Сиомпой в 1910г.

Эконометрика буквально означает: наука об экономических измерениях. Существуют

различные определения эконометрики. Приведем некоторые высказывания известных

ученых об эконометрике.

Эконометрика - это раздел экономики, занимающейся разработкой и применением

статистических методов для измерений взаимосвязей между экономическими

переменными(С. Фишер и др.)

-Эконометрика- это ни в коем случае не то же самое, что экономическая статистика. Она

отнюдь не идентична тому, что мы называем общей экономической теорией, хотя

значительная доля этой теории носит определенно количественный характер. Также

эконометрика недолжна, восприниматься как синоним применения математики в

экономике. Опыт показывает, что и статистика, и экономическая теория, и математика,

взятые по отдельности, являются необходимыми, но не достаточными для

действительного понимания количественных отношений в современной экономической

жизни. Именно объединение всех трех частей дает мощный эффект. И именно это

объединение и составляет эконометрику (Р.Фриш).

-Эконометрика объединяет совокупность методов и моделей, позволяющих на базе

экономической теории, экономической статистики и математико-статистического

инструментария придавать количественные выражения качественным зависимостям

(С.А.Айвазян).

С современных позиций эконометрику можно определить как науку о моделировании

экономических явлений, позволяющем объяснить и прогнозировать их развитие, выявлять

и измерять определяющие факторы.

Таким образом, предметом эконометрики являются факторы, формирующие развитие

экономических явлений и процессов.

Эконометрика ставит своей целью количественно характеризовать те экономические

закономерности, которые экономическая теория выявляет и определяет лишь в общем. В

эконометрике оперируют конкретными экономическими данными и количественно

описывают конкретные взаимосвязи.

Задача эконометрики состоит в том, чтобы с помощью статистики найти выражения тех

закономерностей, которые экономическая теория и математическая экономика

определяют в общем.

Page 42: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

Основная задача эконометрики - наполнить эмпирическим содержанием априорные

экономические рассуждения (Л.Клейн).

Инструментарий эконометрики составляют методы математической и прикладной

статистики. Более шире основные задачи эконометрики можно описать следующим

образом:

-построение эконометрических моделей–представление экономический процесс в

математической форме, удобной для проведения эмпирического анализа;

-оценка параметров построенной модели, позволяющую характеризовать адекватность

модели реальными данными;

-проверка качества полученных параметров модели в целом;

-использование построенных моделей для объяснения поведения исследуемых

экономических показателей, прогнозирования, осмысления экономических решений.

1.2. Экономические системы и их моделирование

Экономическая система-это взаимодействие общественного производства и потребление

материальных благ. Понятие системы в общем виде формулируется следующим образом.

Под системой понимается комплекс взаимосвязанных и взаимообусловленных элементов.

Множество элементов образуют систему если имеют место следующие четыре признака:

-целостность системы, т.е. принципиальная несводимость свойств системы к сумме

свойств составляющих ее элементов;

-наличие цели и критерия исследования данного множество элементов;

-наличие среды существование данной системы;

-возможность существования в данной системе автономной подсистемы.

Простейшую экономическую систему можно получить если рассмотреть взаимодействие

основных фондов, рабочих и определенной технологии. Именно взаимодействие трех

составляющих приводит к выпуску продукций. Без взаимодействие капиталовложение,

рабочих и имеющихся технологий мы не имеем экономическую систему.

Экономическая система всегда переходит из одного состояния в другой, т.е. в этой

системе происходит экономический процесс. Для изучения экономического процесса

применяется метод эконометрического моделирования.

Под эконометрическим моделированием понимается исследование экономической

системы с помощью эмпирических (статистических) данных.

Экономическая модель системы–некоторый условный образ реальной системы. Под

эконометрической моделью понимается перевод реальной системы на математические

соотношение (уравнения, неравенств и т.п.). Следует отметить что любая модель не

может абсолютно точно отражать реальный экономический процесс. Так как модель

Page 43: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

отражает существенные свойства экономического процесса, то с её помощью можно

сделать содержательные выводы для практического применения. Степень соответствия

модели той реальной системе, для описания которой она построена, называется

адекватностью модели.

Различают два вида моделирование: материальное (предметное) и идеальное.

Материальным называется моделирование, в котором исследование ведется на основе

модели, воспроизводящей основные динамические и функциональные характеристики

изучаемого объекта. В экономических исследованиях применяется идеальное

моделирование основанное на мысленной аналогии реального объекта и его модели.

Идеальное моделирование можно разбить на два подкласса: знаковое (формализованное)

моделирование и интуитивное моделирование.

При знаковом моделировании моделями служат знаковые образования какого-либо вида:

схемы, графики, формулы, уравнения и т.п.

Эконометрическое моделирование относится к знаковому моделированию так как

моделирование осуществляется средствами языка математики.

В эконометрике используется модели реальных объектов в форме алгебраических,

дифференциальных и других уравнений решаемые с учетом дополнительных условий

отражающие состояние системы.

Интуитивные моделирование – это моделирование на словесном (описательном) уровне.

При интуитивном моделировании проводится мысленный анализ изучаемого объекта.

Процесс экономического моделирования состоит из трех структурных элементов: объект

исследования, субъект (исследователь), модель опосредующую отношения между

познающим субъектом и познаваемым объектом.

1.3. Основные этапы эконометрического моделирования

Качество эконометрического исследования зависит от качества построенной

эконометрической модели. Модели должны быть «на столько простыми, насколько

возможно, но не проще» сказал А.Энштейн. На основании модели делаются прогнозы

протекания социально–экономических процессов и разрабатываются необходимые

управленческие решения.

Процедура построение эконометрической модели состоит из нескольких взаимосвязанных

этапов:

1. Постановочный этап. Формулируется цель исследования, определяется набор

участвующих в модели экономических переменных, определяются основные

принимаемые предпосылки и допущения.

Page 44: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

Целью эконометрического моделирования является анализ изучаемого экономического

процесса, анализ возможного развития экономического явления и прогноз его

экономических показателей. Выбор переменных участвующих в модели должен быть

экономически обоснованными. Отбор переменных осуществляется с помощью

теоретической процедуры с помощью корреляционного анализа.

2. Априорный этап. Проводится анализ сущности изучаемого объекта, формирование и

формализация априорной (известной заранее, до начала моделирование) информации в

виде гипотез и исходных допущений.

3. Информационный этап. Осуществляется сбор необходимой статистической

информации т.е. регистрация значений показателей, участвующих в описание модели.

4. Спецификационный этап модели. В математической форме выражаются

обнаруженные связи и соотношения с учётом включенных в модель переменных,

формируются исходные предпосылки и ограничения модели. На данном этапе

определяется лишь структура модели, её аналитическая запись. Качество

эконометрического моделирования зависит от правильной спецификации.

5. Параметризационный этап. Оцениваются параметры (коэффициенты) выбранной

зависимости. Оценка осуществляется на основе имеющихся статистических данных.

6. Идентификационный этап. Осуществляется статистический анализ модели и оценка

её параметров.

7. Верификационный этап. Проводится проверка адекватности модели, выясняется,

насколько удачно решены проблемы спецификации, идентификации, какова точность

расчетов по данной модели, насколько соответствует построенная модель реальному

экономическому явлению.

Глава II. Элементы математической статистики

2.1. Данные. Типы переменных Данные это регистрация, каких то характеристик изучаемого объекта (фирмы, люди, домохозяйство, города, машины), например доход фирмы, возраст людей, потребление домохозяйств, численность население города, грузоподъемность машины и т.д. При моделировании экономических процессов мы используем два вида данных: пространственные данные и временные данные. Пространственные данные – это набор сведений (объем производства, количество работников, доход и др.) по разным фирмам в один и тот же момент времени, например, количество студентов вузов Республики на начало 2014 года. Временные данные это измерение одного показателя изучаемого объекта в последовательные моменты времени. Объемы ежедневных продаж супермаркета в течение месяца, цена на картошку за последние 20 лет с учетом инфляции предоставляют временные данные.

Page 45: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

Набор временных данных называется временным рядом. Данные количественно описывает определенный показатель изучаемого экономического объекта. Показатель экономической системы, численные значения которого изменяется, называется переменными. Переменные классифицирует по различным признакам. Экзогенными (независимыми, объясняющими, входными) называются переменные

nixi ,....,2,1. значения, которых задаются извне модели. Например, количество работников, объемы сырья и материалов и т.п. Эндогенные (зависимые, объясняемыми, выходными) переменные, значения которых формируются внутри модели. Например, объемы произведенных продукций. Лаговые (экзогенные или эндогенные) переменные – переменные, численные значения которых измерены в предшествующие моменты времени по отношению к текущим значениям зависимой переменной. Фиктивные переменные – которые количественным образом описывает качественный признак. Инструментальные переменные – переменные, которые может заменить в модели исходную переменную и обладает двумя свойствами: во-первых, она тесно связана с исходной переменной, во-вторых, она не связана с остатками модели. Производные переменные – это переменные, которые получаются вследствие определенных отношений зависимых переменных к независимым. Например, производительность труда, фондоотдача и т.д. В эконометрике будут рассматриваться переменные численные значения которых изменяются и по возможности не содержать ошибок измерений. 2.2. Операции над данными Пусть имеется набор данных nxxx ,....., 21 измеренное для каждого из рассматриваемых объектов. Например, объем ежедневных продаж (тыс.сом) в десяти супермаркетах составляет последовательности данных 25, 29, 20, 15, 24, 30, 18, 26, 32, 28. Данные в дальнейшем символически будем писать следующим образом nixi ....2,1, . Сумма чисел

nixi ....2,1, записывается в виде

n

n

ii xxxx

....211

Пусть переменная x задается последовательностью данных nixi ,....1, . Величина

n

iix

n 1

1

называется средним арифметическим переменной x обозначается:

n

iix

nx

1

1

Если другая переменная y задается последовательностью данных niyi ,....2,1, то можно образовать сумму.

n

ii

n

iinn

nni

n

ii

yxyyyxxx

yxyxyxyx

112121

22111

)....()...(

)...()()()(

Если axi константа, i=1,2….n то

naaaaaxxxxn

in

n

ii

121

1.......

Page 46: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

В дальнейшем вместо

n

i 1.)(.. будем использовать сокращенное обозначение .)(.. .

Правила суммирования ( ), константыba

1. xnxi

2. xanxaax ii

3. xbnnabxabxa ii )(

4. )()( yxnyxyx iiii Под произведением xy величин yиx понимается последовательности данных

nn yxyxyx ...;;; 22,11 или по короче .,...,2,1, niyx ii Тогда среднее xy величины xy вычисляется по формуле

i

n

ii

nn yxnn

yxyxyxxy

1

2211 1....

Точно таким же образом под ...,,,, 2322 yxxyx и тд. понимаются последовательности данных:

nn

n

n

n

yxyxyxyxxxxxyyyyxxxx

22

221

21

2

332

31

3

222

21

2

222

21

2

,...,,:

,...,,:,...,,:

,...,,:

Средние значения этих данных вычисляются по формулам

,11

22

n

iix

nx

n

iii

n

ii

n

ii yx

nyxx

nxy

ny

1

22

1

33

1

22 1,1,1

Исходя из правила суммирования легко доказать следующие равенства

.))((1;)()(1;0)(1

222

11yxxyyyxx

nxxxx

nxx i

n

ii

n

ii

n

ii

Пример 2.1. Пусть имеются данные

.9;8;3,5;4;1:.10;1,7;6;4,3;2:

i

i

yx

Найти .,,,, 22 xyyxyx Находим, средние значения x и y

46,55

3,275

983,541

7,55

5,285

101,764,32

y

x

Для нахождение xyиyx 22 , сначала образуем следующие данные:

.910;81,7;3,56;44,3;12:.9;8;3,5;4;1:

.10;1,7;6;4,3;2:222222

222222

xyyx

Теперь

Page 47: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

84,385

91081,73,5644,312

018,385

09,1905

83,541

:394,405

97,2015

101,764,32

222222

222222

xy

yy

x

2.3. Случайные величины и их числовые характеристики В эконометрических исследованиях как это следует из самого определения эконометрики, широко используются математическая статистика и математический инструментарий. Данные в эконометрике никогда не являются экспериментальными. Изменение одного параметра изучаемого объекта сразу вызывает изменение других её параметров. если мы изменим цену на муку, то сразу изменяются цены на хлеба – булочные изделия. В эконометрике мы оперируем реальными данными, а не выдуманными. Математическая статистика – раздел математики, изучающий методы сбора, систематизации и обработки результатов наблюдений с целью выявления статистических закономерностей. Во многих своих разделах математическая статистика опирается на теории вероятностей, позволяющую оценить надежность и точность выводов, делаемых на основании ограниченного статистического материала. Величины, рассматриваемые в эконометрических исследованиях, в основном носят случайный характер. Например, объем продаж в следующем квартале характеризуется некоторым числом, значение которого точно неизвестно, но находится среди некоторого набора значений, количество отличников группы студентов в следующем семестре, если в группе 25 студентов, то количество отличников характеризуются числами 0,1,2,…..25. Каждая из этих чисел, является случайной. Под случайной величиной понимается переменная, которая в результате испытания может принять то или иное значение, неизвестно заранее – какое именно. Мы будем рассматривать случайные величины (случайные переменные) двух типов: дискретные и непрерывные. Случайная величина называется дискретной, если можно перечислить все возможные значения, которые она может принимать в результате наблюдений. Случайная величина называется непрерывной, если она может принимать любое значение из некоторого интервала. Приведем примеры дискретных случайных величин. 1. Количество посетителей супермаркета на следующей неделе: список возможных значений имеет вид 0,1,2,... . 2. Размер бюджета проекта, когда выбор производиться из четырех вариантов, предусматривающих финансирование в объеме 35000ден.ед, 47000ден.ед, 54000ден.ед. и 73000ден.ед. Перечень возможных значений (в тысячах ден.ед.) состоит из чисел 35, 47, 54, 73. Случайные величины в эконометрике рассматривается в качестве источников данных. Каждая случайная величина появляется с определенной вероятностью. Список возможных значений, дискретной случайной величины с соответствующими вероятностями появления этих значений, представляет собой распределение вероятностей для дискретной случайной величины. Пусть Х -дискретная случайная величина, а nxxx ,....., 21 возможные её значения. Пусть каждое значения ix - появляется вероятностью iP . Тогда для дискретной случайной величины закон распределения может быть задан в виде таблицы. Х: Табл.2.1.

1x 2x 3x … ix … nx

Page 48: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

1p 2p 3p … np … np

Здесь 1...1

21

n

iin pppp

Случайные величины характеризуются с помощью среднего значения и стандартного отклонения. Среднее, или ожидаемое значение, дискретной случайной величины это число определяемое по формуле

n

iii pxXM

1)(

Вместо термина ожидаемое значение применяют термин математическое ожидание. Математическое ожидание обладает следующими очевидными свойствами. Свойства математического ожидания

1. Математическое ожидание суммы нескольких переменных равно сумме их математических ожиданий. Например, если nXXX ,...,, 21 - случайные переменные, то

)(....)()()....( 2121 nn XMXMXMXXXM 2. Если X - случайная переменная и a - константа, то

)()( XaMaXM 3. Математическое ожидание константы есть она сама. Например, если a -константа,

то aaM )(

Исходя из приведенных свойств, можно рассчитать математическое ожидание более сложных выражений. Например, найти математическое ожидание величины

babXaY ,, - константы. Имеем,

)()()()()( XbMabXMaMbXaMYM 4. Если случайные переменные X и Y независимы, то имеет место свойство

)()()( YMXMXYM Важное значение, имеет так называемая дисперсия случайной переменной X , показывающая меру разброса возможных значений X вокруг математического ожидания. Дисперсия ,X это математическое ожидание величины 22 )())(( XXMX и обозначается через )(XD . Итак по определению

i

n

inn PxPxPxXMXD 2

11

21

21

2 )()(....)()()(

Часто дисперсию рассчитывает по следующей формуле 22 )()( XMXD

Свойства дисперсии X -случайная величина, ba, - константы, то

)()()3)()()2

0)()1

2

2

XDbbXaDXDaaXD

aD

Page 49: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

Величина

n

iii PxXD

1

2)()( называется средним квадратичным отклонением

случайной переменной .X Для непрерывной случайной величины невозможно перечислить все её значений, а вероятности каждого отдельно взятого значения непрерывной случайной величины равны нулю. Закон распределения непрерывной случайной величины X описывается так называемым функцией распределения. Определение. Функцией распределения случайной величины X называется функция

),(xF выражающая для каждого x вероятность того, что случайная величина X примет значение, меньшее :x

).()( xXPxF Функция распределения обладает следующими свойствами:

1. Функция распределения случайной величины есть неотрицательная функция, заключенная между нулем и единицей.

.1)(0 xF 2. Функция распределения случайной величины есть неубывающая функция на всей

числовой оси, т.е. для любых двух точек 1x и 2x числовой оси, таких что ,21 xx имеет место неравенство

).()( 21 xFxF 3. На минус бесконечности функция распределения равна нулю, на плюс

бесконечности равна единице, т.е. ,0)(lim)(

xFF

x1)(lim)(

xFF

x Функция распределения непрерывной случайной величины является непрерывно дифференцируемой функцией. Определение. Плотностью вероятности (плотностью распределения) непрерывной случайной величины X называется производная ее функции распределения

)()( xFxf Плотности вероятности непрерывной случайной величины обладает следующими свойствами:

1. Плотность вероятности – неотрицательная функция т. 0)( xf

2.

1)( dxxf

3. Функция распределения непрерывной случайной величины может быть выражена через плотность вероятности по формуле:

x

dxxfxF )()(

4. Вероятность попадания непрерывной случайной величины X в интервал ba, вычисляется по формуле

b

a

dxxfbXaP )(

Математическое ожидание и дисперсия непрерывной случайной величины X вычисляются по формулам:

dxxxfXM )()( и 222 )()()()(

dxxfxdxxfxXD

В эконометрических исследованиях имеет особо важное значение, так называемое нормальное (гауссовское) распределение.

Page 50: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

Определение. Непрерывная случайная величина X имеет нормальный закон распределения (закон Гаусса) с параметрами и ,2 если ее плотность вероятности имеет вид:

2

2

2)(

21)(

x

exf

График кривой нормального распределения представляет колокола образную кривую, представленную на следующем рисунке (Рис.2.1)

Рис. 2.1 Рис. 2.2 При 0 и ,1 получим так называемое стандартное (нормированное)нормальное распределения (Рис.2.2)

2

2

21)(

x

ex

Стандартное нормальное распределение табулировано. Пример 2.2. Рассмотрим четыре сценария получения дохода некоторой фирмы. Доход фирмы является случайной величиной. Предположим что при прекрасном развитии экономики фирма получит доход 10 млн.сом с вероятностью 0,20; при хорошем 7 млн.сом с вероятностью 0,40; при нормальном 4 млн.сом с вероятностью 0,30; и при плохом 1 млн.сом с вероятностью 0,10. Таблица распределение дохода имеет вид Табл.2.2

Доход соммлнxi .

10 7 4 1

Вероятность

iP 0,20 0,40 0,30 0,10

Средний или ожидаемый доход фирмы вычисляется следующим образом:

1,610,0130,0440,0720,010)(4

1

i

ii pxXM

Таким образом, ожидаемый доход составляет 6,1 млн.сом. Вычислим дисперсию по формуле

44,46)1,61()1,64()1,67()1,610(

))(())(())(())(()(2222

24

23

22

21

xMxxMxXMxxMxXD

Вычислим среднее квадратичное отклонение дохода, которое приблизительно указывает, насколько реальные значения дохода отличается от среднего дохода

.8,644,46)( XDG 2.4. Выборочная вариация и правила её расчета

Page 51: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

Вся исследуемая совокупность называется генеральной совокупностью. Из-за недоступности исследования всех элементов генеральной совокупности из неё отбирают случайным образом некоторое ограниченное число объектов. Совокупность случайно отобранных объектов называется выборочной совокупностью или просто выборкой. Например, мы хотим изучить объем месячных продаж всех торговых точек нашей республики. Сплошное исследование практически невозможно или сопровождается большими затратами. Поэтому для изучения объемы продаж, из каждой области случайным образом отбирают скажем по 50 торговых точек. Отобранные по всей республике 350 торговых точек и является выборочной совокупностью. Генеральная совокупность по существу это мыслимая совокупность. Например, это количество торговых точек по всей Республике. Но, ни кто не знает, сколько торговых точек имеется в нашей Республике. Числовые характеристики генеральной совокупности (математические ожидание, дисперсия т.д.) являются по существу теоретическими величинами. Их оценивают с помощью выборочных характеристик. Пусть из генеральной совокупности извлечена выбора объема nxxxn ,...,: 21 Выборочной средней называется средние арифметическое наблюдаемых значений случайной величины в выборе т.е.

n

iix

nx

1

1

Выборочной дисперсией (вариацией) называется среднее арифметическое квадратов отклонения наблюдаемых значений случайной величины от среднего значения, т.е.

2

1)(1)( xx

nxVar

n

ii

Если возвести в квадрат разности стоящее под суммы и воспользоваться средними величинами, то получим альтернативную формулу расчета вариации

.)(1)( 2222

1xxxx

nxVar

i

n

i

Выборочная дисперсия обладает следующими свойствами:

1. Если a - константа, то ;0)( aVar Это следует из первой расчетной формулы вариации.

2. ),()( 2 xVarbbxVar если b -константа; 3. ),()( 2 xVarbbxaVar если ba, -константы.

Выборочные средние и выборочные вариации являются случайными величинами т.к. эти величины рассчитаны на основании случайных выборах. Пример 2.3. По выборочным данным 15,11,7,5,2:ix вычислить x и ).(xVar Для вычисления выборочных характеристик составляем расчетную таблицу. Табл.2.3.

Номер наблюдений x 2x 1 2 4 2 5 25 3 7 49 4 11 121 5 15 225 40 424 среднее 8 84,8

Page 52: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

Теперь 8,20648,84)()(,8 22 xxxVarx . 2.5. Точечные и интервальные оценки Параметры генеральной совокупности, например математическое ожидание, дисперсия большей частью неизвестны. Требуется найти их статистические оценки, т.е. найти приближенные значения этих параметров. Обозначим через оценку некоторого параметра генеральной совокупности. Для оценки параметра берется выборка

nxxx ,...,, 21 объема ,n и с помощью подходящей формулы рассчитывается оценка нужной характеристики. Способ оценивания это формула, а значения оценки – это конкретное число рассчитанные по формуле. Различают точечные и интервальные оценки параметров генеральной совокупности. Точечной называют оценку, которая определяется одним числом. Оценка найденная по выборе, как правило, является случайной величиной. Для того чтобы выборочная оценка давала хорошее приближение оцениваемого параметра, она должна удовлетворять следующим требованиям.

1. Несмещенность оценок. Оценка называется несмещенной если её математическое ожидание равно оцениваемому параметру т.е. )(M . Если )(M то оценка называется смещенной. Выше мы определили две важнейшие характеристики генеральной совокупности: математическое ожидание )(xM и дисперсию ).(2 xD Выборочное среднее

является оценкой для математического ожидания а

n

ii xx

nS

1

2 2

)(1

1 служит оценкой

дисперсии генеральной совокупности. Эти оценки являются несмещенными оценками. Легко установить, что )(xM и .)( 22 SM В самом деле,

nnn

xMn

xn

MxMn

i

n

ii

n

ii

111

11)(11)(

Докажем второе равенство. Для этого квадрат разности под законом суммы запишем в виде

22 )()()( xxxx ii Следовательно

2

1

2

1

2

1)()()(2)()(

xnxxxxxn

ii

n

ii

n

ii

Учитывая что

)()(1 1

xnnxnnxxn

i

n

iii

Получим

2

1

22

1)()()(

xnxxxn

ii

n

ii

После этого формула для 2S примет вид

22

1

2 )(1

)(1

1

xn

nxn

Sn

ii

Находим, математическое ожидание от обеих частей последнего равенства

n

ii x

nnx

nMSM

1

222 )(1

)(1

1)(

Page 53: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

Используя свойства математического ожидания, и тот факт что n

xD x2

)(

имеем

2222

1

2

22

1

2

11

1111

)(1

)(1

1)(

xxxx

n

ix

n

ii

nnn

nnn

n

xMn

nxMn

SM

Таким образом, 2S является несмещенной оценкой .2x

Выборочная дисперсия )(xVar является смещенной оценкой генеральной дисперсии 2x

т.к.

21)( xnnxVarM

Легко видеть, что 2

1

2 )(1

1)(1

xxn

xVarn

nSn

ii

Поэтому, дисперсию 2S называют исправленной дисперсией. Стандартным отклонением S случайной величины в выборе называется корень квадратный из её исправленной дисперсии:

1

)(1

2

n

xxS

n

ii

2. Эффективность оценок. Несмещенная оценка называется эффективной, если

она имеет минимальную дисперсию по сравнению с другими выборочными оценками. Предложим, что мы имеем две оценки теоретического среднего, рассчитанных на основе одной и той же информации, что обе они являются несмещенными и что функции плотности вероятности имеют вид.

Рис.2.3

Оценка В дает более точное значение, чем для оценки А так как разброс значений для оценки В меньше, чем для оценки .A

3. Состоятельность оценок. Оценка называется состоятельной, если при n она стремится по вероятности к оцениваемому параметру т.е.

1)(

PLim

n Другими словами, состоятельной называется такая оценка, которая дает точное значение для большой выборки независимо от входящих в нее конкретных наблюдений. Выборочная средняя x является состоятельной оценкой т.е.

Page 54: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

1)(

xPLimn

Интервальной называют оценку, которая определяется двумя числами – концами интервала. При небольшом объеме выборки следует пользоваться интервальными оценками. Интервальные оценки позволяют установить точность и надежность оценок. Пусть найденная по данным выборки характеристика служит оценкой неизвестного параметра . тем точнее определяет параметр , чем меньше абсолютная величина разности . Если и чем меньше , тем точнее оценка. Однако

неравенство выполняется с некоторой вероятностью .

Доверительным интервалом называется интервал , в котором с заданной вероятностью заключен неизвестный параметр , т.е.

.)( P

Вероятность называют доверительной вероятностью и часто берут равными 0,90; 0,95; 0,99. Заменим неравенство равносильным ему двойным неравенством

. Отсюда . Это неравенство следует понимать так: интервал ),( заключает в себе неизвестный параметр . Уровнем значимости называется вероятность )(P причем .1 2.6. Проверка статистических гипотез Статистической гипотезой Н называют гипотезу о виде неизвестного распределения или о параметрах известных распределений. Например, случайная величина X распределена по нормальному закону или математическое ожидание нормально распределенной величины равно 5. Нулевой (основной )называют выдвинутую гипотезу .0Н Конкурирующей (альтернативной) называют гипотезу ,1Н которая противоречит основной. Например, если нулевая гипотеза утверждает, что математическое ожидание нормального распределения равно 5, то альтернативная гипотеза отрицает это утверждение. Эти утверждения записываем в виде 5:;5: 10 НН Правильности или неправильности выдвинутых гипотез проверяют статистическими методами. Статистическим критерием называется случайная величина, которая служит для проверки нулевой гипотезы. В качестве статистического критерия выбирают случайную величину, распределение которой подчиняются либо нормальному закону, либо распределению Стьюдента (t-критерий), либо F-распределению, либо 2 -распределению и т.д. Наблюдаемым значением критерия k называется значение критерия, вычисленное по данным выборки и обозначается .наблk Критической областью называют совокупность значений критерия, при которых нулевую гипотезу отвергают. Областью принятия гипотезы называют совокупность значений критерия, при которых гипотезу принимают. Критическими точками крk называют точки, отделяющие критическую область от области принятия гипотезы.

Page 55: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

Различают одностороннюю (правостороннюю или левостороннюю) и двустороннюю критические области. Расположение критических областей и области принятия гипотезы в случаях односторонних и двусторонних изображены на следующих рисунках.

Рис. 2.4. а) 0, кркр КKК левосторонняя критическая область

Рис. 2.4. б) 0, кркр КKК правосторонняя критическая область

Рис. 2.4 в) двусторонняя критическая область. Для проверки гипотез задается уровень значимости . В экономических исследованиях проверку гипотез осуществляют при 5% и 1%-ном уровнях значимости, которые называются стандартными уровнями. Одно и двусторонние тесты связаны формулировкой альтернативной гипотезы. Пусть a точное значение параметра генеральной совокупности, 0a её гипотетическое значение.

1. Если альтернативная гипотеза имеет вид, ,: 01 aaН то выбирают правостороннюю критическую область. Если решение должно быть принято с 5%-ным уровнем значимости, то выбирается единственная граница решения, как показана на следующем рисунке

Рис.2.5

2. Если альтернативная гипотеза имеет вид ,: 01 aaН то выбирают левостороннюю критическую область. В этом случае на 5%-ном уровне значимости области принятия и отклонение гипотезы имеет вид

Page 56: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

Рис.2.6

3. Если альтернативная гипотеза имеет вид, ,: 01 aaН то выбирают двухстороннюю критическую область. Если проверка осуществляется с 5%-ом уровнем значимости, то границы расположены симметрично относительно средней и область принятие гипотезы

0Н имеет вид

Рис.2.7.

В эконометрике в качестве критерия проверки нулевой гипотезы используется случайная величина, подчиненная распределению Стьюдента которая обозначается через t (t-статистика), а если используется случайная величина, подчиненная распределению Фишера – через F (F-статистика)

Глава III. Типы зависимостей. Ковариация и корреляция

3.1. Типы зависимостей

В экономических исследованиях нам приходится устанавливать формы зависимости

между зависимыми и независимыми переменными. В одних случаях зависимость между переменными характеризующие экономические показатели очень тесная (например, часовая выработка и заработная плата), а в других случаях связь между переменными выражается очень слаба. В экономике, какие то факторы (независимые, объясняющие переменные) воздействует на другие (зависимые, объясняемые) обусловливая их изменение. В экономических явлениях причинно-следственная связь проявляются по разному. Различают два типа зависимости в экономике: функциональную, или жесткую и статистическую или стохастическую (вероятностную). Функциональная зависимость (связь) когда каждому значению одной переменной соответствует вполне определенное значение другой. Например, площадь круга зависит от длины радиуса круга. Функциональная зависимость чаще всего встречается в естественных науках. В экономических явлениях реже наблюдаются функциональные связи. В экономике в большинстве случаев каждому значению одной переменной соответствует множество значений другой переменной. Такая зависимость называется статистической. Примером

Page 57: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

статистической связи является зависимость урожайности от количество внесенных удобрений. Внеся одно и то же количество удобрений на 1га, мы получим разные урожайности. Расходы на питание имеет статистическую зависимость от дохода семьи. Таким образом в статистической зависимости каждому конкретному значению скажем, 1x соответствует множество возможных значений kyyy ,....,, 21 другой переменной .y Это соответствие символически записываем следующим образом

kyyyx ,....,, 211 Другому myyyx ,...,, 212 и т.д. Чтобы убрать такую неоднозначную зависимость усредняем по каждому заданному x значение .y Усреднение предыдущих рассмотренных схем выглядит следующим образом

myyy

y

kyyy

y

mx

kx

...

...

21

21

2

1

и т.д. Так как распределение значений y по заданному x вообще говоря, носить вероятностный характер вместо средних рассматривается условное математическое ожидание переменной y по переменной x которое обозначается )(yM x . Если каждому значению одной переменной соответствует определенное условное математическое ожидание (среднее значение) другой, то такая статистическая зависимость называется корреляционной. Корреляционная связь проявляется не в каждом отдельном случае, а только в средних величинах при достаточно большом числе случаев. С помощью корреляционной зависимости мы сводим статистическую связь к функциональной зависимости. Корреляционные связи делят на однофакторные и многофакторные, в зависимости от количества признаков, включенных в модель. Однофакторные (парные) корреляционные связи – это связь между одним признаком-фактором и результативным признаком. Многофакторные (множественные) корреляционные связи – это связь между несколькими факторными признаками и результативным признаком. Если мы изучаем связь между потреблением и доходом, то здесь имеет место парные корреляционные связи. Здесь единственный фактор – доход влияет на потребление. Если ввести в рассмотрение в качестве факторов, доход, состав семьи и инфляцию то мы получим многофакторную связь. Корреляция бывает следующих трех видов. 1. Парная корреляция – связь между двумя признаками результативным и факторным или двумя факторными. 2. Частная корреляция – зависимость между результативными и одним факторными признаками или двумя факторными признаками при фиксированном значении других факторных признаков. 3. Множественная корреляция – зависимость между результативным признаком и двумя и более факторными признаками. Теснота связи между признаками изучается коэффициентом корреляции, которое будет рассмотрен ниже.

3.2. Выборочная ковариация и правила её расчета Выборочная ковариация является мерой взаимосвязи между двумя переменными. Пусть имеется данные по n наблюдениям двух переменных x и .y

Page 58: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

Выборочной ковариацией двух переменных yx, называется средняя величина произведения отклонения этих переменных от своих средних, т.е.

))((1),(1

yyxxn

yxCov i

n

ii

(3.1)

Где yx, выборочные средние переменных ., yx

Если ,yx то ).()(1),( 2

1xVarxx

nxxCov

n

ii

Выборочная ковариация является величиной любого знака. Это зависит от знаков произведения ).)(( yyxx ii Наблюдения, в которых ,0))(( yyxx ii дают положительный вклад в ковариацию, а те наблюдения в которых 0))(( yyxx ii - отрицательный. Если положительные вклады преобладают над отрицательными, то ковариация будет положительной, в противном случае она будет отрицательной. Для расчета ковариации пользуются более простой альтернативной формулой

.1

1),(1

yxxyyxyxi

yxCov i

n

ii

(3.2) Которое получается раскрытием скобки под знаком суммы (3.1) и использованием что

ynyxnx ii , Непосредственно из определения ковариации вытекают несколько правил её расчета.

1. Если ,wvy то ).,(),(),( wxCovvxCovwvxCov 2. ,0),( axCov если a константа. 3. Если ,bzy где b -константа и z переменная, то ),cov(),( zxbbzxCov 4. ).,(),( xyCovyxCov

Доказательство правила 1. Из равенства wvy вытекает iii wvy и .wvy Следовательно,

),(),(

))((1))((1)()()(1

)()()(1))((1),(

111

11

wxCovvxCov

wwxxn

vvxxn

wwvvxxn

wvwvxxn

yyxxn

yxCov

n

iiii

n

ii

n

iiii

ii

n

iii

n

ii

Доказательство правила 2. Так как ,константаay то все ayиayi Поэтому 0 yyi для всех наблюдений. Следовательно,

00)(1))((1))((1),(1211

xxn

aaxxn

yyxxn

yxCovn

ii

n

ii

n

iii

Доказательство правила 3. Если ,bzy то ., zbybzy ii Следовательно,

),())(())((1))((1).(111

zxbCovzzxxnbzbbzxx

nyyxx

nyxCov i

n

iii

n

iii

n

ii

Эти правила позволяют упрощать вычисления более сложные выражения с ковариациями. Если kuuuy ....21 то

k

jik uxCovuuuxCovyxCov

121 ),()....,(),(

А так же, если ,21 zaay где 21,aa константа, za переменная, то

).,(),(),(),(),( 22121 zxCovazaxCovaxCovzaaxCovyxСov

Page 59: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

Рассмотрим вариацию от суммы .yx

2

1()(1)(

n

iii yxyx

nyxVar

Далее возведя в квадрат разности стоящее под знаком суммы и распространяя суммы на каждое слагаемое имеем:

).,(2)()(

1211

2121

1221

)(1)()(2)(1

)())((2)(1)(

1

2

1

22

1

2

2

1

2

11

2

2

1 11

22

1

2

1

2

1

1

22

yxCovyVarxVar

yxyxn

yyn

xxn

yxynxnyxn

yn

yxn

xn

yxnn

yxyxn

yyxxn

yxn

yxyxn

yxn

yxyxyxyxn

yxVar

n

iii

n

ii

n

ii

n

ii

n

iii

n

ii

n

i

n

iii

n

iiiii

n

ii

n

iii

n

ii

n

iiiii

Из этой формулы вытекает, что если ay – константа, то )()( xVaraxVar т.к. ранее доказали, что .0),(,0)( axCovaVar Наряду с выборочной ковариацией рассматривается теоретическая ковариация. Если x и y – случайные величины, то теоретическая ковариация xy определяется как математическое ожидание произведение отклонений этих величин от их средних значений.

.))(( yxxy yxM где x и y - теоретические средние значения x и y соответственно. Часто

теоретическая ковариация неизвестна, то для её оценки может быть использована выборочная ковариация.

3.3. Коэффициент корреляции

Ковариация в определенной мере измеряет взаимосвязи между переменными, но не является особенно хорошим измерителем. Более точным измерителем взаимосвязи является коэффициент корреляции. Будем рассматривать две формы коэффициента корреляции: теоретической и выборочной. Определение теоретического коэффициента корреляции основан на рассмотрении теоретической ковариации и дисперсии переменных x и .y Теоретическим коэффициентом корреляции, которое обозначается буквой , которая произносится как «po» называется величина

22yx

xyxy

(3.3) Где xy - теоретическая ковариация, 22 , yx - теоретические дисперсии. Если x и y независимы, то ,0xy так как .0xy Выборочным коэффициентом корреляции xyr называется величина, определенная по формуле.

Page 60: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

)()(),(

yVarxVaryxCovrxy (3.4)

xyr удовлетворяет неравенству .11 xyr Если 1xyr то связь между переменными x и y строго линейный положительный, если 1xyr связь линейный отрицательный. Величина 0xyr показывает, что зависимость между наблюдениями x и y в выборке

отсутствует. Если 7,0xyr то связь между переменными считаются сильными. Проверка гипотезы о корреляции случайных величин. Пусть по данным выборки объемы n получен выборочный коэффициент корреляции .0r Требуется проверить гипотезу о равенстве нулю теоретического коэффициента корреляции, т.е.

0:0:

1

0

НН

В качестве критерия проверки гипотезы 0Н принимается случайная величина

21

2

rnrt

Величина t подчинятся закону распределение Стьюдента. Находят критическое значение

крt при уровне значимости и 2 n степеней свободы по таблице t распределения Стьюдента. Из сравнения наблюдаемого значения t с критическим получаем:

Если ,крtt то 0Н принимается, т.е r незначим

Если ,крtt то 0Н отвергается, т.е. r значим.

Пример 3.1. По приведенным ниже исходным данным вычислить ковариацию и выборочный коэффициент корреляции между переменными yx, и установить его значимость: Составляем следующую расчетную таблицу Таб. 3.1

№ п\п x y x2 xy y2

1 2 1 4 2 1 2 5 3 25 15 9 3 9 6 81 54 36 4 12 8 144 96 64 5 16 11 256 176 121 итого 44 29 510 343 231 среднее

8,8 5,8 102 68,6 46,2 x y

2x xy 2y

На основании расчетных формул, имеем:

x 2 5 9 12 16 y 1 3 6 8 11

Page 61: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

99,056,1256,24

56,17)()(

),(56,178,58,86,68),(

56,128,52,46)()(

56,248,8102)()(222

222

yVarxVaryxCovr

yxxyyxCov

yyyVar

xxxVar

xy

Проверим значимость выборочного коэффициента корреляции. Находим наблюдаемое значение критерия.

25,120199,0

399,0

1

22

rnrt

Проверим значимости на уровне .05,0 Находим по таблице t распределение

.182,3)3;05,0( ttкр Поскольку 182,325,12 крtt то 99,0r значим при 5%-ном уровне. 3.4. Вектор и матрица коэффициентов корреляции Экономические явления, как правило, определяются большим числом одновременно и совокупно действующих факторов. В связи с этим возникает необходимость исследования зависимости переменной y от нескольких объясняющих переменных ,,...,, 21 nxxx а также взаимосвязи между переменными ix и .jx Задачи множественного корреляционного анализа, состоит в следующем:

Измерение тесноты связи между переменными. Отбор наиболее информативных факторов для построения модели. Спецификация модели. Проверка значимости параметров связи. Установление неизвестных причин связей.

Для оценивания силы линейной зависимости объясняемой (зависимой) переменной y от объясняющих (независимых) переменных nxxx ,....,, 21 рассчитываются коэффициенты корреляции:

niyVarxVar

yxCovr

i

ii ,...,2,1,

)()(),(

(3.5)

Эти коэффициенты представим в виде вектора корреляции

nr

rr

R

.

.

.2

1

0 (3.6)

Коэффициенты корреляции между объясняющими переменными nxxx ,...,, 21 рассчитываются по формуле.

njixVarxVar

xxCovrr

ji

jixxij

ji,....,2,1,

)()(

),( (3.7)

И эти значения запишем в виде матрицы корреляции

Page 62: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

1...........

....1....1

21

221

112

nn

n

n

rr

rrrr

R (3.8)

Матрица R симметрична, т.к. jiij rr и все диагональные элементы 1iir в силу того что

при ,ji ).(),( iii xVarxxCov Для составление корреляционной матрицы между независимыми переменными достаточно рассчитать элементы лежащие выше главной диагонали. Пример 3.2. Для описания формирования объёма продаж услуг )..( едмлнy некоторого сервисного предприятия предлагаются три потенциальные объясняющие переменные:

1x количество работающих (тыс.чел.); 2x объем основных производственных средств (млн.д.е.); 3x средняя длительность простоя машин из-за аварий (дней). Поквартальные данные за 12 лет представлены в следующей таблице.

Составим расчетную таблицу Таб. 3.2. Находим коэффициенты корреляции между переменной y и переменными 321, xиxx

Год,t y x1 x2 x3

1 11 2,1 11 30 2 13 2,2 11 30 3 16 2,3 12 31 4 24 2,4 13 28 5 24 2,5 15 26 6 26 2,5 17 24 7 27 2,6 17 22 8 28 2,7 18 23 9 29 2,6 18 20

10 33 2,7 19 16 11 33 2,7 19 14 12 36 2,7 22 12

№ п/п y 1x 2x 3x

2y

21x

22x

23x

1yx 2yx 3yx 21 xx 31xx

32 хх

1 11 2,1 11 30 121 4,41 121 900 23,1 121 330 23,1 63 330 2 13 2,2 11 30 169 4,84 121 900 28,6 143 390 24,2 66 330 3 16 2,3 12 31 256 5,29 144 961 36,8 192 496 27,6 71,3 372 4 24 2,4 13 28 576 5,76 169 784 57,6 312 672 31,2 67,2 364 5 24 2,5 15 26 576 6,25 225 676 60,0 360 624 37,5 65 390 6 26 2,5 17 24 676 6,25 289 576 65,0 442 624 42,5 60 408 7 27 2,6 17 22 729 6,76 289 484 70,2 459 594 44,2 57,2 374 8 28 2,7 18 23 784 7,29 324 529 75,6 504 644 48,6 62,1 414 9 29 2,6 18 20 841 6,76 324 400 75,4 522 580 46,8 52 360 10 33 2,7 19 16 1089 7,29 361 256 89,1 627 528 51,3 43,2 304 11 33 2,7 19 14 1089 7,29 361 196 89,1 627 462 51,3 37,8 266 12 36 2,7 22 12 1296 7,29 484 144 97,2 792 432 59,4 32,4 264

итого 300 30 192 276 8202 75,48 3212 6806 767,7 5101 6376 487,7 677,2 4176

среднее

25 2,5 16 23 683,5 6,29 267,66

7 567,16

7 63,975 425,08 531,33 40,642 56,433 348

y 1x 2x 3x

2y 21x

22x

23x

1yx 2yx 3yx 21xx 31xx

32 хх

Page 63: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

924,0167,385,58

67,43)()(

),(

960,0667,115,58

08,25)()(

),(

964,004,05,58

475,1)()(

),(

3

33

2

22

1

11

xVaryVarxyCov

r

xVaryVarxyCovr

xVaryVarxyCovr

Таким образом, вектор корреляции имеет вид

924,0960,0964,0

3

2

1

0

rrr

R

Находим коэффициенты корреляции пар переменных 321 ,, xxx

940,0667,1104,0

642,0)()(

),(

21

2112

xVarxVarxxCovr

863,0167,3804,0

067,1)()(

),(

31

3113

xVarxVar

xxCovr

948,0167,38667,11

20)()(

),(

32

3223

xVarxVar

xxCovr

С учетом симметричности коэффициентов корреляции получаем: .948,0,863,0,940,0 323121 rrr

Матрица коэффициентов корреляции между объясняющими переменными имеет вид

1948,0863,0

948,01940,0863,0940,01

R

3.5. Анализ матрицы коэффициентов корреляции При построении эконометрической модели существенное значение имеет отбор наиболее информативных объясняющих переменных. Для этого проводиться анализ вектора и матрицы коэффициентов корреляции. Для заданного уровня значимости и для (n-2) степеней свободы рассчитывается так называемые критическое значения коэффициента корреляции:

21

2

2

2)()(

nttr (3.9)

где t значение t распределения Стьюдента для заданного и для )2( n степеней свободы. Процедура подбора объясняющих переменных состоит из следующих этапов:

Из множества потенциальных объясняющих переменных исключаются те, которые удовлетворяют неравенству

rri (3.10) поскольку они несущественно коррелируют с объясняемой переменной.

Из оставшихся переменных наиболее информативной считается такая переменная,,hx для которой

ih rr max (3.11)

Page 64: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

Из множества потенциальных объясняющих переменных исключаются все переменные, которые удовлетворяют неравенству

rrhi (3.12)

поскольку эти переменные слишком сильно коррелируют с объясняющей переменной .hx Повторяя этап 1 – 3 мы исчерпываем все потенциальные объясняющие переменные. Пример 3.3. На основе статистических данных по 25 предприятиям рассчитан вектор и матрица коэффициентов корреляции зависимой переменной y с независимыми переменными .,....,, 721 xxx

,

59,004,0

58,054,0

28,053,043,0

0

R

1003,055,043,041,062,008,003,0113,016,014,031,028,055,013,0169,064,084,049,0

43,016,069,0153,062,026,041,014,064,053,0174,025,062,031,084,062,074,0140,008,028,049,026,025,040,01

R

При уровне значимости 05,0 определить, какие из предварительно отобранных переменных должны играть роли объясняющих переменных в линейной модели переменной .y Решение. Определим критическое значение коэффициенты корреляции. По таблице tраспределения Стьюдента для заданного 05,0 и 25-2=23 степеней свободы находим

.069,2t Вычислим критическое значение коэффициента корреляции по формуле (3.9)

396,0225)069,2(

)069,2( 21

2

2

r

Теперь исключаем те переменные, которые коррелируют с зависимой переменной на уровне 0,396. Это переменные 3x и 6x для которых 28,03 r и .04,06 r Из оставшихся исходных переменных 75421 ,,,, xxxxx выбираем ту, которая сильнее всего коррелируют с зависимой переменной .y Это ,7x поскольку .59,07 r Переменная 7x - первая отобранная переменная. Теперь исключаем все переменные, для которых выполняется неравенство .396,07 ir Остается одна переменная - .1x Переменная 6x была исключена ранее. Таким образом, из семи объясняющих переменных остается только две переменные

1x и 7x достаточные для описания изучаемого процесса.

Глава IV. Парная регрессия

4.1. Регрессия. Выбор аналитической формы модели

Корреляция не может объяснить, каким образом связаны две переменные между собой. Например, корреляции никак не объясняет, почему капиталовложения порождает прибыль. Термин «регрессия» был введен английским психологом и антропологом Ф.Гальтоном и означает – отступление, возврат к чему либо. Ф. Гольтон заметил, что рост всех сыновей стремится к среднему росту, т.е. сыновья высокорослых отцов не будут высокими, низкорослых отцов не будут низкими.

Page 65: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

Парная регрессия – это уравнение, описывающее корреляционную связь между парой переменных: зависимой переменной (результатом) y и независимой переменной (фактором) x.

)(xfy

Вид аналитической формы связи зависит от специфики изучаемого процесса. При выборе типа функции руководствуется характером расположения точек определяемые данными, а также содержанием изучаемой связи. Предположим, мы имеем данные

niyx ii ...,,2,1),,( . Каждая пара представляет точки на координатной плоскости. Множество точек образуют так называемое поле корреляций. По очертанию расположения точек на поле корреляций мы «угадываем» формы связи между переменными.

На следующих рисунках приведены некоторые виды разброса точек и соответствующие формы связи между двумя переменными.

Рис.4.1 bxay Рис. 4.2 xbay

Рис.4.3 bxay Рис.4.4

2cxbxay

Имеется данные числа зерен ячменя в колосе у(шт.) и соответствующая длина колоса х(см.)

х (см.) 7 8 9 10 11 12 13 14

Среднее число зерен в колосе у

16,0 20,3 23,5 24,5 28,0 29,0 29,5 31,0

Page 66: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

Обоснуем, формулы зависимости числа зерен от длины колос. Представим каждую рапу (7; 16,0), (8; 20,3), …, (14; 31,0) в виде точек на плоскости

Рис.4.5.

Поле корреляций, нам подсказывает линейную форму связи: bxay . Эта линейная форма связи, проявляется как некоторая закономерность лишь в среднем по совокупности наблюдений. Из экономики известна, что спрос зависит от цены х в виде функциональной зависимости bxay .

В дальнейшем будем изучать линейную связь между объясняющей (не зависимой) и объясняемой (зависимой) переменной.

Математическая формула зависимости между двумя переменными называется уравнением парной линейной регрессии и имеет вид

uxy (4.1)

Величина у состоит из двух составляющих:

1. Неслучайной составляющей x , где х – независимая переменная, , -

параметры;

2. u – случайный член.

Причины существование случайного члена разные. К ним относятся:

1) Ошибки измерения. Например, при сборе данных о числе зерен и соответствующие

длины колос ячменя имеются определенные погрешности в измерениях.

2) Не включение объясняющих переменных. Возможно существует факторы влияющие

на у, но эти факторы мы не можем измерить и включить в модель.

Page 67: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

3) Неправильная функциональная спецификация. Функциональное соотношение

между х и у математически может быть определено неправильно. Вместо нелинейной

зависимости рассматривается линейная зависимость.

4) Отражение уравнением регрессии связи между агрегированными переменными.

Например, зависимость между урожайностью и количеством внесенных удобрений

индивидуальна для различных полей. Внеся одинаковые количества удобрений на

различные поля, мы получаем различные урожаи.

4.2. Модель парной линейной регрессии. Оценка параметров методом наименьших квадратов.

Будем рассматривать линейную регрессию (4.1). Истинные значения параметров и никогда неизвестны. Их можем только оценить, т.е. найти некоторые их приближенные значения. Оценки параметров проводится по данным выборки, niyx ii ...,,2,1),,( . Если а – есть оценка , b – оценка то получим оценку уравнения регрессии (4.1)

bxay (4.2)

Очевидно, что не все наблюдаемые точки будут лежать непосредственно на прямой (4.2). разброс наблюденных точек и прямую (4.2) представим на следующем рисунке.

Рис.4.5

Как видно из рисунка не все наблюденные точки лежат на прямой (4.2). Значения iy в

наблюдении, отличаются от расчетных значений iy полученные по уравнению (4.2).

Обозначим через ie остатки в i-ом наблюдении. Оно будет рассчитываться следующим образом

niyye iii ...,,2,1,ˆ (4.3)

С учетом того, что ,ˆ ii bxay остатки записываются в виде

Page 68: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

nibxaye iii ...,,2,1, (4.4)

Мы будем выбирать значения a и b таким образом, чтобы эти остатки были минимальными. Один из способов подбора значений параметров a и b является минимизация суммы квадратов остатков, которую обозначим через S.

n

iii

n

ii bxayebaS

1

2

1

2 min)(),( (4.5)

Такой метод оценок параметров и называется методом наименьших квадратов (МНК).

Минимум функции ),( baS находим, приравняв к нулю производные по a и b:

n

iiii

n

iii

xbxaybS

bxayaS

1

1

0)(2

0)(2

Отсюда получим систему уравнений

n

i

n

i

n

iiiii

n

i

n

iii

yxxbxa

yxbna

1 1 1

2

1 1

(4.6)

Система (4.6) называется системой нормальных уравнений МНК. Поделив каждое уравнение системы (4.6) на n , получим

xyxbxa

yxba2

(4.7)

где i

n

ii

n

ii

n

ii

n

ii yx

nxyx

nxy

nyx

nx

11

22

11

1,1,1,1

Решая систему (4.7) находим a и b

)(),(

)( 22 xVaryxCov

xxyxxyb

xbya

(4.8)

Построенная уравнения регрессии bxay ˆ интерпретируется следующим образом. Интерпретацию можно провести двояко: геометрически и экономически. Параметр a соответствует отрезку прямой, отсекаемому линией регрессии при пересечении ею оси ординат, а параметр b определяет наклон линии регрессии к оси абсцисс.

Page 69: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

Экономическая интерпретация параметров. Свободный член a регрессионного уравнения вообще говоря не имеет экономического смысла и показывает значение результативного признака у, если факторный признак х=0. Формально значение a показывает прогнозируемый уровень объясняемой переменной у. Чтобы параметр имел смысл значения объясняющих переменных должны быть расположены близко к нулю. Коэффициент bпри х показывает, что если переменная х изменится на единицу то у увеличится на b единиц. Это видно из следующей выкладки:

bybbxaxbaybxay )1(~; 1

Пример 4.2. Пусть iy - объем выпуска продукции за месяц на i – м малом предприятии

обрабатывающей промышленности (в тыс.ден.ед.) , ix - стоимость основных фондов на i-м предприятии (в тыс.ден.ед.). Выборка включает 30 малых предприятий обрабатывающей промышленности. Рассчитаны что

.5,2005651;66,370376;03,3296;601 2 xyxyx

Предполагая, что модель имеет вид uxy , найти оценку этого уравнения.

Решение. Уравнение регрессии имеет вид bxay ˆ , где a и b рассчитываются по формуле (4.8). Находим a и b:

.696,260166,370376

03,32966015,2005651)( 222

xxyxxyb

.734,1675601696,203,3296 xbya

Уравнение регрессии имеет вид

.696,2734,1675ˆ xbxay

Пример 4.3. Наблюдения 16 пар (х, у) дали следующие результаты:

.492,657,64,961

16

1

216

1

16

1

i

n

ii

ii

ii

ii yxxyx

Оценить регрессию uxy .

Решение. Оценки осуществляются по формулам (4.8). Находим средние:

.75,3016492

161

,0625,4116657

161,4

1664

161,6

1696

161

16

1

16

1

22

16

1

16

1

ii

i

i

i

ii

ii

yxxy

xxyyxx

Page 70: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

Теперь ,

34

360625,414675,30

)( 22

xxyxxyb

.46344 xbya

Следовательно .

344ˆ xbxay

Пример 4.4. Результаты исследования динамики веса новорожденного приведены в таблице

Возраст (недели) х 0 1 2 3 4

Вес (кг) у 3,2 3,6 4,0 3,8 4,3

Найти оценку уравнения регрессии uxy .

Решение. Составим расчетную таблицу

Табл. 4.1

п/п ix iy

2ix ii yx

1

2

3

4

5

0

1

2

3

4

3,2

3,6

4,0

3,8

4,3

0

1

4

9

16

0

3,6

8,0

11,4

17,2

сумма 10 18,9 30 40,2

Среднее 2

x

3,78

y

6

2x

8,04

xy

Находим оценку для :

24,0248.0

4678,3204,8

)( 22

xxyxxyb

Теперь рассчитаем а:

.30,324,0278,3 xbya

Итак, уравнение регрессии имеет вид

.24,030,3ˆ xbxay

Page 71: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

По этому уравнению можно прогнозировать вес новорожденного на восьмой неделе. Положив 8x в полученном уравнении регрессии имеем 22,5ˆ y т.е. вес новорожденного будет около 5 кг.

После построение регрессии по выборочным данным имеют места следующие равенства:

.0)var(),cov(,ˆ,ˆ xbyxbxayyyebxay

На основании этих равенств доказываем:

.0),ˆcov()3;ˆ)2;0)1 eyyye

1) Так как iii bxaye

Отсюда суммируя по i, получаем

n

ii

n

ii

n

ii xbnaye

111

Разделив на n, имеем

.0)( xbxbyyxbaye

Докажем 2):

iii yye ˆ

Отсюда

n

ii

n

ii

n

ii yye

111

ˆ

Разделив на n, получаем

0ˆ yye

Откуда yy ˆ .

Доказательство 3):

),(),ˆ( bxaybxaCoveyCov

С учетом свойств ковариаций правая часть предыдущего равенства приводится к виду

)(),(),( 2 xVarbyxbCovbxaybxaCov

Теперь легко видеть, что

00)](),([)(),(),ˆ( 2 bxbVaryxCovbxVarbyxbCoveyCov .

Page 72: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

4.3. Качество оценивания. Коэффициент детерминации 2R

Цель регрессионного анализа состоит в объяснении поведения зависимой переменной у. Разброс значений у в разных выборках является разными и их суммарно можно описать с помощью выборочной дисперсии )( yVar . Мы знаем, что значение у в каждом

наблюдении состоит из двух частей iy и ie :

iii eyy ˆ (4.9)

Находим дисперсию )( yVar :

),ˆ(2)()ˆ()ˆ()( eyCoveVaryVareyVaryVar .

В предыдущем параграфе была доказана, что 0),ˆ( eyCov .

Следовательно, мы получаем:

)()ˆ()( eVaryVaryVar (4.10)

Таким образом, дисперсия )( yVar разложена на две части:

)ˆ(yVar - часть, объясненная регрессионным уравнением;

)(eVar - необъясненная часть.

Отношение )()ˆ(

yVaryVar - это часть дисперсии у, объясненная уравнением регрессии. Это

отношение называется коэффициентом детерминации и обозначается 2R :

)()(1

)()ˆ(2

yVareVar

yVaryVarR

.

2R характеризует долю вариации (разброса) зависимой переменной, объясненную с помощью уравнения регрессии.

Максимальное значение 2R равна единице и удовлетворяет неравенству 10 2 R . Если

12 R , то это означает, что линия регрессии точно соответствует всем наблюдениям, так

что niyy ii ...,,2,1,ˆ и подгонка точная: 0)(),ˆ()( eVaryVaryVar . Если в

выборке отсутствует видимая связь между у и х, то 2R будет близок к нулю. Чем ближе к

единице 2R , тем лучше качество подгонки, т.е. y более точно аппроксимирует у.

Коэффициент детерминации можно вычислить с помощью коэффициента корреляции yyr ,ˆ

между y и .y Имеет место формула

Page 73: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

2,ˆ Rr yy (4.11)

В самом деле, учитывая соотношение

)ˆ()ˆ,ˆ(),ˆ()ˆ,ˆ()ˆ,ˆ(),ˆ( yVaryyCoveyCovyyCoveyyCovyyCov

Получим

22

,ˆ )()ˆ(

)()ˆ()ˆ(

)()ˆ()ˆ(

)()ˆ(),ˆ( R

yVaryVar

yVaryVaryVar

yVaryVaryVar

yVaryVaryyCovr yy

В случае парной регрессии коэффициент детерминации вычисляется по формуле 2,

2yxrR .

Это следует из того что

),(),(),ˆ( yxbCovybxaCovyyCov ,

)()()ˆ( 2 xVarbbxaVaryVar

и yxyy ryVarxVar

yxCovyVaryVar

yyCovr ,,ˆ )()(),(

)()ˆ(),ˆ(

.

После того как уравнение линейной регрессии найдено, проводится оценка значимости уравнения в целом. Выше мы отметили, что если 02 R то отсутствует зависимость

между у и х. В действительность несмотря на то что коэффициент 2R будет в точности равны нулю, все таки зависимость между у и х может существовать, возможно и слабая. Итак, как узнать, действительно ли полученное для регрессии значение 2R отражает истинную зависимость или оно появилось случайно?

Проверить значимость уравнения регрессии – значит установить, соответствует ли математическая модель, выражающая зависимость между переменными, экспериментальным данным.

Проверка значимости уравнения регрессии производится на основе дисперсионного анализа. Выше было показана (см. формулу (4.10)), что

)()ˆ()( eVaryVaryVar .

Используя определение выборочной дисперсии и умножив обе части на n, получим следующее разложение

n

ii

n

ii

n

ii eyyyy

1

22

11

2 )ˆ()( (4.12)

Здесь использован тот факт, что yy ˆ и 0e .

Page 74: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

Левая часть равенства (4.12) является общей суммой квадратов отклонений зависимой переменной от её выборочного среднего значения TSS (totalsumofsquares). Первый член в правой части равенства является объясненной суммой квадратов ESS(errorsumofsquares), а второй член – необъясненной (остаточной) суммой квадратов RSS(regressionsumofsquares).

Равенство (4.12) в этих обозначениях имеет вид

TSS=ESS+RSS (4.13)

F – статистика для проверки общего качества регрессии записывается как отношение объясненной суммы квадратов в расчете на одну независимую переменную, деленное на остаточную сумму квадратов в расчете на одну степень свободы.

)/()1/(

knRSSkESSF

(4.14)

Поделив числитель и знаменатель на TSS и учитывая, что 22 1/,/ RTSSRSSRTSSESS , поучим

)/()1()1/(

2

2

knRkRF

(4.15)

Так как в нашем случае оценивается два параметра свободный член и коэффициент при х, поэтому параметр k=2.

F – статистика для проверки качества парной линейной регрессии принимает вид

2

2

1)2/(

RnRF

(4.16)

где n – число наблюдений.

Для определения статистической значимости коэффициента детерминации 2R

проверяется гипотеза 0: 20 RH .

Проверка проводится следующим образом. Находят критическое значение крF при

заданном уровне значимости и степенях свободы с 2,1 21 n по таблице распределение Фишере – Снедекора. Потом сравниваем наблюдаемое значение F с критическим крF .

если крFF , то 0H принимается, т.е. 2R не значим;

если, крFF то 0H отвергается, т.е. 2R значим.

Для оценки качества построенной модели применяется средняя ошибка аппроксимации.

Page 75: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

Средняя ошибка аппроксимации – среднее отклонение расчетных значений зависимой переменной от фактических:

%100ˆ1

1

n

i i

ii

yyy

nA

Допустимый предел значений А не более 8 – 10 %.

Пример 4.5. В семи предприятиях выпускаются один и тот же вид продукции соответственно в тыс.ед.(х) и затраты на производство у (млн.ден.ед.). Данные представлены в таблице.

Выпуск продукции тыс.ед. х 1 2 4 3 5 3 4

Затраты на производство млн.ден.ед., у

30 70 150 100 170 100 150

1) Оценить параметры функции издержек uxy ;

2) Рассчитать коэффициент детерминации и проверить значимость построенной

уравнении регрессии на уровне значимости 05,0 .

Составим расчетную таблицу Табл. 4.2

Номер предприятия

х у 2x 2y

yx y

e 2e

1

2

3

4

5

6

7

1

2

4

3

5

3

4

30

70

150

100

170

100

150

1

4

16

9

25

9

16

900

4900

22500

10000

28900

10000

22500

30

140

600

300

850

300

600

31,1

67,9

141,6

104,7

178,4

104,7

141,6

-1,1

2,1

8,4

-4,7

-8,4

-4,7

8,4

1,21

4,41

70,56

22,09

70,56

22,09

70,56

22 770 80 99700 2820 770 0 261,48

Среднее

3,143 110 11,429 14242,857 402,857 110 - 37,354

x y 2x

2y yx y

e 2e

Находим, ,832,36)143,3(429,11110143,3857,402

)( 222

xxyxxyb

.763,5143,3832,36110 xbya

Page 76: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

Запишем уравнение регрессии

xbxay 832,36763,5ˆ .

Чтобы найти коэффициент детерминации, вычислим )( yVar и )(eVar .

,857,2142)110(857,14242)()( 222 yyyVar

.354,37)()( 22 eeeVar

Теперь .98,0857,2142

354,371)()(12

yVareVarR

Т.е. 98% вариации зависимой переменной (затраты на производство) объясняется регрессией.

Проверим гипотезу .0: 20 RH

По таблице F – распределения для 05,0 и чисел степеней свободы 11 и

52722 nv найдем критическое значение .61,6крF

Находим расчF по формуле (4.16)

.24598,01598,0

.

расчF

Так как кррасч FF 61,6245. , то отвергаем 0: 20 RH , принимаем гипотезу

0: 21 RH т.е. построенное уравнение регрессии значим.

Глава V.Свойства коэффициентов регрессии и проверка гипотез

1.1. Случайные составляющие коэффициентов регрессии В предыдущих рассмотрениях мы имеем дело с моделью парной линейной регрессии

uxy (5.1) и её оценкой, на основе n выборочных наблюдений

bxay ˆ (5.2) Напомним, еще, что величина y имеет две составляющие: неслучайную x и случайную u.Оценки коэффициентов линейной регрессии определенные по формулам

)(),(

xVaryxCovb

xbya (5.3)

теоретически их так же можем разложить на случайную и неслучайную составляющие. Воспользовавшись соотношением (5.1) ),( yxCov представим в следующем виде

),()(),(),cov(),cov(),(),( uxCovxVaruxCovxxxuxxCovyxCov

Page 77: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

Отсюда видно, что ),( yxCov так же состоит из двух слагаемых; первая слагаемая которая не содержит случайного члена, а вторая содержит. На основании предыдущего соотношения, получим новое представление коэффициента .b

)(

),(),()()(

1)(

),(xVaruxCovuxCovxVar

xVarxVaryxCovb

(5.4) Таким образом, коэффициент b представлен в виде двух составляющих: неслучайную, равную истинному значению и случайную, зависящая от .u Легко заметить, что коэффициент также может быть представлен в виде суммы неслучайной и случайной составляющей. В самом деле

n

ii

n

ii

n

ii

n

ii

n

i

i

n

ii

n

ii

xVaruxCovxu

n

xVaruxCovxxu

nxn

nxVaruxCovxxu

nx

nn

xxVaruxCovux

nx

xVaruxCovy

nxbya

1

1111

11

)(),(1

)(),(11

)(),(111

)(),()(1

)(),(1

Итак

)(ua (5.5) Заметим, что практически мы не можем, получить эти разложения, так как не знаем истинных значений и а так же фактических значений u в выборке. Расхождения между коэффициентами регрессии и истинными значениями параметров вызваны случайным членом .u Отсюда следует, что чем больше элемент случайности, тем, вообще говоря, менее точными являются оценки. На основании представлений (5.4) и (5.5) заключаем, что если случайная составляющая принимает разные значения в n наблюдениях, то а и b тоже принимают разные значения. Если случайный член распределен по какому-то закону, то а и b тоже будут подчиняться этому закону распределения. В следующих параграфах мы будем уточнять закон распределения случайного члена .u 5.2. Предложения о случайном члене. Условия Гаусса-Маркова. До сих пор мы занимались оценкой коэффициентов регрессии. Уравнение зависимости объясняемой переменной y от объясняющей переменной x в координатной форме имеет вид

,iii ebxay ni ,....,2,1 (5.6) Допущения, лежащие в основе регрессионного анализа являются условия Гаусса-Маркова.

1. Математическое ожидание случайного члена в любом наблюдении должно быть равно нулю, т.е. ,0)( iuM .0)( uM ni ,1

2. Дисперсия случайного члена должна быть постоянной для всех наблюдений, т.е. 22 )()( uii uMuD -константа, ni ,1

3. Случайные члены являются статистически независимыми друг от друга, т.е. 0),( ji uuCov ;ji nji ,1,

4. Значения объясняющих переменных ix и ошибок iu независимы друг от друга,

т.е. niuxCov ii ,1,0),(

Page 78: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

5. Объясняющая переменная x неслучайная. Это означает, что мы имеем фиксированный набор значений .x

Если выполняются условия Гаусса-Маркова, то оценки коэффициентов линейной регрессии, полученные с помощью МНК, являются наилучшими оценками, т.е. несмещенными, эффективными и состоятельными. Наряду с условиями Гаусса-Маркова относительно случайного члена предполагается нормальность его распределения. Напомним, что понятие нормального распределения была рассмотрена во главе II п.2.3.. Так как 0)( iuM и 2)( uiuD то график плотность имеет вид шапочки представленную на рисунке 2.2 п. 2.3. гл.II. Дадим трактовку условий Гаусса-Маркова. Первое условие означает, что случайный член не должен иметь систематического смещения. Случайные члены будут иметь либо положительные, либо отрицательные знаки. По условию Гаусса-Маркова средние значения отклонений в любом наблюдении равно нулю. Это значит положительные и отрицательные значения уравновешиваются. Случайный член не должен иметь больше смешении ни в одну сторону. Если постоянный член включен в уравнении регрессии, то это условия выполняется автоматически. Второе условия означает дисперсии для любых наблюдений постоянно. Под дисперсией 2

n имеется в виду возможное поведение случайного член до того, как сделана выборка. Величина 2

n неизвестна и одна из задач регрессионного анализа состоит в её оценке. Постоянство дисперсии случайного члена для любого наблюдения называется гомоскедастичностью (что означает одинаковый разброс). Изменение дисперсии с изменением номера наблюдения называется гетероскедастичностью. Таким образом:

2)( uiuD -константа ),1( ni - гомоскедастичность;

2)( iiuD ),1( ni -гетероскедастичность. На следующих рисунках показаны характерные диаграммы рассеяния случайных членов в случае гомоскедастичности и гетероскедастичности.

Рис.5.1 Рис.5.2 Если условие гомоскедастичности не выполняется, то оценки коэффициентов регрессии будут неэффективными, хотя и несмещенными. Третье условие предполагает отсутствие систематической связи между значениями случайного члена в любых двух наблюдениях. Появление одного случайного члена не связана появлением другого случайного члена третье условие Гаусса-Маркова можно записать в другом виде. Поскольку

))((),( ujuiii uuMuuCov Так как 0)()( uMuM iu то 0)()()(),( jijiji uMuMuuMuuCov

Page 79: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

Если это условие не выполняется, то регрессия, по методу наименьших квадратов, дает неэффективные оценки. Четвертое условие Гаусса-Маркова может быть рассмотрено в двух формах - слабой и сильной. Сильная форма заключается в том, что объясняющая переменная не содержать случайных составляющих. Объясняющая переменная по существу является стохастической. Слабая форма этого условия состоит в том, что объясняющие переменные могут содержать случайные компоненты, но они должны быть распределены независимо от случайного члена. Если данное условие выполнено, то теоретическая ковариация 0),( ii uxCov Это следует из того что .0)( iuM В самом деле

0)())(()))(((),( iiiuiiiii uMxMxuxMxMxxCov Пятое условие является особенно важным. Если условие о не случайности объясняющий переменной не выполняется, то оценки коэффициентов регрессии оказываются смешенными и несостоятельными. Это связано с ошибками измерения объясняющих переменных. Оценки коэффициентов регрессии обладают теми же основными свойствами, что и оценки, полученные при использовании условия о не случайности объясняющей переменной. Теорема Гаусса-Маркова. Если условия 1-5 Гаусса-Маркова выполняются, то оценки a и b полученные с помощью МНК, являются наилучшими линейными несмешанными и эффективными оценками, т.е обладают следующими свойствами: 1) Несмещенность: )(,)( bMaM 2) Эффективность: имеют наименьшую дисперсию в классе всех линейных несмещенных оценок, равную

)()(,

)()(

222

xnVarbD

xnVarxaD uu

(5.7)

3)Состоятельность: ,0)(lim

aDn

,0)(lim

bDn

Это означает, что 1)(lim1)(lim

bPиaPnn

Доказательство теоремы. Выше (формулы (5.4)и(5.5)) мы представили bиa в виде двух составляющих неслучайную и случайную зависящая от u . Вычислим математическое ожидание оценок a и .b

),()(

)(1)()(

0,(1)(11

uxCovMxVar

xuMn

MxVar

uxCovxun

MaMn

ii

n

ii

)(M по свойству математического ожидания, а 0)( iuM по 1-му условию Гаусса-Маркова. Поэтому

),()(

)( uxCovMxVar

xaM

Докажем, что .0),( uxCovM В самом деле.

00)(1)()(1

)()(1)((1),(

11

1

xxn

uMxxn

uuMxxn

uuxxn

MuxCovM

n

iii

n

ii

i

n

ii

n

iii

Итак, имеем что, )(aM т.е. оценка a не смешенная. Аналогично устанавливается, что

Page 80: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

),(

)(1)(

)(),()( uxCovM

xVarM

xVaruxCovMbM

Рассчитаем дисперсии оценок a и b . Для этого сначала рассчитаем

n

iuii

n

iii n

xVaruDxxn

uuxxn

DuxCovD1

222

1

11, (5.8)

Теперь

)(),(,2

)(),()(

)(),()(

xVaruxCovCov

xVaruxCovDD

xVaruxCovDbD

Имеем

)(

)()(

1),()(

1)(

),()(2

222 xnVarn

xVarxVar

uxCovDxVarxVar

uxCovDbD uu

Рассчитаем )(aD

),()(

)(1)()(

),(1)( 2

2

12

1

uxCovDxVar

xuDn

DxVar

uxCovxun

DaDn

ii

n

ii

На основании свойств дисперсии и формулы (5.8), получим

)(1)(

)(1)(

222

2

22

2 xVarx

nnxVar

xVarxn

naD u

uu

Учитывая, что ,)()( 22 xxxVar перепишем )(aD в виде

)()(

22

xnVarx

aD u

Из формул (5.7) видно, что если n велико, то дисперсии малы и к тому же эти дисперсии стремятся к нулю при ,n что показывает эффективность и состоятельность оценок.

5.3. Расчет стандартных ошибок коэффициентов регрессии. Рассмотрим теоретические дисперсии оценок a и .b

)()(

22

xnVarx

aD u

и )()(

2

xnVarbD u

(5.9) На практике мы не можем вычислить теоретические дисперсии a и ,b так как 2

u

неизвестно, однако мы можем получить оценку 2u на основе остатков, .ˆiii yyå

Очевидно, что разброс остатков относительно линии регрессии будет отражать неизвестный разброс и относительно линии, ,xy хотя, в общем, остаток и случайный член в любом данном наблюдении не равны друг другу. Следовательно, выборочная дисперсия остатков ),(еVar которую мы можем вычислить, может быть,

использована для оценку .2u Несмещенной оценкой дисперсии 2

u является остаточная дисперсия.

n

iiе е

nS

1

22

21

(5.10)

Отметим, что в знаменателе остаточной дисперсии стоит число степеней свободы ),2( nтак как две степени свободы теряются при определении двух параметров a и .b Докажем, что .)( 22

uåSM Имеем

Page 81: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

)(2

1)(2

1)(2

1)(1

2

11

22

n

ii

n

ii

n

iiе еD

nееM

nеM

nSM (5.11)

Здесь мы воспользовались тем, что 0е Рассчитаем, )( iеD предварительно переходя к разности iii yyå ˆ

iiiiiii yyCovyDyDyyDeD ˆ,2ˆˆ Представим iy в следующем виде )(ˆ xxbybxxbybxay iiii и найдем

дисперсию, пользуясь соотношениями ,0),( ji yyCov при ,ji 2),( uii yyCov

n

ii

iun

ii

uiun

ii

uiuuii

xx

xxnxx

xxnxx

xxn

yyD

1

22

1

222

1

2

2222 112ˆ

(5.12) Подставив (5.12) в (5.11),получаем

22

1

2

1

22

2

1

1

2

22 )11(

2)(

)(1

2)(

)(111)( uu

n

ii

n

ii

uu

n

in

ii

iå n

nxx

xxn

nn

nxx

xxnn

SM

так что оценка (5.10) является несмещенной оценкой теоретической дисперсии .2

u

Величина 2ее SS называется стандартным отклонением.

Представляя в формулах (5.9) вместо 2u её оценку 2

eS получим оценки теоретических дисперсий для a и b и после извлечения квадратных корней – оценки их стандартных отклонений. Вместо термина «Стандартные отклонения» используют также термин стандартные ошибки коэффициентов регрессии и коротко обозначают «С.О» Стандартные ошибки коэффициентов регрессии рассчитываются по следующим формулам:

)()(.

22

xnVarSxaОС e и

)()(.

2

xnVarSbOC e

(5.13)

Пример 5.1. По пяти данным расходов на питание у и личного дохода х

х 2 6 10 14 18

у 1 2 4 11 12

построена регрессионная зависимости xy 755,075,1ˆ . Рассчитать стандартные ошибки коэффициентов регрессии. Решение: Находим ).(xVar Так как 132,10 2 xx то .32100132)()( 22 xxxVarЛегко найти вектор остатков ).2,0;9,1;0,2;9,0;2,1( Te Тогда

9,904,061,34,81,044,1 eeT

По формуле (5.10) находим 3,339,9

22

neeS

T

e

Теперь 14,03253,3..;65,1

3253,3132..

bOCaOC

Page 82: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

И окончательно уравнение регрессии записывается в виде .755,075,1ˆ)14,0()65,1(xy

5.4. Проверка гипотез относящихся к коэффициентом регрессии.

Пусть имеется линейная регрессия

uxy (5.14) где , параметры, точные значения которых неизвестны, u случайный член. Теперь мы сделаем некоторые предположения о величине параметров и . Знаем, что различного рода предположения принята называть гипотезами. Например, коэффициент равна 2. Сформулированная гипотеза, которую мы собираемся проверять называется нулевой гипотезой и обозначается ,0Н гипотезу противоречащую нулевой называется

альтернативной обозначаемой .1Н Эти сформулированные гипотезы с использованием введенных обозначений записываются в виде

.2:2:

1

0

НpН

Предположения относительно величин бесчисленное множество, например 3;7,1 и т.д. Возьмем общий случай, в котором в нулевой гипотезе утверждается, что равно некоторому конкретному значению, скажем ,0 и альтернативная гипотеза состоит в том, что не равно этому значению. Символически эти гипотезы записываются в виде

01

00

::

НpН

(5.15)

Если гипотеза 0H верна, то значения, ,b полученные в ходе регрессионного анализа, будут иметь распределение с математическим ожиданием 0 (вспомните что ))( 0 bM и дисперсией ))7.5.(()(/)( 2 смxnVarbD u Так как случайный член u имеет нормальное распределение, то величина b так же нормально распределена. Проверка гипотезы 0Н осуществляется на основании выборочных данных. По выборочным данным находим оценку bпараметра . Далее вычисляем С.о ).(b Процедура проверки гипотезы состоит в следующем: В качестве критерия проверки гипотезы 0Н принимают случайную величину

).(.0

boCb

t

(5.16)

которая носит название t-статистики. t-статистика имеет распределение Стьюдента с 2 т степенями свободы. Далее, по таблице распределения Стьюдента по заданному

уровню значимости и числу степеней свободы 2 n находят критическую точку .крt Сравнивая наблюдаемое значение критерия с критическим, можно принять или

отвергнуть нулевую гипотезу .0Н Правилу проверки гипотезу ,0Н сформулируем следующим образом:

Если ,)(.0

крtboC

bt

то 0Н принимается;

Если ,)(.0

крtboC

bt

то 0Н отвергается, а альтернативная гипотеза 1Н

принимается.

Page 83: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

Результаты оценивания регрессии совместимы не только с конкретной гипотезой ,: 00 Н и с некоторым их множеством.

Для установления значимости коэффициента регрессии b формулируется гипотеза .0:0 Н t-статистика для проверки этой гипотезы имеет вид

)(.)(.0

boCb

boCbt

(5.17)

Критическое значение крt находим по таблице t распределение Стьюдента по заданному уровню значимости и 2 n степенями свободы. Сравнивая значение t-вычисленная по формуле (5.17) с критическим значением получаем

Если ,)(. крt

boCbt то мы не отвергаем нулевую гипотезу ,0Н и коэффициент

регрессии b незначим;

Если ,)(. крt

boCbt то отвергаем нулевую гипотезу и принимаем

альтернативную гипотезу .0:1 Н В этом случае коэффициент регрессии bзначим.

Пример 5.2. По выборке объема 20n построена регрессия (в скобках – стандартные ошибки)

)069,0()387,0(483,0583.2ˆ xy

1) Сформулировать гипотезу относительно коэффициента x и проверить её при уровне значимость ;05,0 2) проверить при 05,0 значимость коэффициента .b Решение. Сформулируем основную нулевую гипотезу: ,1:0 Н тогда альтернативная

гипотеза имеет вид ,1:1 Н Вычислим t-статистику по формуле (5.16).Так как ,483,0b 069,0)(. boc

,10 имеем

493,7069,0

1483,0)(.0

bocb

t

По таблице t-распределение находим 101,2)220;05,0( ttкр

Так как крtt 101,2493,7493,7 следовательно отвергаем, ,0Н принимаем альтернативную гипотезу. Для проверки значимость коэффициента b сформулируем гипотезы

0:0:

1

0

НН

t статистика для проверки нулевой гипотезы имеет вид

7069,0483,0

)(.

bocbt

Сравнивая t статистику с 101,2крt имеем

крtt 101,27 Это означает, что нулевая гипотеза 0H отвергается, принимается альтернативная

гипотеза .1H Следовательно коэффициент b значим.

Page 84: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

5.5. Доверительные интервалы Относительно коэффициентов регрессии мы можем сформулировать множество гипотез. Некоторые из этих гипотез могут подтвердится, а некоторые нет. Для разобранного выше примера 5.2. сформулируем гипотезу: 5,0:0 Н и проверим эту гипотезу при 05,0 и

.101,2крt Значение t статистики равна 0,246. Так как ,101,2246.0 êðtt

принимаем основную гипотезу .0Н Пусть теперь основная гипотеза имеет вид 7,0:0 Н тогда альтернативная гипотеза .7,0:1 Н В этом случае t статистика

имеет значение .143,3069,0/)7,0483,0( t Сравнение 143,3143,3 t с

критическим 2,101 дает .101,2143,3 êðtt Следовательно отвергается ,0Н принимается альтернативная гипотеза .1Н Какие из сформулированных гипотез подтверждаются, а какие нет решается с помощью доверительного интервала. Мы знаем, что оценка b регрессии приводить к принятию нулевой гипотезы с любым гипотетическим значением , удовлетворяющее условию.

,).(. крt

bocb

или кркр tbocbt

)(.

Решая последнее неравенство, относительно приходим к двойному неравенству

кркр tbocbtbocb )(.).(. (5.18) Любое гипотетическое значение, для , которое удовлетворяет неравенству (5.18), будет автоматически совместима с оценкой ,b иными словами, не будет отвергаться ею. Множество тех значений, для которых будут принята нулевая гипотеза называется доверительным интервалам для величины и имеет вид

))(.;)(.( кркр tbocbtbocb (5.19) Посередине интервала лежит величина .b Границы интервала одинаково отстоят от ,bзависят от выбора уровня значимости и являются случайными числами. Доверительный интервал покрывает значение параметра с вероятностью )1( т.е.

1))(.)(.( кркр tboCbtboCbP Если принимается 5-процентный уровень значимости, то соответствующим доверительным интервалом считается 95-процентный интервал. Если выбирается 1-процентный уровень, то мы построим 99%-ный доверительный интервал. Так как крt , будет больше для 1-процентного уровня, чем для 5-процентного (при любом данном числе степеней свободы), то тем самым 99%-ный интервал будет шире 95%-го интервала. Так как по середине обоих интервалов лежит величина ,b интервал в 99% включает все гипотетические значения для в 95%-ом доверительном интервале. Пример 5.3. Вычислить 95%-ный доверительный интервал при 5-процентном уровне значимости и 99%-ный доверительный интервал при 1-процентном уровне значимости для коэффициента b регрессии примера 5.2. Решение. По заданному объему выборки (n=20) находим критические значения соответственно при 5-процентном и 1-процентном уровне значимости.

878,2)18;01,0(

101,2)18;05,0(

tttt

кр

кр

Находим 95-процентный доверительный интервал. Так как 069,0)(.;483,0 bÎÑb то на основании (5.19) 95-процентным доверительным интервалом, является

628,0;338,0101,2069,0483,0;101,2069,0483,0 èëè

Page 85: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

Построим 99-процентный доверительный интервал при 1-процентном уровне значимости. Опят используя (5.19) имеем

681,0;284,0878,2069,0483,0;878,2069,0483,0 èëè Легко усмотреть, что 99-прцентный доверительный интервал содержит 95-процентный доверительный интервал.

5.6. Нелинейные регрессии и методы их линеаризации Модельные уравнения, описывающие экономические явления часто являются нелинейными. Конкретная аналитическая форма нелинейной модели основан на априорной информации об исследуемых зависимостях. Например, если из экономической теории, известно, что эластичность объясняемой переменной y относительно объясняющей переменной x постоянно, то модель должна иметь степенную форму:

.uxy (5.20) Если знания об исследуемом явлении указывают на то, что единичному приросту объясняющей переменной сопутствует все меньше приросты объясняемой переменной, то следует применять модель в форме.

unxy (5.21) Зависимостью этого типа также описывается влияние стажа работы на данном предприятии ( )x на индивидуальную производительность труда работников ).( y Если известно, что единичному приросту объясняющей переменной сопутствует все большие приросты объясняемой переменной, то модель может иметь показательную форму.

uy x (5.22) Аналитическая форма модели может быть выбрано, но основе графиков разброса эмпирических точек с координатами

),(),....,,(),,( 2211 nn yxyxyx (5.23) Некоторые типы нелинейных связей между переменными y и x проиллюстрированы на рис 5.3-5.4

Рис. 5.3 Рис.5.4

Различают два класса нелинейных регрессионных моделей. 1. Нелинейные относительно объясняющих переменных, линейные по

оцениваемым параметром и . Примерами могут служить следующие модели:

Page 86: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

,1 ux

y ,uxy uxy ln (5.23)

2. Нелинейные как относительно включенных в анализ объясняющих переменных, так и по оцениванием параметром.

Примером таких нелинейных моделей являются: -степенная uxy -показательная uay x , a положительная константа

-экспоненциальная uey x Для оценки параметров нелинейных моделей, с помощью подходящих преобразований, исходную нелинейную зависимость сводят к линейным соотношениям между y и .x Линеаризация нелинейных моделей осуществляются следующими методами: -замена переменных; -логарифмирование обеих частей уравнения; -комбинированный Замена переменных. Вместо нелинейных объясняющих переменных введем новые линейные переменные. Например, нелинейные регрессионные модели (5.23)

линеаризуются с помощью замены x

z 1 в первом уравнении xz во втором и xz ln

в третьем уравнении. После этого мы получим линейное регрессионное уравнение uzy параметры, которой оцениваются по МНК. Для оценки параметров и

мы используем значения новой объясняющей переменной z. Значения этой новой переменной формируется с помощью значения исходной переменной x следующим образом:

nn

nn

nn

nxzxzxzxzxzxz

xz

xz

xz

,...,ln,ln,.....,

1,......1,1

2211

2211

22

11

cоответственно для первого, второго и третьего уравнения. Логарифмирование обеих частей уравнения. Этим методом линеаризуются степенные, показательные, экспоненциальные модели. Рассмотрим например, степенную модель

.uxy Логарифмируя обе части получим .lnlnlnln uxy

Далее производя замену ;~;~,~ nuunnxznyy имеем линейную модель. .~~~ uzy

Таким же методом линеаризуются показательные и экспоненциальные модели. Следует отметить, что недостатком линеаризации является то, что оценка параметра b получается не из условия минимизации суммы квадратов отклонений для исходной переменной, а из условия минимизации суммы квадратов отклонений для преобразованной переменной. Пример 5.4. На основе следующих наблюдений переменных х и y

ix 2 3 4 5 6 7

iy 10 11 12 15 17 22

оценить параметры показательной модели uxy 10 Решение. Логарифмируя обе части по основанию 10 имеем.

ugxgy

Page 87: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

Далее производя замену gиggyy ~~,~ получим линейную регрессию,

.~~~ uxy Оценим параметры ~ и ~ по МНК. Составим расчетную таблицу (значения gy взята из таблицы Брадиса) Табл.5.1.

x y gyy ~ 2x yx~

2 10 1 4 2 3 11 1,04 9 3,12 4 12 1,08 16 4,32 5 15 1,18 25 5,90 6 17 1,23 36 7,38 7 22 1,34 49 9,38

27 6,87 139 32,1 среднее 4,5 1,145 23,167 5,35

Рассчитаем

84,05,4068,0145,1~

068,0917,2198,0

25,20167,23145,15,435,5

)(

~22

xbyaxx

yxyxb

Оценка имеет вид 068,084,0ˆ bxay Находим значения и по таблице антилогарифмов из равенств.

84,0g и 068,0g Отсюда ,918,6 .169,1 Поэтому xy )169,1(918,6ˆ

Глава VI. Множественная регрессия

6.1. Спецификация модели До сих пор мы рассматривали регрессии, зависящие только от одного фактора (объясняющей, независимой переменной). Если в уравнение регрессии включаются несколько факторов, то такая регрессия называется множественной. Можно привести много примеров где итоговая (объясняемая) переменная зависит от различных объясняющих переменных. Например, общее потребление )( y может зависеть от дохода семьи ),( 1x от состава семьи ),( 2x от инфляции ).( 3x Объем выпускаемой продукции зависит от объема вкладываемого капитала и от количества работающих и т.д. Модель множественной регрессии - это уравнение, отражающее связь между результатом и несколькими факторами. В общем виде эта связь записывается как функция от нескольких переменных

),,....,( 21 uxxxfy к (6.1) где y объясняемая переменная (результат)

кxxx ,...,, 21 объясняющие переменные (факторы) u случайный член f некая математическая функция.

Построение уравнения множественной регрессии начинается со спецификации модели. Проблема спецификации рассматривается в основном с двух точек зрения: отбор

Page 88: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

факторов и выбор вида уравнения регрессии. Факторы, включаемые во множественную регрессию, должны отвечать следующим требованиям:

быть, количественно измеримы. Если имеются качественные факторы, которые необходимо включить в модель, то нужно придать им количественную определенность посредством введения так называемой фиктивной переменной. Например, в модели урожайности качество почвы задается в виде баллов; в модели стоимости объектов недвижимости учитывается место нахождения недвижимости, районы их расположения могут быть проранжированы. не должны быть коррелированны между собой и тем более находиться в точной функциональной связи.

Факторы, включаемые в модельное уравнение должны быть тщательно отобраны с помощью анализа матрицы коэффициентов корреляции, которая изложена в гл. I. Если между факторами существует высокая корреляция, то нельзя определить их изолированное влияние на результативный показатель, и параметры уравнения регрессии оказываются не интерпретируемыми. Имеются разные методы выбора моделей с различным составом факторов. Метод последовательного включения факторов состоит в том, что сначала будет построена модель с фактором, наиболее тесно связанным с результатом. Затем поочередно добавляются другие факторы. При этом целесообразность включения нового фактора в модель оценивается остаточной дисперсией. Остаточная дисперсия при включении нового фактора должна уменьшаться. В методе исключения факторов сначала рассматривается модель с максимально большим количеством факторов, из которой затем поочередно исключаются незначимые факторы то тех пор, пока модель не будет иметь только значимые параметры при факторах. Как и в парной регрессии, в множественной регрессии различают фактическое и теоретическое значение результата. Фактическое значение-это, наблюдаемое значение результата. В модели регрессии оно обозначается, как .y Фактическое значение результата можно представить в виде двух составляющих: теоретического (выровненного) значения y и случайного остатка е т.е. .ˆ eyy 6.2. Множественная линейная регрессия. Оценка параметров методом наименьших квадратов (МНК)

Рассмотрим линейную модель множественной регрессии.

uxxxy кк .....22110 (6.2) Где к ,.....,, 10 -параметры модели (коэффициенты регрессии),подлежащие оцениванию по выборке, kxxx ,...., 21 - объясняющие переменные, рассматриваются как неслучайные величины, т.е. они измерены без ошибок,u - случайный член. Уравнение регрессии (6.2) характеризует зависимость среднего значения y от объясняющих переменных .,...., 21 кxxx Коэффициент регрессии j в уравнении (6.2) показывает, на какую величину в среднем изменится результативный признак ,y если переменную jx увеличить на единицу при неизменных значениях остальных объясняющих переменных, входящих в уравнение регрессии. Это легко проверяется прибавлением к jx единицу. Будем иметь

:....)1(....~1111110 jкjjjjjj yxxxxxy

Для оценки параметров модели имеются исходные данные - наборы значений зависимой переменной y и независимых факторов (объясняющих переменных) :ix

Page 89: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

nixxxy iкiii ,.....,2,1),,....,,( 21 (6.3) На основе набора данных получим систему соотношений

nnккnnn

кк

кк

uxxxy

uxxxyuxxxy

....

.......

22110

2222221102

1112211101

(6.4)

Запишем (6.4) в матричной форме uXY (6.5)

где

ny

yy

Y

.

.

.2

1

-вектор, столбец (размерности n )значений объясняемой переменной;

nknn

ê

ê

xxx

xxxxxx

X

.......1.........................

......1.......1

21

22221

11211

-матрица (размерности 1 kn значений объясняющих

переменных;

к

.

.

.1

0

-вектор-столбец (размерности (к+1)) неизвестных параметров, которые

подлежат оцениванию по выборке;

nu

uu

u..

2

1

-вектор столбец (размерности n ) случайных членов.

Для оценки вектора неизвестных параметров применим метод наименьших квадратов. Оценка осуществляется из условия минимизации скалярной суммы квадратов S по компонентом вектора ,

)()( XYXYS T (6.6) Пусть оценкой вектора является вектор .),...,,( 10

Tкbbbb Тогда условия минимизации

запишется в виде

min)()(),...,,(1

210

n

ii

TTк eeeXbYXbYbbbS (6.7)

Page 90: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

где

ne

ee

XbYe..

2

1

вектор остатков размерности n

Раскрывая скобки и используя свойства транспонированной матрицы условию минимизации (6.7) запишем в виде

min2)..,,( 10 XbXbYXbYYbbbS TTTTTк (6.8)

Где Tк

Tn

T XbbbbyyY ),,..,,(),,....,( 101 транспонированная матрица .X Условия обращения S в минимум является обращения в нуль частных производных S по компонентом вектора b

kjbS

j

,......,1,0,0

или в матричной форме .0

bS

Дифференцируя (6.8), получим

022 XbXYX

bS TT

Отсюда

YXXbX TT Умножив обе части последнего уравнения слева на матрицу ,)( 1XX T обратную матрице

),( XX T получим YXXXb TT 1)( (6.9)

Таким образом вектор b определяемой по формуле (6.9) является оценкой вектора . Как и в модели с парной регрессией, случайный член u удовлетворяет условиям Гаусса-Маркова.

Математическое ожидание случайного члена в любом наблюдении равно нулю, т.е. 0)(,.....,1,0)( uMилиniuМ i

Дисперсия случайного члена должна быть постоянной для всех наблюдений, т.е. 22

uii uMuD - (константа, ),1( ni ) Случайные члены должны быть статистически независимы(не коррелированны) между собой, т.е.

)(0)( jiuuM ji Случайные члены должны быть статистически независимы от объясняющих переменных. Так как найденные по формуле (6.9) оценки jb являются лишь выборочными оценками неизвестных параметров ,j то возникает вопрос об их качестве. Считается, что оценки качественные, если они являются несмещенными, эффективными и состоятельными. Оценка параметра является несмещенной, если её математическое ожидание равно оцениваемому параметру: )(bМ или .,.....,1,0,)( кjbМ jj Оценка параметра является эффективной, если она имеет наименьшую дисперсию среди всех возможных несмещенных оценок данного параметра по выборкам одного и того же объёма:

22 min)(jbjjbM

Page 91: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

Оценка параметра является состоятельной, если с увеличением числа наблюдений оценка параметра стремится к его значению в генеральной совокупности:

njb jnj ,....,1,

Докажем, что оценки наименьших квадратов являются несмещенными оценками. Подставив в формулу оценки (6.9) вместо Y его значение из (6.5) имеем

uXXXXXXXuXXXXYXXXb TTTTTTTT 1111 )()()()()()( Откуда

uXXXb TT 1)( (6.10) Так как матрица X постоянна и используя 1-ое условие Гаусса-Маркова получим

,)()()()()( 11 uMXXXMuXXXMbM TTTT

Это означает что вектор b есть несмещенная оценка вектора . Рассмотрим так называемую ковариационную матрицу вектора оценок b являющуюся матричным аналогом дисперсии одной переменной

кккк

к

ок

bD

..............................

..........

)(

10

11110

0100

2 (6.11)

где kjbbMbbCov jjiijiij ...,,1,0,, Рассмотрим статистический смысл элементов этой матрицы. На главной диагонали матрицы (6.11)находятся дисперсии элементов вектора оценок b т.е.

.,...,1,0),(),( кjbVarbbCov jjjjj Вне главной диагонали ковариационной матрицы расположены значения ковариации коэффициентов. Ковариационную матрицу запишем в виде

TbbMbD ))(()(2 После замены в неё значение разности b и Tb )( из (6.10), получим:

TTTTT uXXXuXXXMbD 112

Учитывая свойства транспонированных матриц, будем иметь: 11 )()( XXXuuXXX TTTTT

откуда

112 )()()()( XXXuuMXXXbD TTTT (6.12) Рассмотрим )( TuuM

221

22212

12121

21

2

1

.............................

....

....

)...,(..)(

nnn

n

n

n

n

T

uuuuu

uuuuuuuuuu

Muuu

u

uu

MuuM

Из условия 2-3) Гаусса-Маркова следует, что 22 )( uiuM для ni ,.....1 и 0)( jiuuM при ,ji тогда

Page 92: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

nuu

u

u

u

T EuuM 22

2

2

2

1.......000.......100......01

......00

0.....0

0.....0

)(

(6.13)

где nE -единичная матрица размерности nn Учитывая (6.13) ковариационную матрицу запишем в виде

122 )()( XXbD Tu (6.14)

Итак, с помощью обратной матрицы 1)( XX T определяется не только сам вектор b оценок параметров, но и дисперсии и ковариации его компонент. Взяв другую оценку ,~b вектора

легко доказать что дисперсии компонент векторов оценок ib~ и ib удовлетворяют неравенством ).1,...,2,1(22

~ кiii bb Это означает, что оценки коэффициентов

регрессии, найденных методом наименьших квадратов, обладают наименьшей дисперсией. Найдем несмещенную оценку 2

eS для остаточной дисперсии .2u Рассмотрим вектор

остатков .XbYe Учитывая, что YXXXb TT 1)( и ,uXY получим:

.)()(

)()()()()(11

111

uXXXXuuXXXXXuXuXXXXXXXXXuXuXXXXXuXe

TTTT

TTTTTT

Откуда

TTTTT XXXXuue 1)( Вычислим

uXXXXMuuuMuXXXXuXXXXuuM

XbYXbYMeeM

TTTT

TTTTTT

TT

1

11

)()())()()((

)()()(

(6.15)

Учитывая, что скалярное произведение

n

ii

T uuu1

2 и 22 )( uiuM для всех ,,....,2,1 ni

будем иметь: 2

1

2 )()( u

n

ii

T nuMuuM

(6.16)

Матрица TT XXXXC 1)( является симметричной, т.е. CC T то отсюда следует что

,)( 2

11i

n

iiiji

n

ijij

T uCMuuCMCuuM

где .,....,2,1, nji

Используя свойства математического ожидания и того что элементы матрицы C являются неслучайными величинами, получим:

.)()()( 2

1

22

1

trCCuuMCuMCCuuM u

n

iiiuj

jiiiji

n

iii

T

Так как 22 )( uiuM и 0)( jiuuM при ji по условиям Гаусса-Маркова, и

n

iiiCtrC

1- след матрицы ,C равный сумме диагональных элементов. Подставив вместо

C его выражение, получим

Page 93: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

2

1212

121

)1())((

)()()(

uêuTT

u

TTu

TTTT

êtrEXXXXtr

XXXXtruXXXXuMCuuM

(6.17)

Здесь пользовались свойством следа матрицы )()( CAtrACtr Подставив в (6.15) найденные выражения (6.16) и (6.17), получим

2)1()()( uT кnXbYXbYM

Следовательно, несмещенная оценка остаточной дисперсии 2u вычисляется по формуле

11)()(

11 1

2

2

кn

e

кneeXbYXbY

кnS

n

iiT

Tе (6.18)

Легко видеть, что 22 )( ueSM

После того как вычислена ковариационная матрица, легко найти стандартные ошибки оценок структурных параметров. В ковариационной матрице элементы, лежащие на главной диагонали, представляют собой дисперсии кjbVar j ,...1,0),( оценок структурных параметров. Тогда

)()(. jj bVarbоС ),.....1,0( кi

являются стандартными ошибками оценок ),....1,0(, кjb j 6.3. Оценка значимости модели множественной регрессии и её параметров. F и t -тесты. Параметры множественной регрессии рассчитываются на основании выборочных данных. Следовательно, любые числовые значения параметров уравнения регрессии, которые были получены, являются выборочными оценками истинных значений неизвестных параметров. Найденные оценки кbbb ,...., 10 не совпадают со значениями параметров

к ,...., 10 в генеральной совокупности. Для проверки значимости построенной модели и её параметров используют различные критерии. Если проверяется, значимости уравнения множественной регрессии то используют F - критерий. Для оценки значимости параметров уравнения множественной регрессии используют критерий Стьюдента ( tкритерий) Как и в случае парной регрессионной модели (гл.IV (4.12)) в модели множественной

регрессии общая вариация 2

1)( yyTSS

n

ii

может быть разложена на две составляющие

)1()()1(

КnкnRSSESSTSS

где 2

1)ˆ( yyESS

n

ii

- сумма квадратов отклонений обусловленной регрессией

2

1)ˆ( i

n

ii yyRSS

-остаточная сумма квадратов, характеризующая влияние неучтенных

факторов. В скобках указано число степеней свободы, соответствующее каждому члену уравнения.

F статистика для проверки общего качества регрессии записывается как отношение объясненной суммы квадратов в расчете на одну независимую переменную, деленное на остаточную сумму квадратов в расчете на одну степень свободы:

)1/(/

кnRSSкESSF (6.20)

где n - число наблюдений;

Page 94: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

к - число параметров при переменных кixi ,1, Под незначимостью модели понимается одновременное равенство нулю всех коэффициентов при факторах:

0......21 кbbb (6.21) После деления числителя и знаменателя (6.20) на TSS F статистика примет вид

ккn

RRF 1

1 2

2

(6.21)

где

TSSRSSR

TSSESSR/1

/2

2

Отметим, что если модель незначима, то незначимы и показатели корреляции, рассчитанные по ней. Действительно, если 0....21 кbbb , то .0ˆ byy

Поэтому 0)()ˆ(2

yyyy

TSSESSR

Отсюда следует, что проверка гипотезы 0.....: 210 кН об одновременном равенстве нулю всех коэффициентов линейной регрессии, за исключением свободного члена, равносильно проверке гипотезы .0: 2

0 RН Величина F имеет распределение Фишера с 1, 21 кnк степенями свободы. По заданному уровню значимости находят ),;( 21 FFкр . Если фактическое (расчетное) значение F критерия превышает, ,крF то уравнение статистически значимо.

Пример 6.2. По десяти наблюдениям над переменными 21,, xxy построена регрессия

21 367,0854,054,3ˆ xxy и рассчитан множественный коэффициент детерминации .811,02 R Проверить значимость уравнения регрессии на уровне .05,0

Решение. В нашем случае .2;10 кn Вычислим

019,152

310811,01

811,011 2

2

ккn

RRF

Находим по таблице Фишера 74,4)7,2;05,0( FFкр Так как крFF 74,4019,15 то уравнение регрессии значимо, следовательно, переменные достаточно хорошо описывает регрессионную модель. Для оценки значимости параметров уравнения множественной регрессии используют tкритерий Стьюдента. Процедура оценки такая же, как и в парной регрессии. Значимость параметра можно оценить двумя способами: с помощью сравнения фактического и табличного значения t критерия и с помощью доверительных интервалов. Фактическое значение t критерия для параметра кjb j ,1, рассчитывается следующим образом

)(. j

jb boc

bt

j ; кj ,....,1 (6.22)

где с.о. )( jb стандартные ошибки параметров ,jb их находят из дисперсионной матрицы

).(2 bD Для проверки значимость параметров jb формируются основные и альтернативные гипотезы:

Page 95: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

0:

0:

1

0

j

j

HH

.,....,1 кj

Далее расчетная величина jbt

сравнивается с табличным значением, ,крt которое

находят для заданного уровня значимости и )1( кn степеней свободы из таблицы t распределения Стьюдента.

Параметр jb считается значимым, если фактическое значение t критерия по модулю больше его табличного значения. Это значить отвергается нулевая гипотеза, принимается альтернативная гипотеза. Пример 6.3. На основе восемь наблюдений построена регрессия

)18,0(2

)30,0(1

)22,0(2,14,04,2ˆ xxy

В скобках указаны стандартные ошибки. Проверить значимость коэффициентов 1b и 2b построенной регрессии при 05,0 Рассчитаем фактические значения t критерия для коэффициентов 1b и 2b

;33,130,04,0

)(. 1

11

boc

btb 67,618,02,1

).(. 2

22

boc

btb

Найдем табличное значение .крt Так как число наблюдений ,8n число независимых переменных ,2к то число степеней свободы .51281 кn Теперь по таблице t распределения Стьюдента находим 571,2)5;05,0( ttкр . Так как

,571,233,11 крb tt то параметров 1 статистически несуществен, а объясняющая

переменная 1x не воздействует существенным образом на объясняемую переменную. Теперь проверим значимость параметра .2 Поскольку крb tt 571,267,6

2 то параметр

2 статистически существен, а объясняющая переменная 2x существенным образом воздействует на объясняемую переменную .y Этот же результат можно получить с помощью построения доверительных интервалов для коэффициентов регрессии .jb Для линейной функции доверительный интервал находят по формуле

).).(.;).(.( крjjкрjj tbocbtbocb Параметр jb значим, если в доверительный интервал не попадает нуль. В нашем примере

доверительный интервал для коэффициента 1b является 17,1;37,0 в которой попадает нуль. Для второго коэффициента 2b доверительным интервалом является (0,74;1;66) в которой нуль не попадает. Таким образом, с помощью доверительных интервалов получили те же самые заключения о значимости параметров 1b и .2b 6.4. Мультиколлинеарность При построении множественной линейной регрессии мы сделали существенные предположения о том, что факторы, включаемые в модель, должны быть сильно связаны с зависимой переменной и не должны быть связаны между собой. Если в модель включаются два или более тесно взаимосвязанных фактора, то это приводит к неточной оценке коэффициентов регрессии и затрудняет их экономическую интерпретацию. Такое явление, называемое мультиколлинеарностью - означает тесную зависимость между факторными переменными, включенными в модель. Перечислим некоторые наиболее характерные признаки мультиколлинеарности.

Page 96: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

1. Небольшое изменения исходных данных (например, добавление новых наблюдений) приводит к существенному изменению оценок коэффициентов модели.

2. Оценки имеют большие стандартные ошибки, малую значимость, в то время как модель в целом является значимой.

3. Оценки коэффициентов имеют неправильные с точки зрения теории знаки или неоправданно большие значения и тем самым приводит к изменению смысла экономической интерпретации коэффициентов регрессии. Последствия мультиколинеарности можно видеть в оценке коэффициентов множественной линейной регрессии. Мы знаем, что коэффициенты модели определяется по формуле (6.9)

.)( 1 YXXXb TT Если какие либо два фактора линейно зависимы, то матрица XX T необратим т.к. она имеет линейно зависимые столбцы. Если зависимость между факторами такая, что

)det( XX T близко к нулю, то оценки коэффициентов будут неимоверно большими, что их нельзя осмыслит экономически. Причины возникновения мультиколлинеарности между признаками: -изучаемые факторные признаки характеризуют одну и ту же сторону явления или процесса (например, показатели объема произведенной продукции и среднегодовой стоимости основных фондов одновременно включать в модель не рекомендуется, так как оба характеризуют размер предприятия); -использование в качестве факторных признаков, суммарное значение которых представляет собой постоянную величину (например, коэффициент годности и коэффициент износа основных фондов; -факторные признаки, являющиеся элементами друг друга (например, затраты на производства продукции и себестоимость единицы продукции); -факторные признаки, по экономическому смыслу дублирующие друг друга (например, прибыль и рентабельность продукции). Мультиколлинеарность можно обнаружить: 1) анализируя матрицы коэффициентов парной корреляции. Факторы ix и jx могут быть признаны коллинеарными, если

;8,0, ji xxr

2) если определитель матрицы XX T близок к нулю, то это свидетельствует о наличии мультиколлинеарности. Избежать мультиколлинеарность практически маловероятно. Причиной мульти-коллинеарности является свойство экономической системы, в которой все переменные должны быть взаимосвязаны между собой. Иначе экономическая система не будет существовать. Поэтому мультиколлинеарность была, есть и будет, бороться с ней надо по море возможности. Существуют некоторые методы устранения или уменьшения мультиколлинеарности.

1. Сравнение значений линейных коэффициентов корреляции. При отборе факторов предпочтение отдается тому фактору, который более тесно, чем другие факторы, связан с результативным признаком, причем желательно, чтобы связь данного факторного признака с y была выше, чем его связь с другим факторным признаком, т.е.

jijjii xxyxxxyx rrrr , и .8,0jixxr

2. Метод включения факторов. Метод заключается в том, что в модель включаются факторы по одному в определенной последовательности. На первом шаге в модель вводится тот фактор, который имеет наибольший коэффициент корреляции с зависимой переменной. На втором и последующих шагах в модель включается фактор, который имеет наибольший коэффициент корреляции с остатками модели. После включения каждого фактора в модель рассчитывают её характеристики, и модель проверяют на достоверность.

3. Метод исключения факторов. Метод состоит в том, что в модель включаются все факторы. Затем после построения уравнения регрессии из модели исключают фактор,

Page 97: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

коэффициент при котором незначим и имеет наименьшее значения t критерия. После этого получают новое уравнение регрессии и снова проводят оценку значимости всех оставшихся коэффициентов регрессии. Процесс исключения факторов продолжается до тех пор, пока все коэффициенты регрессии не будут значимы.

6.5. Спецификация и классификация переменных. Замещающие, фиктивные и лаговые переменные. Мы знаем, что эконометрическая модель представляется математической функцией от набора переменных. Если точно известно, какие объясняющие переменные должны быть включены в уравнение при проведении регрессионного анализа, то наша задача ограничивается, оцениванием их коэффициентов, определением доверительных интервалов для этих оценок и т.д. Однако на практике регрессионное уравнение точно специфицировать невозможна. Мы можем включить в уравнение ненужные переменные, и в то же время мы можем не включить другие переменные, которые должны там присутствовать. Свойства оценок коэффициентов регрессии в значительной мере зависят от правильности спецификации модели

1. Если опущена переменная, которая должна быть включена в уравнение, то оценки коэффициентов регрессии, вообще говоря, оказываются смещенными. В связи с этим стандартные ошибки и связанные с ними t тесты становятся некорректными.

2. Если в уравнение включена переменная, которая не должна в нем присутствовать, то оценки коэффициентов регрессии будут несмещенными, однако, вообще говоря – неэффективными. Рассмотрим влияние отсутствия переменной, которая должна быть включена в уравнение. Предположим, что переменная y зависит от двух переменных 21, xx

uxxy 22110 (6.23) Убрав переменную, ,2x рассмотрим модель

110 xy (6.24) И оценим регрессию

110ˆ xbby (6.25) Где коэффициент 1b вычисляется по известной формуле

)(),(

1

11 xVar

yxCovb (6.26)

Применяя метод наименьших квадратов можно получить оценки коэффициентов 1 и

2 для уравнения (6.23). Например, оценка коэффициента 1 имеет вид

22121

212211 ),()()(

),(),()(),(xxCovxVarxVar

xxCovyxCovxVaryxCovb

(6.27)

Мы знаем, что оценка (6.26) является несмещенной оценкой если мы изучим уравнение регрессии без 2x т.е. .)( 11 bM Если выполняется соотношение (6.23), то

)(),(

)(),(

)(),()(

1

2121

1

221101

1

11 xVar

xxCovxVar

uxxxCovMxVar

yxCovMbM

Отсюда видно, что 1b смещена на величину )(/),( 1212 xVarxxCov Направление смещения будет зависеть от знака величин ).,( 212 xxCovu

Page 98: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

Коэффициент 2R для данной регрессии отражает общую объясняющую способность переменной 1x в обеих ролях и является завышенной оценкой. Рассмотрим теперь влияние наличия переменной, которая не должна быть включена в модель. Допустим, что истинная модель имеет вид

uxy 110 (6.28) Однако считается, что моделью является

uxxy 22110 (6.29) И оценивается регрессия

22110ˆ xbxbby (6.30) Где 1b оценивается по формуле (6.26) а не по формуле (6.27) Оценки коэффициентов регрессии и их дисперсии в этом случае являются несмещенными, но неэффективными. Практически обнаруживается, что 2 равна нулю, и переменная 2x исключается из модели. Фиктивные переменные. Некоторые факторы, которые мы хотели бы включить в регрессионную модель являются качественными не имеющие числовые значения. Приведем несколько примеров.

1. Исследуется зависимость между продолжительностью полученного образования и заработком и в выборке представлены лица как мужского, так и женского пола. Нужно выяснить, имеет ли пол респондента различие в результатах.

2. Исследуется зависимость между доходом и потреблением в многонациональном государстве и выборка составлена по данным семьи говорящие на разных языках. Нужно выяснить, имеет ли существенное значение этническое различие.

3. На величину надоя с одной фуражной коровы влияет ли качество кормов (плохое, среднее, хорошее) Включения качественной переменной в уравнении регрессии осуществляется, сопоставив качественным значения определенные числа. Э то можно сделать с помощью, так называемых фиктивных переменных. Фиктивные переменные - это переменные бинарного типа, т.е. каждая переменная, может принимать всего два значения - единица и нуль:

.,0

;,1тотсутствуепризнакесли

наблюденииветприсутствупризнакданныйеслиz

Если включаемый в рассмотрение качественный признак несколько, то используют несколько фиктивных переменного, число которых должно быть на единицу меньше числа значений признака. Пусть, например, y объем потребления некоторого продукта зависит от времени года. Для выявления сезонности можно ввести три бинарные переменные .,, 321 zzz

..,0

.,11 случаяхостальныхв

зимнимявляетсямесяцеслиz

..,0

.,12 случаяхостальныхв

весеннимявляетсямесяцеслиz

..,0

.,13 случаяхостальныхв

летнимявляетсямесяцеслиz

Отметим, что мы не вводим четвертую бинарную переменную, ,4z относящуюся к осени, иначе тогда для любого месяца выполнялось бы тождество ,14321 zzzz что означало бы линейную зависимость факторов, и мы не можем оценить коэффициенты

Page 99: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

регрессии. При включении нескольких бинарных переменных следить, чтобы они были линейно независимыми. Пример 6.4. Имеются данные о весе новорожденного y в граммах и количестве сигарет

,x выкуриваемых в день будущей матери во время беременности в случаях первых и не первых родов.

№ п\п Первенец y(гр) x Фиктивная переменная, z

1 нет 3450 8 1 2 нет 3300 21 1 3 нет 3400 18 1 4 нет 3300 24 1 5 нет 3450 6 1 6 нет 3450 16 1 7 нет 3100 19 1 8 нет 3500 7 1 9 нет 3400 20 1 10 нет 3500 10 1 11 нет 3200 31 1 12 нет 3400 13 1 13 да 3450 5 0 14 да 3400 10 0 15 да 3200 19 0 16 да 3350 12 0 17 да 3000 20 0 18 да 3300 8 0 19 да 3300 16 0 20 да 3400 9 0

Регрессия между y и x имеет вид

394,0,11,123519ˆ 2

)5,3()8,56( Rxy

(в скобках указаны стандартные ошибки) Это означает, что ребенок, рожденный некурящей матерью, будет иметь при рождении средний вес около 3500г, а уменьшение веса новорожденного по причине курения его матери составляет около 12г на каждую сигару, выкуриваемую в день. Для учета качественного фактора (первый или не первый ребенок) введем в модель фиктивную переменную:

первенецнепервенец

z01

Оценив регрессию между y и zx, получим

6,0,12456,143480ˆ 2

)1,42()0,3()2,49( Rzxy (6.31)

(в скобках указаны стандартные ошибки)

Page 100: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

Коэффициент 124 при фиктивной переменной z статистически значим. Перепишем уравнения в виде двух уравнений с учетом 1z и 0z

.56,143480ˆ;56,143604ˆ

ïåðâåíöàäëÿxyíåïåðâåíöàäëÿxy

Параметр сдвига (эффект от фактора «первенец- не первенец») составляет 3604-3480=124г. Как видим, добавление в регрессию фиктивной переменной существенно улучшило качество оценки. Замещающие переменные. Во многих случаях важные переменные описывающие экономические явления остаются не включенными в эконометрическое уравнение. Причиной этому является сомнительность их значений, что в принципе даже эти переменные невозможно измерить. Пренебрегать такими переменными в модели нельзя. Вместо отсутствующей переменной вводят некоторый её заменитель. Например, в качестве показателя образования можно использовать расходы на одного студента а для показателя технического процесса в качестве замещающей переменной может использоваться время. Итак, в уравнении регрессии мы включим ту переменную, которая имеет точно измеренные значения и замещает опущенную переменную. Предположим, что истинной моделью является

uxxxy kk .....22110 (6.32) и допустим, что не имеется данных по существенной переменной .1х Из за отсутствия этой переменной регрессия будет иметь смешенную оценку и статистическая проверка будет некорректной. Замещающая переменная, включенная в регрессионное уравнение дает вполне приемлемую информацию о той переменной, которая была опущена. Вместо отсутствующей переменной 1х вводим замещающую переменную z тесно связанную с

.1x Это значить имеется строгая линейная зависимость между величинами 1x и z: zx 1 (6.33)

где и неизвестные постоянные После подстановки выражения для 1х из уравнения (6.33) в (6.32),получим

uxxzuxxzy kkkk ........)( 221102210 (6.34) И так модель формально верно специфицирована с учетом замещающей переменной и можно оценить её параметры методом наименьших квадратов. Результаты оценки будут следующими:

1) Коэффициенты ,,....,2 kxx их стандартные ошибки и t статистики, коэффициент 2R будут теми же, как и с использованием 1x .

2) Коэффициент при z будет оценкой величины, 1 и мы не можем получить оценку ,1 если мы не имеем оценку для .

3) Мы можем установить значимость 1x даже в случае невозможности оценить её коэффициент.

4) Невозможно получить оценку, ,0 поскольку постоянный член теперь равен )( 10 которая не имеет оценку.

6.6. Метод инструментальных переменных.

Page 101: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

При наличии корреляции между независимыми переменными и случайным членом МНК-оценки могут быть смещенными и несостоятельными. Один из путей преодоления этой трудности – использование других независимых переменных, которые носят название инструментальные переменные. Для получения состоятельных оценок надо чтобы эти переменные обладали двумя свойствами:

1) Новые независимые переменные должны быть «хорошо коррелированны» с исходными независимыми переменными;

2) Новые переменные не должны быть коррелированны с ошибками. Пусть исходная модель в векторно-матричной форме имеет вид

uXY (6.35) где, как и раньше Y - n-мерный вектор зависимых переменных, )1( кnX матрица независимых переменных, )1(к мерный вектор, nu мерный вектор ошибок. Предположим, что задана матрица Z размера )1(кnx матрица инструментальных переменных, причем )1()1( кк матрица XZ T обратима. Оценкой параметра с помощью инструментальных переменных является вектор

YZXZ TTuí

1)( (6.36) Подставляя в (6.36) выражение для Y из (6.35) получаем

uZn

XZn

uZXZuXZXZ TTTTTTuн

1)1()()()( 111 (6.37)

Предположим , что выполнено следующее условие, формально выражающее требование «хорошей корреляции» между X и :Z

Последовательность матриц XZn

T1 сходится по вероятности при n к некоторой

невырожденной матрице.

По требование Z и u некоррелированы, то uZn

T1 стремится по вероятности к 0. Таким

образом, из условия сходимости матрицы XZn

T1 к невырожденной матрице и из (6.37)

следует, что оценка uн является состоятельной, но вообще говоря, не является эффективной. Из представления (6.37) видно что оценка ин равна истинному значению

плюс ошибке равная

uZ

nXZ

nTT 1)1 1 . Если выборка большая то 01

uZn

T и ин

стремится к истинному значению . Инструментальные переменные используются при наличии ошибок в измерениях. 6.7. Гетероскедастичность и её последствия. Один из предпосылок Гаусса-Маркова для оценки параметров множественной линейной регрессии является постоянство дисперсий остатков. Это значить, что для каждого значения фактора ix остатки ju имеют одинаковую дисперсию. Часто это условие не сохраняется. Если имеют место непостоянство дисперсий, то говорят что регрессионный модель с гетероскедастичностью. Гетероскедастичность – неоднородность дисперсий остатков или «неодинаковый разброс». Если имеет место постоянство дисперсий остатков, то имеет место гомоскедастичность- однородность дисперсий остатков или одинаковый разброс. На следующих рисунках показаны примеры гомоскедастичных и гетероскедастичных остатков.

Page 102: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

Рис.6.7.1. Гомоскедостичность остатков Рис. 6.7.2. Гетероскедостичность остатков Рис.6.7.1. показывает, что разброс остатков около линии регрессии примерно одинаковый. Дисперсии остатков для каждого фиксированного значения x являются примерно одинаковыми. На рисунке 6.7.2 видно, что разброс остатков неодинаков. Мы знаем, что случайный член распределен нормально и график его распределения представляет шапочку, гомоскедастичности и гетероскедастичности более выразительно можно иллюстрировать следующими рисунками. Чтобы рисунок был достаточно простым, в выборку включены всего пять наблюдений.

Рис. 6.7.3. Гомоскедостичность

Распределение случайного члена представлено нормальным распределением с центром в точках пересечения значений переменной с линией регрессии .10 xy Фактические значения случайного члена отмечены черными кружочками.

Рис. 6.7.4. Гетероскедостичность

Из рисунка (6.7.4) видно, что по мере увеличения x разброс так же увеличивается. Если имеет место гетероскедастичности, то МНК – оценки неэффективны и стандартные

Page 103: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

ошибки коэффициентов регрессии будут неверны. Вследствие смещенность оценок стандартных ошибок F критерий и t критерии неприменимы. Вполне вероятно, что стандартные ошибки будут занижены, а, следовательно, t – статистика–завышена, и будет получено неправильное представление о точности коэффициентов регрессии. При наличии гетероскедастичности используют обобщенный (взвешенный) методом наименьших квадратов. Обобщенная линейная модель множественной регрессии

uXY (6.38) в которой переменные и параметры удовлетворяют следующим условиям:

1. u случайный вектор; X неслучайная (детерминированная) матрица 2. )(0)( nnuM n нулевая матрица;

3. )( TuuM ковариационная матрица вектора случайных членов, которая имеет вид

)().......()(.....................................

)().......()()()........()(

)(

221

22212

12121

nnn

n

n

T

uMuuMuuM

uuMuMuuMuuMuuMuM

uuM

где все элементы, лежащие на главной диагонали есть дисперсии :2

i .)()0()( 2222

iiii uDuMuM Матрица является положительно определенной т.с. она симметрическая и

удовлетворяет неравенству 0xxT для любого ненулевого вектора .x 4. ,1 nкХРанг где к число объясняющих переменных; n число

наблюдений. Теорема Айткена. В классе линейных несмещенных оценок вектора для обобщенной регрессионной модели оценка

YXXXb TT 111 )( (6.39) имеет наименьшую матрицу ковариаций. Доказательство. В силу того, что матрица положительно определена и симметрична, то существует 1 также положительно определенная и симметричная. Из матричной алгебры известно, что всякая невырожденная квадратная симметричная матрица представимо в виде

TРР (6.40) где Р некоторая невырожденная квадратная матрица.

Исходя из свойств обратных и транспонированных матриц, имеем 1111 )()( РРРР TT (6.41)

Умножим обе части равенства (6.40) слева на матрицу ,1Р а справа на матрицу .)()( 11 TT PР Имеем

nTTTTT EPPPPPPPPPP 111111 )()())(()( - единичная матрица

Умножив обе части обобщенной регрессионной модели (6.38) на матрицу 1Р слева, получим

uPXPYР 111 (6.42) Ввода обозначения uPuXPXYPY 111 ,, получим регрессионной модель вида

uXY (6.43)

Page 104: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

Модель (6.43) удовлетворяет всем требованиям классической линейной модели множественной регрессии; 0)( uM и n

T EuuM )( В самом деле:

,0)()()( 11 uMPuPMuM ибо 0)( uM n

TTTTTTT EPPPuuMPPuuPMuPuPMuuM )())(()())(()( 11111111

nкXr 1)( (так как матрица P - невырожденная) Оценка, b найденная по обобщенному методу наименьших квадратов является несмещенной. Чтобы убедится в этом, представим b найденная по формуле (6.39) в следующем виде:

uXXXuXXXXXXXuXXXXb

TT

TTTTTT

111

111111111

)()()()()()(

Вычисляя математическое ожидание от обеих частей последнего равенства и учитывая что 0)( uM имеем )(bM

6.8. Обнаружение гетероскедастичности. Тест ранговой корреляции Спирмена,тест Голдфелда-Квандта, тест Глейзера.

В некоторых случаях по разбросу остатков визуально можно обнаружит гетероскедастичность. Чтобы определить, имеет ли место гетероскедастичность используются тесты: тест ранговой корреляции Спирмена, тест Голдфелда - Квандта и тест Глейзера. Все эти тесты используют в качестве нулевой гипотезы 0Н гипотезу об отсутствии гетероскедастичности. Тест ранговой корреляции Спирмена использует наиболее общие предположения о зависимости дисперсий ошибок регрессии от значений независимых переменных, т.е. абсолютные величины остатков и значения x коррелированны. Данные по x и абсолютные величины остатков упорядочиваются, и коэффициент ранговой корреляции определяется как

)1(

61 2

1

2

,

nn

Dr

n

ii

ex (6.44)

где iD разность между рангами значений ix и .ie Если предположить, что соответствующий коэффициент корреляции для генеральной совокупности равен нулю, то коэффициент ранговой корреляции имеет нормальное распределение с математическим ожиданием 0 и дисперсией 1/ )1( n в больших выборках. Для проверки значимости exr , t статистика рассчитывается по формуле

2,

,

1

2

ex

ex

r

nrt

при .10n Если ),2;( nttt кр где крt табличное значение t критерия Стьюдента, определенное на уровне значимости при числе степеней свободы )2( n то коэффициент ранговой корреляции значим. Пример 6.5. Оценим регрессионную зависимостьвыпуска продукции обрабатывающий промышленности на душу населения у от валового внутреннего продукта на душу населения х в том же году для 17 стран. Исходные данные приведены в следующей таблице

Номер 1 2 3 4 5 6 7 8 9 10 1 12 13 14 15 16 17

Page 105: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

стран 1 х(усл.ед

) 3 6 7 9 13

15 18 2

1 22 24 25 26 27 28 35 37 44

у(усл.ед) 18 2

7 18 45

55

68 51 8

4 85 100 63 130 13

5 60 70 80 180

По исходным данным с помощью МНК построена следующая регрессионная зависимость:

.608,0,92,284,12ˆ 2

6,0)5,14( Rxy

(в скобках указаны стандартные ошибки) Разброс остатков iii yye ˆ представлен на следующем рисунке.

Рис 6.7.5.

Из рисунка видно, что с увеличением переменной х размах колебаний остатков ie тоже возрастает, поэтому есть предложение о зависимости ошибки регрессии от независимой переменной (гетероскедастичность). Для установления гетероскедастичности применим тест Спирмена. Выдвигается нулевая гипотеза об отсутствии гетероскедастичности. Ранжируем остатки iе и данные по х и вычислим, .iii exD Имеем следующую таблицу. Таблица 6.8.1 х Ранг

iе Ранг

iii exD 2iD

3 1 3,6 2 -1 1 6 2 3,3 1 1 1 7 3 15,2 9 -6 36 9 4 5,9 4 0 0 13 5 4,2 3 2 4 15 6 11,4 7 -1 1 18 7 14,4 8 -1 1 21 8 9,8 6 2 4 22 9 7,9 5 4 16 24 10 17,1 10 0 0 25 11 22,8 11 0 0 26 12 41,2 15 -3 9 27 13 43,3 16 -3 9

Page 106: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

28 14 34,5 12 2 4 35 15 45,0 17 -2 4 37 16 40,8 14 2 4 44 17 38,7 13 4 16 На основе этих данных вычислим коэффициент ранговой корреляции:

866,028817

11061)1(

61 2

2

nn

Dr i

Тестовая статистика составляет .5,316866,01 nr Это больше, чем крt и, следовательно, нулевая гипотеза об отсутствии гетероскедастичности отклоняется.

Тест Голдфелда-Квандта. При проведении проверки по этому критерию предполагает:

а) что стандартное отклонение случайного члена iu в i ом наблюдении

пропорциональны значениям объясняющей переменной ;ix б) случайный член нормально распределен. Все n наблюдений ;ix в выборке упорядочиваются по величине и выберем m

первых и m последних наблюдений; средние )2( mn наблюдений отбрасываются. Если имеет место гетероскедастичность, то дисперсия u в последних m наблюдениях будет больше, чем в первых ,m и это будет отражено в сумме квадратов остатков в первых и последних регрессиях Составляем F статистику.

;1

2

RSSRSSF

Где 21,RSSRSS суммы квадратов остатков для первых и последних m

наблюдений соответственно. Если верна гипотеза 0H об отсутствии гетероскедастичности, то F имеет распределение Фишера с ,11 kmv ,12 kmv степенями свободы,где k число независимых переменных. Мощность критерия зависит от выбора m по отношению к .n Установлено что m должно составлять порядка 8

3 от

,n в частности около 11, если .30n По таблице определяется критическое значение критерия .крF Если ,крFF то

нулевая гипотеза об отсутствии гетероскедастичности отклоняется. Тест Глейзера основывается на более общих представлениях о зависимости

стандартной ошибки случайного члена от значений независимой переменной. Например, зависимость может быть представлена в виде

iiu uxi

(6.45) Чтобы использовать данный метод, оценивают регрессионную зависимость y от

x с помощью МНК, а затем оценить регрессию абсолютных величин остатков ,e оценив их регрессию вида (6.45) для данного значения . Изменяя значение , оцениваем несколько таких уравнений регрессии. В каждом случае нулевая гипотеза о гомоскедастичности будет отклонена, если оценка значимо отличается от нуля. Если при оценивании более чем одной функции получается значимая оценка , то ориентиром при определении характера гетероскедастичности может служить наилучшая из них.

Page 107: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

6.9. Нелинейная множественная регрессия. Производственная функция Кобба-Дугласа.

До сих пор мы изучали линейные регрессионные модели в которых переменные

имели первую степень а параметры выступали в виде коэффициентов при этих переменных. Многие экономические явления и процессы большей частью описываются нелинейными соотношениями. Например, зависимость между объемом произведенной продукции и основными факторами производства - трудом и капиталом (производственная функция Кобба-Дугласа) зависимость спроса на товары или услуги от цены и средне душевого дохода семьи (функция спроса) являются нелинейными. Вид нелинейной зависимости результативного показателя y от объясняющих (независимых) переменных устанавливается на основе изучаемого экономического явления.

Как и в случае линейной регрессионной зависимости, основной задачей в нелинейной зависимость является оценка её параметров. Для оценки параметров нелинейных моделей используют два подхода: Первый подход основан на линеаризации модели и заключается в том, что с помощью подходящих преобразований исходных переменных исследуемую нелинейную зависимость представляют в виде линейного соотношения между преобразованными переменными. Второй подход обычно применяется, когда подобрать соответствующее преобразование не удается. В этом случае применяют методы нелинейной оптимизации на основе исходных данных.

Для линеаризации модели в рамках первого подхода могут использоваться модели нелинейные по переменным и нелинейные по параметром. Если модель нелинейно по переменным, то введением новых переменных её можно свести к линейной модели, для оценки параметров которой используется обычный метод наименьших квадратов. Например, если имеется нелинейная модель

uxxx

y 32

2101

то вводя новые переменные, ,;,1

32

21 xzxzx

z получим линейную модель

uzzzy 3322110 параметры, которой оцениваются методом наименьших квадратов по формуле

YZZZb TT 1)( где Z-матрица размерности 4n новых объясняющих переменных .,, 321 zzz Недостатком линеаризации с помощью замены переменной является то, что вектор оценок b получается не из условии минимизации суммы квадратов отклонений для исходных переменных, а из условия минимизации суммы квадратов отклонений для преобразованных переменных, что не одно и то же. К линейной модели также приводится полиномиальная модель k-го порядка

.....2210 uxxxy k

k Этот модель сводится к линейному с помощью замены переменных :к

к xz

uzy j

к

jj

10

Нелинейные как относительно включенных в анализ объясняющих переменных, так и по оцениваем параметром являются следующие модели:

- степенная: uxxxy кк ....21

210 (6.46)

Page 108: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

-экспоненциальная: uey êê xx .....110

(6.47) Эти модели могут быть приведены к линейным логарифмированием обеих частей. Например, модель (6.46) после логарифмирование обеих частей примет вид

uxxxLny кк lnln....lnlnln 22110 Далее, вводя обозначения

nuukinxznnyy ii ~,,...1,~,~00

получим линейную модель .~....~~

110 uzzy кк Следует подчеркнуть, что критерии значимости и интервальные оценки параметров, применяемые для нормальной линейной регрессии, требуют, чтобы нормальным законом распределения овладел ,nu т.е.

),0( 2nENnu

Метод наименьших квадратов можно применять к нелинейному регрессионному модели параболического типа не сводя её к линейному виду. Рассмотрим

uxxy 2210 (6.48)

Пусть оценкой этой зависимости, является 2

210ˆ xbxbby (6.49) Для нахождение неизвестных параметров 210 ,, bbb необходимо минимизировать функционал .S

.min)(1)ˆ(),,( 22210

111

2210

ii

n

iii

n

ii

n

ii xbxbbyiyyebbbS

Необходимым условием, чтобы функционал S имел минимум является обращения в нуль частных производных по каждой из 210 ,, bbb

n

iiiii

n

iiiii

n

iiii

xxbxbbybS

xxbxbbybS

xbxbbybS

1

22210

2

1

2210

1

1

2210

0

0)(2

0)(2

0)(2

(6.50)

После элементарных преобразований систему (6.50) запишем в виде

(6.51)

Решая систему (6.51), например метода Крамера,

находим оценку параметров .,, 210 При изучении закономерностей функционирования экономических систем (производства, отрасли и т. д) находит широкое применение степенная производственная функция вида.

LAКY 1,0

n

iii

n

ii

n

ii

n

ii

n

iii

n

ii

n

ii

n

ii

n

ii

n

ii

n

ii

yxxbxbxb

yxxbxbxb

yxbxbnb

1

2

1

42

1

21

1

20

11

32

1

21

10

11

22

110

3

Page 109: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

называемая функцией Кобба-Дугласа. Это функция задает зависимость объема производства Y от двух важнейших производственных факторов- труда (рабочей силы) L и основных производственных фондов .К Показатели и называются коэффициентами эластичности объема производства Y соответственно по затратам капитала К и труда .L Эти показатели рассчитываются по следующим формулам.

YL

LYи

КY

Эти показатели выражают, что при увеличении одних только затрат капитала (труда) на 1% объем производства увеличится на %).%( Учитывая влияние случайных возмущений, присущих каждому экономическому явлению, функцию Кобба-Дугласа можно представить в виде

uLAКY (6.52) Модель (6.VII) линеаризуется путем логарифмированием обеих частей

nuLnКnAnY Сумма коэффициентов эластичности является важным экономическим показателем, который носит название отдача от масштаба. При 1 имеет место возрастающая отдача от масштаба (увеличение объема выпуска больше увеличения затрат ресурсов). При 1 убывающая отдача от масштаба (увеличение объема выпуска меньше увеличения затрат ресурсов). При 1 говорят о постоянной отдаче от масштаба (во сколько раз увеличиваются затраты ресурсов, во столько же раз увеличивается выпуск). В случае 1 ,функция Кобба-Дугласа записывается в виде

uLAКY 1 (6.53)

Поделив обе части (6.9.8) на L получим зависимость производительность труда LYy от

его капиталовооруженность .LКk

uAky Последняя модель является парной нелинейной зависимостью, параметры которой A и оценивается с помощью метода наименьших квадратов после линеаризации.

Глоссарий

Автокорреляция - явления взаимно связи между рядами: первоначальным и этим же

рядом, сдвинутым относительно первоначального положения на моментов времени.

Авторегрессия-регрессия, учитывающая влияние предыдущих уровней ряда на

последующее.

Аддитивная модель временного ряда- модель, в которой все компоненты ряда

динамики представлены как сумма этих составляющих

tttt uy

Верификация модели- проверка истинности модели, определение соответствия

построенной модели реальному экономическому явлению.

Page 110: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

Гетероскедастичность-неоднородность относительно дисперсии остатков т.е.

дисперсия остатков не является постоянной.

Идентификация модели-проведение статистического анализа модели и оценивания

качество ее параметров, установление соответствия между приведенной и структурной

формами модели.

Ковариация-сопряженность вариации двух признаков и представляет собой

статистическую меру взаимодействия двух случайных переменных.

Корреляционная зависимость это связь, при которой каждому значению независимой

переменной х соответствует определенное математическое ожидание (среднее

значение) зависимой переменной у.

Множественная корреляция-это зависимость между результативным признаком и

двумя и более факторными признаками, включенными в исследование.

Множественная регрессия- характеризует связь между результативным признаком и

двумя и более факторными признаками.

Мультиколлинеарность-это тесная зависимость между факторными признаками,

включенными в модель.

Мультипликативная модель временного ряда-модель, в которой факторы влияния

представлены в виде произведения составляющих tttt uу

Такую модель применяют в случае, если происходят существенные сезонные изменения.

Параметризация-определения вида экономической модели, выражение в

математической форме взаимосвязи между ее переменными, формулирование исходных

предпосылок и ограничений модели.

Парная корреляция-это связь между двумя признаками (результативным и факторным

или двумя факторными)

Парная регрессия - характеризует связь между двумя признаками: результативным и

факторным.

Пространственные данные - набор сведений по разным объектам, взятым за один и тот

же период времени.

Page 111: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

Ряд динамики - это ряд последовательно(в хронологическом порядке)расположенных

статистических показателей, изменение которых имеет определенную тенденцию

развития изучаемого явления.

Статистическая зависимость- это связь, при которой каждому значению независимой

переменной х соответствует множество значений зависимой переменной у ,причем

неизвестно заранее, какое именно значение примет у .

Тренд-это основная достаточно устойчивая тенденция во временном ряду, более или

менее свободная от случайных колебаний.

Экзогенные (независимые)-это переменные, значения которых задаются извне модели.

Эндогенные (зависимые)-это переменные, значения которых определяются внутри

модели.

Тестовые задания по дисциплине «Эконометрика»

1. Если бросить две игральные кости, то сколько исходов возможны при эксперименте:

1. 6 2. 12 3. 36 4. 2 2. Найдите математическое ожидание дискретной случайной величины

X 4 10 20 P 1/4 1/2 1/4

1. 34 2. 11 3. 1 4. 1/34 3. Дискретной называется

1. случайная величина, принимающая свои значения в зависимости от исходов некоторого опыта

2. случайная величина, имеющая значение которой не может быть точно предсказано

3. случайная величина, все значения которой целиком заполняют некоторый конечный промежуток числовой оси

4. случайная величина, имеющая неопределенный набор возможных значений 4. Найдите дисперсию дискретной случайной величины

X 1 2 5 P 0,1 0,4 0,5

1. 14,2

Page 112: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

2. 10,8 3. 2,64

4. 3,4 5. Найдите математическое ожидание дискретной случайной величины

X 0 10 15 P 0,2 0,3 0,5

1. 10,5 2. 7,5 3. 3 4. 0

6. В чем заключается этап параметризации эконометрической модели? 1. расчет числовых значений параметров модели 2. определение состава переменных, входящих в модель 3. определение состава переменных, входящих в модель, и формы их

функциональной зависимости 4. проверка качества модели

7. Назовите основные числовые характеристики случайных величин?

1. все нижеперечисленные 2. математическое ожидание 3. среднеквадратическое отклонение 4. дисперсия

8. При стремлении размера выборки к бесконечности стандартное отклонение математического ожидания стремится:

1. к нулю 2. к бесконечности 3. к единице 4. нет правильного ответа

9. Анализируя стоимость недвижимости, студент определил, что коэффициент асимметрии для ряда стоимости 1 кв. метра составил 5,6. Какой из выводов, перечисленных ниже, будет справедливым в отношении такого ряда?

1. данный ряд характеризуется положительной асимметрией 2. данный ряд характеризуется отрицательной асимметрией 3. распределение ряда симметрично относительно среднего значения 4. мода, медиана и среднее значение данного ряда будут совпадать

10. Какую гипотезу вы примите, если при проверке статистической гипотезы расчетное значение критерия оказалось меньше критического?

1. нулевую 2. альтернативную 3. верную 4. ни одну из перечисленных

11. Исследуя ряды данных о возрасте работника и уровне заработной платы, студент вычислил коэффициент корреляции, который оказался равен -0,81. Какой вывод сделал студент?

Page 113: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

1. между возрастом работника и уровнем заработной платы существует тесная отрицательная связь

2. между возрастом работника и уровнем заработной платы существует тесная положительная связь

3. между возрастом работника и уровнем заработной платы не существует связи 4. чем старше работник, тем больше он получает

12. Что показывает коэффициент корреляции?

1. тесноту линейной связи между двумя показателями 2. тесноту связи между двумя показателями 3. тесноту нелинейной связи между двумя показателями 4. нет правильного ответа

13. Для проверки Ho: Rx,y=0, где Rx,y – коэффициент корреляции между рядами X и Y, исследователь рассчитал фактическое и критическое значение T-статистики, которые составили соответственно 5,1 и 2,1. Критическое значение было рассчитано при 5% уровне значимости. Какой вывод был сделан исследователем?

1. между рядами X и Y существует линейная связь с 95% вероятностью 2. связь между рядами X и Y отсутствует с 95% вероятностью 3. линейная связь между рядами X и Y отсутствует с 95% вероятностью 4. ни один из перечисленных выводов не является верным

14. В результате исследования зависимости уровня потребления от объемов производства, было построено следующее уравнение регрессии C=0,66+0,32*Y (где С и Y – соответственно объемы потребления и производства, выраженные в тыс. долларов). Что означает коэффициент 0,32 перед переменной Y?

1. при увеличении объема производства на 1 тыс. долларов потребление увеличится на 0,32 тыс. долларов

2. при увеличении объема производства на 1 тыс. долларов потребление снизится на 0,32 тыс. долларов

3. при увеличении объема производства на 1 тыс. долларов потребление снизится в 0,32 раза

4. при увеличении объема производства на 1 тыс. долларов потребление вырастет в 0,32 раза

15. В чем заключается сущность метода наименьших квадратов? 1. поиск значений параметров уравнения, минимизирующих сумму квадратов

отклонений модельных и исходных значений зависимой переменной 2. ни один из предложенных вариантов не раскрывает идею МНК 3. поиск значений параметров уравнения, при которых сумма квадратов отклонений

модельных и исходных значений зависимой переменной будет выше среднего значения

4. поиск значений параметров уравнения, максимизирующих сумму квадратов отклонений модельных и исходных значений зависимой переменной

16. Модель, заданная зависимостью у=12 + +u, относится к модели: 1. нелинейной по переменным 2. линейной по переменным 3. линейной по параметрам 4. нелинейной по параметрам

17. К потери какого свойства оценок коэффициентов уравнения регрессии приводит невыполнение 2 и 3 условий Гаусса-Маркова:

1. эффективность

Page 114: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

2. несмещенность 3. состоятельность 4. эффективность и состоятельность

18. Если все наблюдения лежат на линии регрессии, то коэффициент детерминации:

1. равен 1 2. равен 0 3. близок к 1 4. близок к 0

19. Какое число степеней свободы необходимо использовать при нахождении критического значения t – статистики в случае парной линейной регрессии, оцениваемой по выборке, состоящей из 17 наблюдений?

1. 15 2. 16 3. 17 4. 19

20. Какими величинами являются регрессоры в множественной регрессии?

1. случайными, стохастическими 2. неслучайными, детерминированными 3. комплексными 4. натуральными

21. В результате исследования зависимости уровня потребления от объемов производства, было построено следующее уравнение регрессии C=0,66+0,32*Y (где С и Y – соответственно объемы потребления и производства, выраженные в тыс. долларов). Вероятность T-статистики для коэффициента перед переменной Y составила 0,013. Какой вывод может быть сделан в отношении данной переменной?

1. данный коэффициент статистически значимо отличается от нуля, следовательно, объем производства оказывает влияние на потребление

2. данный коэффициент статистически значимо не отличается от нуля, следовательно, объем производства оказывает влияние на потребление

3. данный коэффициент статистически значимо отличается от нуля, следовательно, объем производства не оказывает влияние на потребление

4. данный коэффициент статистически значимо не отличается от нуля, следовательно, объем производства не оказывает влияние на потребление

22. Каким условиям удовлетворяют параметры а и b в функции Кобба-Дугласа при возрастающей отдаче от масштабов производства?

1. a + b > 1 2. a + b = 0 3. a + b = 1 4. a + b < 1

23. МНК это 1. Метод нелинейной коррекции 2. Метод наименьших квадратов 3. Метод наибольшего отклонения колебаний 4. Метод новой калькуляции

24. Мультиколлинеарность - это: 1. Линейная взаимосвязь между исследуемыми факторами 2. Множественное отображение одинаковых параметров

Page 115: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

3. Статистический параметр системы уравнений 4. Все варианты ответа

25. .Почему намеренно выбирается увеличение вероятности допущения ошибки I рода?

1. Потому, что одновременно сокращается вероятность допущения ошибки I рода

2. Потому, что одновременно увеличивается вероятность допущения ошибки II рода

3. Потому, что вероятность того, что нулевая гипотеза не будет отклонена, когда она

является ложной

4. Потому, что вероятность того, что альтернативная гипотеза не будет отклонена, когда она является ложной

26. Критическое значение t при любом уровне значимости зависит от 1. числа степеней свободы, которое равно n-k 2. числа наблюдений 3. числа оцененных параметров k 4. числа параметров регрессии

27. Мультиколлинеарность - это:

1. Линейная взаимосвязь между исследуемыми факторами 2. Множественное отображение одинаковых параметров 3. Статистический параметр системы уравнений 4. Все варианты ответа

28. Коэффициент детерминации показывает

1. Статистический параметр системы уравнений 2. Линейную взаимосвязь между исследуемыми факторами 3. Множественное отображение одинаковых параметров 4. Долю вариации результативного признака под действием факторного признака

29. ESS-это: 1. остаточная сумма квадратов 2. число степеней свободы 3. улучшение качества уравнения 4. объясненная сумма квадратов отклонений 30. Ошибка I рода имеет место в том случае,

1. когда принимается ложная гипотеза 2. когда принимается истинная нулевая гипотеза 3. когда отвергается истинная нулевая гипотеза 4. когда не отвергаете ложную гипотезу

31. Основной метод эконометрики

1. Электронно-вычислительный метод 2. Метод математического анализа 3. Метод математической статистики 4. Все варианты ответа

Page 116: keu.page.kgkeu.page.kg/documents/materials/679.pdf · ЗАЯВКА на размещение учебно-методических материалов в образовательном

32. Корреляция - это: 1. Мера статистической линейной связи между исследуемыми факторами, а также

между 1. факторами и результатами моделирования. 2. Линейная взаимосвязь между исследуемыми факторами 3. Множественное отображение одинаковых параметров 4. Статистический параметр системы уравнений

33. RSS- это: 1. объясненная сумма квадратов отклонений 2. число степеней свободы 3. остаточная сумма квадратов 4. улучшение качества уравнения