Высокие статистические технологии

Форум сайта семьи Орловых

Текущее время: Чт мар 28, 2024 12:58 pm

Часовой пояс: UTC + 3 часа




Начать новую тему Ответить на тему  [ Сообщений: 8 ] 
Автор Сообщение
 Заголовок сообщения: Оценка модели с помощью критерия хи-квадрат
СообщениеДобавлено: Ср сен 05, 2007 5:04 pm 
Не в сети

Зарегистрирован: Ср сен 05, 2007 5:02 pm
Сообщений: 4
Имеется логит-модель вида y=1/(1+1/(exp(a+b*x1+c*x2)))
По результатам наблюдений рассчитаны наблюдаемые значения y. Есть сведения о фактических значениях y. Прочитал, что рассчитать наблюдаемое значение хи-квадрат статистики можно, используя логарифм правдоподобия данной модели и логарифм правдоподобия нулевой модели (модели, содержащей только свободный член), а число степеней свободы в данном случае будет равно числу независимых переменных модели (то есть 2). Как рассчитать наблюдаемое значение хи-квадрат статистики для такой модели?


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: Ср сен 05, 2007 5:40 pm 
Не в сети

Зарегистрирован: Вт сен 28, 2004 11:58 am
Сообщений: 11265
Чтобы применить статистические методы, необходимо сформулировать ту или иную вероятностно-статистической модели.
Что за модель у Вас?
Дана выборка из n независимых одинаково распределенных трехмерных
случайных векторов (х1i, x2i, yi), i = 1,2,..., n ?
Или что-то иное?
Каково распределение вектора (х1i, x2i, yi)?
С помощью статистики хи-квадрат Вы хотите проверить какую-то гипотезу7
Какую именно?

Пока не описана вероятностно-статистическая модель, Вашему вопросу нельзя придать точный смысл.


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: Чт сен 06, 2007 3:54 pm 
Не в сети

Зарегистрирован: Ср сен 05, 2007 5:02 pm
Сообщений: 4
Проф.А.И.Орлов писал(а):
Чтобы применить статистические методы, необходимо сформулировать ту или иную вероятностно-статистической модели.
Что за модель у Вас?
Дана выборка из n независимых одинаково распределенных трехмерных
случайных векторов (х1i, x2i, yi), i = 1,2,..., n ?
Или что-то иное?
Каково распределение вектора (х1i, x2i, yi)?
С помощью статистики хи-квадрат Вы хотите проверить какую-то гипотезу7
Какую именно?

Пока не описана вероятностно-статистическая модель, Вашему вопросу нельзя придать точный смысл.

Модель показывает вероятность наступления события (y) в зависимости от коэффициентов x. Y может принимать значенияот 0 до 1. Хочу проверить гипотезу о статистической значимости найденных параметров модели (a, b и с). n=44 Предполагается нормальное распределение


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: Чт сен 06, 2007 6:36 pm 
Не в сети

Зарегистрирован: Вт сен 28, 2004 11:58 am
Сообщений: 11265
Вероятностная модель не описана.

Повторю: какие величины известны, какие из них детерминированы, какие случайны.
Какие именно величины имеют нормальное распределение?
Как проверена нормальность?


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: Пт сен 07, 2007 8:54 pm 
Не в сети

Зарегистрирован: Ср сен 05, 2007 5:02 pm
Сообщений: 4
К сожалению больше силен в экономике, чем в мат. статистике. Попробую объяснить. Величины x - значения финансовых коэффициентов у различных предприятий - это случайные величины. y - вероятность наступления события на каждом из предприятии, которое предположительно зависит от этих коэффициентов. Заведомо известно фактическое наступление или отсутствие события на каждом предприятии (1 - наличие события, 0 - его отсутствие). В связи с Вашим вопросом о нормальности задам вопрос: в модель должны включаться независимые переменные x в отношении которых нет подтверждений против нормальности? Как может повлиять на оценку вероятности включение в модель переменных x, в отношении которых есть сильные подтверждения против нормальности? Проверку нормальности осущестлял с помощью программы StatPlus (программа как-то комплексно оценивает по критерию Колмогорова-Смирнова/Лиллифорса, Шапиро-Уилса, Д'Агостино), но я проверял только x, "y" не проверял


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: Сб сен 08, 2007 5:28 pm 
Не в сети

Зарегистрирован: Вт сен 28, 2004 11:58 am
Сообщений: 11265
Жаль, что Вы так и не описали вероятностно-статистическую модель.
Попробую сделать это за Вас.

Исходные данные имеют вид
(х1i, x2i, yi), i = 1,2,..., n,
где х1i и x2i - действительные числа, yi = 0 или 1.

Исходя из предыдущих рассмотрений, представляют интерес по крайней мере две разные модели.

Модель 1.
Величины х1i и x2i детерминированы, yi - случайная величина, принимающая два значения (0 и 1), причем Р(yi = 1) есть
Цитата:
1/(1+1/(exp(a+b*x1+c*x2)))


Модель 2.
Величины х1i и x2i - независимые нормально распределенные случайные величины, yi - независимая от них случайная величина, принимающая два значения (0 и 1), причем условная вероятность Р(yi = 1 при фиксированных х1i и x2i ) есть
Цитата:
1/(1+1/(exp(a+b*x1+c*x2)))


Какую из этих двух моделей Вы используете? Или какую-то еще?

В модели 1 нет никаких нормально распределенных случайных величин. Неизвестные параметры a, b, c можно оценить по методу максимального правдоподобия. Совместное распределение оценок параметров a, b, c будет асимптотически нормальным. Исходя из этого можно проверить значимость их отличия от 0 (сравните с проверкой значимости отличия от 0 коэффициентов линейной зависимости при использовании МНК в п.5.1 моего учебника "Эконометрика" http://orlovs.pp.ru/econ.php#ek1 ). Никакого "хи-квадрата" не надо.

В модели 2 добавляются 4 параметра, описывающие нормальные распределения. Всего оценивать надо 7 параметров. Отметим, что при объеме выборки до 50 (у Вас - 44) никакие статистические критерии не позволяют достоверно установить наличие нормальности распределения величин х1i и x2i :

Селезнев В. Д., Денисов К. С. Исследование свойств критериев согласия функции распределения данных с гауссовой методом Монте-Карло для малых выборок. - Журнал "Заводская лаборатория", 2005, No.1, с.68.

Совместное распределение оценок семи параметров будет асимптотически нормальным. Исходя из этого можно проверить значимость их отличия от 0. Никакого "хи-квадрата" не надо.


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: Вт сен 11, 2007 10:11 am 
Не в сети

Зарегистрирован: Ср сен 05, 2007 5:02 pm
Сообщений: 4
x1 и x2 - независимые случайные величины. Мне заранее известны наблюдаемые значения y (1 - это наступление события, 0 - его отсутствие) для каждого наблюдения. На основе этого с помощью программы были рассчитаны неизвестные параметры модели: a, b и c, при которых данная модель максимально приближает расчетные значения y к наблюдаемым. Очевидно, что в данной модели расчетные значения "y" зависят от x1 и x2. Расчетные значения "y" могут отклоняться от точных наблюдаемых значений (0 и 1), то есть лежать в промежутке от 0 до 1. Но фактически, получается что данная модель, то есть расчетное значение "y", показывает вероятность наступления события, так как чем ближе к нулю, тем меньше вероятность наступления события. А если у увеличу число наблюдений (>50)? Вот по этой ссылке я прочитал о методе оценки нелинейной модели с помощью критерия хи-квадрат http://www.iki.rssi.ru/magbase/REFMAN/S ... #egoodness
А вот тут описан расчет логарифма функции правдоподобия http://www.iki.rssi.ru/magbase/REFMAN/S ... in.html#n2


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: Вт сен 11, 2007 8:03 pm 
Не в сети

Зарегистрирован: Вт сен 28, 2004 11:58 am
Сообщений: 11265
Ничего не понимаю.
Почему Вы не хотите сформулировать интересующую Вас задачу в соответствии с подходами прикладной статистики?
Сначала надо описать, как выглядят исходные данные.
Затем надо сформулировать вероятностно-статистическую модель порождения данных. Я предложил Вам две разные, либо выбирайте из них, либо опишите свою.
Затем надо поставить задачу. которую Вы хотите решить.
Дать метод решения.
Описать свойства алгоритмов...

А Вы приводите ссылки на малограмотный учебник.
Авторы не знают даже, что вместо максимального правдоподобия следует использовать одношаговые оценки (см. об одношаговых оценках в учебнике "Прикладная статистика" http://orlovs.pp.ru/stat.php#k1 в главе "Оценивание").

Советую Вам не забивать голову проблемами, которые Вы не можете адекватно осмыслить, а начать с изучения учебников, принятых на экономических факультетах, например, с указанной выше "Прикладной статистики".


Вернуться наверх
 Профиль  
 
Показать сообщения за:  Сортировать по:  
Начать новую тему Ответить на тему  [ Сообщений: 8 ] 

Часовой пояс: UTC + 3 часа


Кто сейчас на форуме

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 91


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Перейти:  
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
Русская поддержка phpBB