Высокие статистические технологии

Форум сайта семьи Орловых

Текущее время: Вт дек 31, 2024 6:19 pm

Часовой пояс: UTC + 3 часа




Начать новую тему Ответить на тему  [ Сообщений: 8 ] 
Автор Сообщение
 Заголовок сообщения: Фиктивные переменные в регрессии
СообщениеДобавлено: Пн мар 01, 2010 12:15 am 
Не в сети

Зарегистрирован: Пт сен 04, 2009 9:38 am
Сообщений: 3
Здравствуйте!
Возник такой вопрос. Можно ли вводить в уравнение регрессии фиктивную (dummy) переменную, которая представляет качественный признак, коррелирующий с регрессором?
Мои рассуждения: можно, потому что фиктивная переменная не несет в себе какой-либо прямой информации об этом качественном признаке, а является просто манекеном-переключателем с регресии одной подсовокупности на регрессию другой подсовокупности. В связи с этим угрозы мультиколлинеарности быть не должно. Правильно ли я рассуждаю?
Где об этом можно почитать, чтобы лучше разобраться и сослаться?
Заранее благодарен.


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: Пн мар 01, 2010 1:24 pm 
Не в сети

Зарегистрирован: Чт мар 20, 2008 1:25 pm
Сообщений: 191
Откуда: Солнечная система
Фиктивные переменные - вредная идея.
1. Классическая регресиия основана на предположении многомерной нормальности, а введение дискретной фиктивной переменной разрушает это предположение.
2. Линии регрессии в двух совокупностях при использовании фиктивной переменной должны быть параллельны - а с какой стати?
Тот, кто пропагандирует фиктивные переменные, либо дурак (не понимает пп.1, 2 выше), либо обманщик (вешает лапшу на уши), либо сугубый математик, которому нет дела до практической применимости убогой математической схемы.
В любом случае читать о фиктивных переменных имеет смысл только с целью разоблачения глупостей.
См. также:
Убогая эконометрика и убогие эконометрики http://forum.orlovs.pp.ru/viewtopic.php?t=552
Эконометрика по Айвазяну. Что это - глупость или диверсия? http://forum.orlovs.pp.ru/viewtopic.php?t=391
Профессора-невежды готовят себе на смену новых невежд http://forum.orlovs.pp.ru/viewtopic.php?t=548
Типовые ошибки при вхождении в прикладную статистику http://forum.orlovs.pp.ru/viewtopic.php?t=97


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: Сб мар 27, 2010 3:42 pm 
Не в сети

Зарегистрирован: Пт мар 26, 2010 9:39 pm
Сообщений: 7
Граф писал(а):
Фиктивные переменные - вредная идея.
1. Классическая регресиия основана на предположении многомерной нормальности, а введение дискретной фиктивной переменной разрушает это предположение.

Если можно, хотелось бы прояснить один вопрос - чего именно нормальность требуется в регрессионном анализе? Заранее благодарю.


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: Сб мар 27, 2010 11:59 pm 
Не в сети

Зарегистрирован: Вт сен 28, 2004 11:58 am
Сообщений: 11645
Есть две основные модели регрессионного анализа.
1. Независимая переменная - детерминированная. Зависимая переменная равна сумме функции от независимой плюс случайные погрешности. Функция известна с точностью до параметров, каковые оценивают методом наименьших квадратов. Дурная традиция состоит в том, что распределение погрешностей считают нормальным. Хотя нет оснований принимать нормальность распределения погрешностей, это предположение кочует из книги в книгу. Если автор пишет о критериях Стьюдента или Фишера, он принимает, что распределение погрешностей нормально, хотя из-за своей малограмотности может об этом даже не упоминать.
2. Во второй модели принимают, что наблюдаемые пары чисел - выборка из двумерного распределения. В этом случае регрессия - это условное математическое ожидание. Часто принимают, что распределение пар - двумерное нормальное. Обоснования никакого, и реальные распределения не являются нормальными.
В обоих случаях причина - наличие теории, основанной на нормальности. По пословице: "Искать ключи надо под фонарем, где светлее, а не в кустах, где потерял".
Без предположения нормальности можно обойтись, развивая непараметрические методы (см. наш учебник "Прикладная статистика" http://orlovs.pp.ru/stat.php#k1


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: Вс мар 28, 2010 7:57 am 
Не в сети

Зарегистрирован: Пт мар 26, 2010 9:39 pm
Сообщений: 7
А если по представленным эмпирическим данным методом МНК подобрать регрессионное уравнение (не обязательно прямую - а самого общего вида), а затем проверить распределение остатков зависимой переменной относительно данного уравнения, что может дать такой анализ?


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: Вс мар 28, 2010 11:41 am 
Не в сети

Зарегистрирован: Вт сен 28, 2004 11:58 am
Сообщений: 11645
Изучать остатки можно, но это не так легко (кажущиеся остатки, т.е. отклонения от оценки регрессии, зависимы). Об этом - диссертация Муганцевой (МГУ им. Ломоносова, ученица Тюрина, я был оппонентом). Чтобы отличить нормальное распределение от подходящего логистического, нужны тысячи наблюдений, поскольку супремум модуля разности функций нормального и логистического распределений не превосходит 0,01.

Из общих соображений ясно, что нельзя установить, что распределение остатков нормально. Можно проверить лишь, что оно мало отличается от нормального. И неизвестно, как это отличие может повлиять на различные характеристики, которые в случае нормальности имеют распределения Стьюдента и Фишера.

Более обоснованное решение - с самого начала развивать непараметрические методы.


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: Вс мар 28, 2010 2:31 pm 
Не в сети

Зарегистрирован: Пт мар 26, 2010 9:39 pm
Сообщений: 7
Спасибо большое. Интуитивно идея зависимости определенных таким образом остатков понятна. Очень хорошо, что есть работа, с которой теоретически можно ознакомиться.
...
Немного поискал в Интернете. Вот что обнаружил: Муганцева Л. А. Проверка нормальности в схемах одномерной и многомерной регрессии // Теория вероятностей и ее применения. 1977. Т. 22, № 3. С. 603–614. Прямая ссылка http://mi.mathnet.ru/rus/tvp/v22/i3/p603

Еще раз спасибо.


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: Пн мар 29, 2010 12:23 pm 
Не в сети

Зарегистрирован: Чт мар 20, 2008 1:25 pm
Сообщений: 191
Откуда: Солнечная система
Шла речь о диссертации именно на эту тему.


Вернуться наверх
 Профиль  
 
Показать сообщения за:  Сортировать по:  
Начать новую тему Ответить на тему  [ Сообщений: 8 ] 

Часовой пояс: UTC + 3 часа


Кто сейчас на форуме

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 2


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Перейти:  
cron
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
Русская поддержка phpBB