Цитата:
Информация на Вашем сайте и форуме весьма интересна и полезна, но одновременно трудна для понимания и практического применения для людей, относительно "далеких" от математики
Студенты 2-4-6 курсов воспринимают, не жалуясь. Возможно, потому, что изучали теорию вероятностей и математическую статистику. См. справочник "Математика случая", в печатном варианте: Орлов А.И. Вероятность и прикладная статистика - основные факты. - М.: КНОРУС, 2010.
Цитата:
1. Непонятно, почему использование центральной предельной теоремы (ЦПТ) рассматривается как непараметрический подход
Суммируются случайные величины, имеющие произвольные распределения. Т.е. рассматривается непараметрическая постановка. Надо знать, что статистическая задача называется параметрической, если заранее предполагается, что исходные данные имеют распределения, входящее в то или иное параметрическое семейство - экспоненциальных распределений. Вейбулла-Гнеденко, нормальных, логарифмически нормальных и др. Если же предполагается, что исходные данные имеют произвольое распределение, то задача является непараметрической. См. цитированный справочник.
То, что в результате суммирования случайных величин с произвольным распределением получаем случайную величину с нормальным распределением - величайший математический результат, потому и называется ЦПТ.
Кстати, в результате перемножения случайных величин с произвольным распределением получаем случайную величину с
логарифмически нормальным распределением.
Цитата:
2. Неясно, почему критерий Крамера-Уэлча считается непараметрическим,
Потому что исходная постановка непараметрическая. Выборки взяты из произвольных распределений.
Цитата:
К этому, что Вы можете сказать об аналогичном критерии Пагуровой, приведенном в программе AtteStat Игоря Гладышева? По формуле этот критерий один к одному - Крамера-Уэлча, только критические значения берутся другие.
Пагурова вслед за Уэлчем изучала этот критерий, когда выборки берутся из нормальных распределений. Статистический критерий - это не только статистика, но и правила принятия решений (критические значения).
Автор комментариев к программе AtteStat допускает неточности, поскольку не является специалистом по прикладной статистике.
Цитата:
В главе 4 "Эконометрики" говорится о практическом отсутствии нормальности в реальных данных,
Распределения реальных данных, как правило, не являются нормальными. Перечитайте раздел еще раз.
Цитата:
4. Пожалуйста, объясните доступно, что такое внутриматематическое свойство типа регулярности, имеющее отношение к распределению случайной величины?
Эта фраза означает, что в тексте для математиков стояли бы еще некоторые условия, которых Вы все равно не поймете. Например, в ЦПТ - что дробь Ляпунова должна стремиться к нулю.
Цитата:
5. Как следует из Ваших учебников и статей, для использования ЦПТ необходима относительно большая выборка, от n=30-50 и больше. В биологии мы имеем дело с малыми размерами выборок, в среднем около 5, максимум 10. Из истории известно, что критерий Стьюдента был создан именно для малых выборок, непараметрическим аналогом которого является критерий Вилкоксона. Из информации в Ваших учебниках я так и не понял, следует ли из современных наработок, что ЦПТ можно без ущерба применять и при малых выборках (n=5-10)? Или же все еще необходимо пользоваться классикой, в частности, критерием Вилкоксона?
Критерий Стьюдента не является научно обоснованным, в отличие от критерия Вилкоксона.
Какой объем выборок достаточен для применения асимптотических результатов - обычно требует численных расчетов. Ответ зависит от того, как поставить задачу, какие отклонения считать малыми. Об этом - в моих учебниках в разделах про устойчивость (устойчивость к изменению объема выборки).
Цитата:
6. Утверждается (подглава 4.1 "Эконометрики"), что любые реальные данные целесообразно моделировать лишь с помощью дискретных случайных величин, принимающих конечное число значений.
Между тем, многие критерии требуют непрерывности функции распределения, в частности, рассмотренный Лемана-Розенблатта. Что делать, если считаю правильным пользоваться именно дискретными величинами?
Применять статистические методы, предназначенные для анализа дискретных данных. Критерий Крамера-Уэлча, таблицы сопряженности и др.
Цитата:
7. Что Вы можете сказать о так называемой бивес-оценке? К сожалению, уже не помню, в какой книге я читал о нем. Там было показано (с примерами), что бивес-оценка выдает промежуточную величину между арифметическим средним и медианой.
Не знаю, что это такое.
Цитата:
8. Насчет мощности критерия: в простых случаях обычно альтернативная гипотеза сводится к простому отрицанию нулевой гипотезы, без конкретизации. Например, Н0 - различий нет, Н1 - различия есть. Как определить достаточную мощность критерия в таких случаях?
Надо вычислить мощность критерия как функцию альтернативной гипотезы.
Цитата:
9. ПОЖЕЛАНИЕ: было бы крайне полезно написать учебник для "чайников" по современной прикладной статистике понятным для простого обывателя языком, с минимумом математического изложения. Поверьте, фразы типа "...рассмотрим статистики интегрального типа [формула]...", "...пусть [формула], тогда..." или "...из [формула] очевидно, что..." совершенно непонятны и пугающи для не математика. Между тем несомненно, что есть крайняя необходимость в таком учебнике. Хорошим примером для классической статистики считаю книгу Стэнтона Гланца "Медико-биологическая статистика". - М.: Практика, 1999. - 459 с.
Книг достаточно - от Холлендера-Вулфа и Руниона (1980-е) но брошюры Новикова Д.А. и Новочадова
www.mtas.ru
Еще больше книг с ошибками - см. по соседству тему "Профессора-невежды готовят себе на смену новых невежд"
http://forum.orlovs.pp.ru/viewtopic.php?t=548 .