Предлагаем познакомиться с рецензиями на сочинения Б.Ю. Лемешко, чтобы составить представление о научном уровне этого декана.
С текстами Б.Ю. Лемешко в секции «Математические методы исследования» редколлегии журнала «Заводская лаборатория» шла долгая работа, имевшая целью извлечь жемчужное зерно и представить его читателю.
После четырех переработок в соответствии с четырьмя последовательными рецензиями (прилагаются третья и четвертая) статья Б.Ю. Лемешко, Е.В. Чимитовой № 867 «Оптимальные L-оценки параметров сдвига и масштаба распределений по выборочным квантилям» была опубликована в N 1 за 2004 год.
Статья Б.Ю. Лемешко, С.Б. Лемешко №1517 «Сравнительный анализ критериев проверки нормальности одномерных величин, включенных в ГОСТ Р ИСО 5479-2002» (новое название: «Сравнительный анализ критериев проверки отклонения распределения от нормального закона») после трех рецензий (прилагаются) была окончательно отвергнута.
Каждый, кто познакомится с рецензиями, сможет убедиться, как настойчиво Б.Л. Лемешко пробивал свои опусы и каков был их научный уровень.
Третья рецензия на статью Б.Ю. Лемешко, Е.В. Чимитовой № 867
«Оптимальные L-оценки параметров сдвига и масштаба распределений
по выборочным квантилям» (второй исправленный вариант от 01.03.02)
Во второй коллективной рецензии было четыре замечания: 1) о необходимости указать точность численных результатов, полученных с помощью метода статистических испытаний; 2) о числе операций при сортировке; 3) о качестве датчика псевдослучайных чисел; 4) о сравнении с другими методами оценивания. Анализ доработанного текста показывает, что учтены два замечания – второе (изменены неудачные фразы) и третье (добавлен раздел о датчиках и их свойствах). Однако первое и четвертое замечания остаются.
Авторы статьи уже во второй раз уходят от ответа на естественный вопрос о точности численных результатов, полученных с помощью метода статистических испытаний. Так, на рис.1 (стр.6) приведены графики плотностей распределений, построенных по выборкам объема 2000. Очевидно, эмпирическая плотность отличается от теоретической. Насколько? Именно на этот вопрос авторы не желают отвечать. Кроме того, неясно, как оценивается плотность по результатам 2000 статистических испытаний (как сглаживается эмпирическая функция распределения). Неясно, зачем проводится усреднение по 100 экспериментам (с.6). На с.7 сравниваются оценки параметров, а не сами распределения или плотности – это уход от ответа на рассматриваемый вопрос.
Некорректно проводится сравнение с другими методами оценивания. Так, неоднократно подчеркивается асимптотическая оптимальность рассматриваемых оценок, однако она имеет место лишь при заданном группировании. Термин «робастность» в статье не имеет точного определения, поэтому неясно, что такое «существенное преимущество в робастности». А если L-оценки сравнить с оценками типа усеченного среднего? Конкретно (к стр.12) – какова плата за группировку, т.е. на сколько процентов увеличивается среднее квадратическое отклонение? Подчеркивается, что для нахождения L-оценок не нужно применять итерационные процедуры, в отличие от оценок максимального правдоподобия. Хорошо известно, что в практике вместо оценок максимального правдоподобия (ОМП) целесообразно использовать одношаговые оценки (ОШО), для нахождения ОШО также не нужно применять итерационные процедуры. Так что авторы статьи сравнивают L-оценки с заведомо слабым соперником, игнорируя более сильного. Кроме того, для нахождения L-оценок итерационного процесса не надо, но нужны таблицы.
Приходится констатировать, что вопрос о целесообразности использования L-оценок при статистическом анализе результатов измерений остается открытым. Например, десятилетия назад их рекомендовали использовать при экспресс-анализе данных (они относились к т.н. «быстрым методам» статистического анализа). Однако в настоящее время, как отмечают авторы рецензируемой статьи, в связи с широким распространением компьютеров саму необходимость быстрых методов можно поставить под сомнение. Читателям «Заводской лаборатории» нужны рекомендации: когда использовать L-оценки, а когда – другие методы оценивания. Сколько интервалов группирования использовать
Есть отдельные недостатки в изложении материала. На с.6 без определения используется термин «модель закона распределения». Непонятна смысловая нагрузка рис.2. Он демонстрирует состоятельность оценок? Критерий омега-квадрат – это не критерий Мизеса., а критерий Смирнова-Мизеса (с.9). На с.11 (начало) рассматривается гипотеза, а не строго доказанное утверждение. Авторам статьи неизвестна классическая книга по L-оценкам: Благовещенский Ю.Н., Самсонова В.П., Дмитриев Е.А. Непараметрические методы в почвенных исследованиях. – М.: Наука, 1987.
2002-06-08
Четвертая рецензия на статью Б.Ю. Лемешко, Е.В. Чимитовой № 867
«Оптимальные L-оценки параметров сдвига и масштаба распределений
по выборочным квантилям» (очередной исправленный вариант от 21.01.03)
Авторы существенно доработали текст. Однако есть замечания, в том числе по доработанным разделам статьи.
1. В табл. 6 (с.
все критерии – типа Колмогорова, типа омега-квадрат (при проверке согласия с простой гипотезой его обычно именуют критерием Крамера-Мизеса-Смирнова или Мизеса-Смирнова) и др. На с. 12 критерии именуются уже иначе, чем на с.8 (см. рис.4 и абзац под рис.4). На с.15 – новый вариант.
2. В табл. 9 на с.15 все критерии – это критерии типа Колмогорова, типа омега-квадрат… В нынешнем варианте авторы фактически провоцируют читателей на совершение распространенной ошибки, состоящей в использовании распределений статистик критериев согласия с фиксированным распределением при проверке сложных гипотез. См. об этом:
Орлов А.И. Распространенная ошибка при использовании критериев Колмогорова и омега-квадрат. – Журнал «Заводская лаборатория».1985. Т.51. No.1. С.60-62;
Орлов А.И. О критериях согласия с параметрическим семейством. – Журнал «Заводская лаборатория». 1997. Т.63. No.5. С. 49-50.
3. На с.16 осталось некорректное сравнение L-оценок с другими видами оценок. Надо отметить, что группировка приводит к потере информации, указать величину потерь. В третьем абзаце сверху надо включить в перечень одношаговые оценки. См. о них, например:
Орлов А.И. О нецелесообразности использования итеративных процедур нахождения оценок максимального правдоподобия. – Журнал «Заводская лаборатория», 1986, т.52, No.5, с.67-69.
В конце третьего абзаца отредактировать: «… выгодно отличаются от перечисленных, кроме одношаговых оценок, тем …».
В сопроводительном письме к статье есть необоснованные утверждения о сравнении ОМП и ОШО. Частный случай, не вполне корректно рассмотренный, не дает оснований для общих выводов. Странным утверждением кончается первая страница сопроводительного письма – различение сложных гипотез (о принадлежности к тому или иному семейству распределений) никак не может быть более надежным, чем различение простых (два распределения из того и другого семейства). Разбор других утверждений в сопроводительном письме не входит в задачу рецензента.
2003-06-30
Рецензия на статью Б.Ю. Лемешко, С.Б. Лемешко №1517
«Сравнительный анализ критериев проверки нормальности одномерных величин, включенных в ГОСТ Р ИСО 5479-2002»
Название не вполне соответствует содержанию. Рассматриваются не только критерии из указанного стандарта, но и иные. Анализ проводится только методом статистических испытаний.
К статье имеется много конкретных замечаний.
1. Что такое «проверка нормальности», не определено. Обычно («см., например, «Заводская лаборатория», 1985, №1, с. 60-62) рассматривают три гипотезы: проверка согласия с нормальным семейством распределения вероятностей с неизвестным математическим ожиданием, проверка согласия с нормальным семейством с неизвестной дисперсией, проверка согласия с нормальным семейством с двумя неизвестными параметрами. Какая из них имеется в виду в тех или иных местах рецензируемой статье, не ясно.
2. Вопреки мнению авторов (с.1 статьи), в настоящее время нет необходимости проверять нормальность результатов распределений измерений (наблюдений, испытаний, опытов, анализов), поскольку непараметрические статистические методы, не предполагающие нормальности, позволяют решать все практически важные задачи статистического анализа данных. Большое число статей раздела «Математические методы исследования» ЗЛ посвящено непараметрическим методам.
Однако, к сожалению, существует ГОСТ Р ИСО 5479-2002, имеющий рекомендательный характер и посвященный проверке нормальности. Критический анализ этого текста может представлять интерес для отдельных читателей ЗЛ.
3. Вопреки мнению авторов (с.2 статьи), в отечественной литературе многократно и подробно рассматривались проблемы проверки нормальности (всех трех гипотез, сформулированных в п.1 рецензии). Из статей в ЗЛ достаточно сослаться на работы Л.А. Золотухиной и Е.В. Винник (1985, №1, с.51-55), А.И.Орлова (1985, №1 с.60-62; 1997, №5, с. 49-50) и др. Критериям нормальности уделено большое внимание в «Таблицах математической статистики» Л.Н. Большева и Н.В. Смирнова (1966, 1968, 1983), монографиях Ю.Н. Тюрина, Г.В. Мартынова и др.
Практически в любом учебном издании по статистическим методам рассматриваются вопросы проверки нормальности. Это - один из наиболее популярных сюжетов в статистической литературе.
4. Критерии на основе выборочных коэффициентов асимметрии и эксцесса (с.2-4) являются классическими. См., например, упомянутые «Таблицы...» Л.Н. Большева и Н.В. Смирнова, в которых также описаны результаты исследования скорости сходимости распределений статистик к соответствующим предельным распределениям. В рецензируемой статье не отражены результаты предыдущих исследований и не обоснована необходимость проведения статистического моделирования. Конкретный вид критериев в рецензируемой статье не указан. Можно предположить, что вид рис.1 (с.3 статьи) и рис.4 (с.6 статьи) обусловлен отсутствием нормирования статистик путем деления на стандартное отклонение.
5. Вопреки с.7 статьи, нельзя на основе выборочных коэффициентов асимметрии и эксцесса делать заключение «о принадлежности нормальному закону». Проверяется лишь то, что теоретическая асимметрия и теоретический эксцесс принимают определенные значения, а именно, 0 и 3.
6. Рис.8 (стр.9) вводит читателя в заблуждение, поскольку построен без использования нормировки, обеспечивающей невырожденность предельного распределения критерия Шапиро-Уилка.
7. Мощность критерия Шапиро-Уилка исследовалась неоднократно, в частности, авторами этого критерия, Л.А. Золотухиной и Е.В. Винник (ЗЛ, .1985, №1, с.51-55). Как полученные в работах предшественников результаты соотносятся с результатами авторов рецензируемой статьи? Ответ на этот вопрос необходим, прежде всего, потому, что предшественники подчеркивают, что наибольшую мощность имеет критерий Шапиро-Уилка, а в аннотации к рецензируемой статье утверждается, что наиболее предпочтительным является критерий D’Agostino.
8. На с.21-22 неверно утверждение о том, что с помощью формулы (7) осуществляется «преобразование коэффициента асимметрии в стандартную нормальную величину». Может идти речь лишь об улучшении приближения.
9. Та же ошибка на с.23. Неверно утверждение о том, что с помощью формулы (8) осуществляется «преобразование коэффициента эксцесса в стандартную нормальную величину». Может идти речь лишь об улучшении приближения.
10. Заявленное в аннотации к рецензируемой статье утверждение, что наиболее предпочтительным критерием при проверке нормальности является критерий, предложенный D’Agostino, не находит подтверждения в тексте статьи. Более того, это утверждение является грубо ошибочным, поскольку указанный критерий - вообще не критерий нормальности. Он является функцией от выборочных коэффициентов асимметрии и эксцесса. На его основе нельзя делать заключение «о принадлежности нормальному закону». Проверяется лишь то, что теоретическая асимметрия и теоретический эксцесс принимают определенные значения, а именно, 0 и 3. Этот вопрос уже обсуждался в ЗЛ (1989, Т.55, №10, с.90-93).
11. Инструмент исследования - система статистического моделирования - не описана. Неизвестен датчик псевдослучайных чисел, число статистических испытаний, точность оценивания функций распределения.
12. В качестве альтернатив нормальности рассматриваются экспоненциальное семейство распределений, распределение Лапласа и логистическое распределение. Выбор именно этих распределений в качестве альтернатив ничем не обоснован. Не проанализированы альтернативные гипотезы, рассмотренные предшественниками.
ВЫВОДЫ
Авторами статьи проведены многочисленные расчеты. Однако не все эти расчеты и графики представляют интерес для читателей ЗЛ. Тем более, что не проанализированы классические публикации по рассматриваемой тематике.
Из-за многочисленных неточностей и ошибок, нерациональной подачи материала публикация статьи в настоящем ее виде представляется нецелесообразной.
Можно посоветовать авторам переработать статью на основе приведенных выше замечаний, учесть предшествующие публикации, сжато описать свои результаты и представить работу объемом до 10 стр.
Примечание (для секции ЗЛ). В разделе «Математические методы исследования» в ближайшее время выйдет статья Селезнева В.Д. и Денисова К.С. № 1089, в которой показано, что при объеме выборки n < 50 проверять нормальность вообще нецелесообразно.
Вторая рецензия - рецензия на доработанный вариант статьи Б.Ю. Лемешко, С.Б. Лемешко №1517 «Сравнительный анализ критериев проверки нормальности одномерных величин, включенных в ГОСТ Р ИСО 5479-2002»
Новое название: «Сравнительный анализ критериев проверки отклонения распределения от нормального закона»
Новый вариант вдвое сокращен по сравнению с предыдущим. Однако для того, чтобы работа соответствовала требованиям «Заводской лаборатории», ее необходимо сократить еще вдвое.
Из 12 замечаний первой рецензии учтены 2 (№№8,9) и частично учтены еще 2 (№№3,6). С возражениями одного из авторов по поводу замечаний первой рецензии нельзя согласиться.
Статья подписана только одним из авторов.
Из сказанного ясно, что публикация статьи в настоящем ее виде представляется нецелесообразной.
Можно посоветовать авторам переработать статью на основе замечаний первой рецензии и приведенных ниже замечаний, учесть предшествующие публикации, сжато описать свои результаты и представить работу объемом до 10 стр.
Основное требование к авторам - поднять изложение на современный научный уровень.
С целью повышения научного уровня статей в «Заводской лаборатории» была опубликована сводка «Термины и определения в области вероятностно-статистических методов» (1999. Т.65. No.7. С.46-54). К сожалению, рецензируемая статья не соответствует этим общепринятым требованиям.
Например, необходимо различать теоретические и выборочные моменты. Между тем, в рецензируемой статье такое различие зачастую игнорируется (с.2 и др.). Даже в неполной средней школе за запись поставили бы «два». Распределение статистики (1), очевидно, не всегда является симметричным. Процентные точки зависят от распределения. Короче, «критерий проверки на симметричность» не описан. Согласно с.2-3 нулевая и альтернативные гипотезы - простые. И т.д., и т.п. Рис.2, очевидно, может быть построен на основании справочника Большева и Смирнова и более ранних публикаций. Очевидно, авторы рецензируемой статьи поленились их найти. Как только начнешь вчитываться в статью, сразу обнаруживаешь много «ляпов».
В статье речь идет о критериях проверки статистических гипотез. С 30-х годов ХХ в. среди специалистов общепринято описывать проверяемые гипотезы - нулевую и альтернативную. К сожалению, при чтении рецензируемой статьи зачастую приходится только догадываться, о проверке каких гипотез идет речь.
Такая характеристика статистического критерия, как мощность, зависит от конкретной альтернативной гипотезы. Мощность - это не число, а функция. Поэтому не являются научными попытки сравнения по мощности тех или иных критериев без указания конкретных альтернатив (см. стр.7 и др. доработанного варианта статьи). Хорошо известно, что для любого непараметрического критерия можно указать такое распределение на множестве альтернатив, что рассматриваемый критерий оказывается наиболее мощным среди всех возможных (Никитин Я.Ю. Асимптотическая эффективность непараметрических критериев. - М.: Наука, 1995. - 240 с.).
Речь идет не о терминологических или теоретических проблемах. Авторы рецензируемой статьи приходят к нелепой рекомендации по использованию несостоятельного критерия (8). Очевидно, этот критерий не имеет отношения к проверке нормальности, он позволяет лишь установить, имеют ли асимметрия и эксцесс те же значения, что и для нормального распределения.
Как же авторы пришли к столь нелепому выводу? Путем специально организованного подбора альтернатив (с.3). Никакого научного обоснования этого подбора они не дают. Однако именно подбор альтернатив обеспечивает вывод о преимуществе критерия (8) перед критерием Шапиро-Уилка. Предыдущие авторы с помощью аналогичного подхода (также основанного на методе Монте-Карло, но с другим набором альтернатив) доказали преимущество критерия Шапиро-Уилка. Авторы рецензируемой статьи уходят от естественного (со стороны всех специалистов) вопроса о том, почему их выводы кардинально отличаются от выводов предшественников.
Необходимо описать и систему статистического моделирования. В прежних публикациях говорилось, что каждый эксперимент - это 2000 испытаний. Т.е. согласно теореме Колмогорова любую кривую на рисунках статьи надо заменить полосой шириной . Ясно, что при этом целый ряд кривых на рисунках статьи сливается межу собой.
Точность данных в таблицах также следует указывать.
На с.10-11 рассматривается случай нескольких выборок. Ради сокращения объема его можно выделить из рецензируемой статьи.
2004-05-23
Третья рецензия - О невозможности публикации статьи
Б.Ю. Лемешко, С.Б. Лемешко №1517
«Сравнительный анализ критериев проверки отклонения распределения от нормального закона»
В предыдущей рецензии (от 23 мая 2004 г.) сказано: «Публикация статьи в настоящем ее виде представляется нецелесообразной». Основания для такого заключения приведены в ранее составленных рецензиях.
Как подчеркнуто в письме в редакцию первого из авторов от 18.08.04, авторы не считают нужным перерабатывать статью. Более того, указанное письмо демонстрирует дополнительные недостатки в понимании авторами существа рассматриваемой проблемы и подходе к устранению пробелов. В частности, авторы статьи не пожелали даже прочитать соответствующие страницы классической монографии Л.Н. Большева и Н.В. Смирнова «Таблицы математической статистики», не понимают смысл критерия Колмогорова. И, более того, даже не прочитали те ими же написанные пассажи в статье, которые были подвергнуты критике в предыдущей рецензии.
Приходится констатировать, что на предыдущие рецензии не дано адекватного ответа, замечания не учтены.
Статья не соответствует научному уровню, принятому в журнале, публикация ее невозможна.
2004-11-27