1. Имеется много постановок задач робастности (т.е. устойчивости статистических выводов). О них можно прочесть в моих учебниках в разделах про устойчивость. Другими словами, можно многими разными способами задать составляющие "общей схемы устойчивости".
2.
Цитата:
Устойчивость к грубым промахам
, т.е. модель засорения Тьюки-Хубера, популярна среди теоретиков. Для практики не очень важна, поскольку (1) все измерения лежат в пределах шкалы прибора, т.е. на ограниченном интервале; (2) вероятность засорения обычно неизвестна, а через нее выражается оптимальное правило обработки данных.
3. Ядерная оценка является
Цитата:
устойчивость к грубым промахам
, поскольку вклад каждого слагаемого по порядку один и тот же, независимо от величины результата измерения. В этом отличие от неустойчивой оценки - среднего арифметического.
4. Утверждение вроде
Цитата:
Ну, вроде, как это известно, что группировка «борется» с промахами
основано на том, что понятие "группировка" не уточняется.
А если уточнить, то выявляются два вида группировки по способу построения:
4.1. Взять интервал от минимума до максимума и поделить на равные интервалы, общее количество которых задано (например, формулой Стерджесса). Очевидна неустойчивость, поскольку минимум и максимум крайне неустойчивы в модели Тьюки-Хубера.
4.2. Выделить равные интервалы в заданных границах, проигнорировав все результаты наблюдений вне этих границ. Группировка устойчива, но столь же устойчива непараметрическая ядерная оценка плотности на том же интервале. Неясно,откуда взять "заданные границы".
5. В гистограмме бросаются в глаза разрывы непрерывности (скачки) при переходе от одного класса группировки к другому. Непараметрическая ядерная оценка плотности непрерывна, чем и привлекает.
6. Группировки и гистограммы - наследие прошлого, когда не было компьютеров, а потому для обработки данных приходилось предварительно их группировать. Сейчас данные хранят в базах данных, и промежуточное звено - группировки и гистограммы - не нужны.
7. Оценивание характеристик по гистограммам приводит к ошибкам, порожденным группированием данных. Для исправления этих ошибок используют поправки Шеппарда, но они - асимптотические (см. мой учебник "Статистические методы анализа данных").
Сказанное выше показывает, что вместо группировок и гистограмм целесообразно использовать непараметрические ядерные оценки плотности.