Из рукописи новой книги:
15.2. Статистические методы в России
Специалисты по истории статистики установили [5], что в России, как и в других странах, статистические исследования проводились c момента возникновения государств. Цели этих исследований, как и описанных в Библии работ под руководством Моисея, вытекали из потребностей государственного управления, прежде всего налогообложения и обороны страны. С XII века (в традиционной хронологии) на Руси проводились переписи населения [5]. Развитие статистической науки началось в России сразу же с выделением в начале XVIII века исследовательской деятельности как необходимой составляющей забот государства. Проще говоря, сразу же с организацией первого научного учреждения - Академии наук.
Первое статистико-экономическое обозрение России было составлено Иваном Кириловичем Кириловым (1689 - 1737), обер-секретарем Сената, под названием «Цветущее состояние Всероссийского государства…». Первый в России научный труд по вопросам организации учета населения – «Разсуждение о ревизии поголовной и касаюсчемся до оной» - был написан в 1747 г. Василием Никитичем Татищевым (1686 – 1750), известным государственным деятелем той эпохи. Он, в частности, одним из первых применял анкеты для сбора статистических данных. Большой вклад в теорию и практику отечественной статистики внес Михаил Васильевич Ломоносов (1711-1765).
Подробное описание развития статистической науки и практики в России можно найти в трудах по истории социально-экономической ветви статистики (см., например, [5, 26]). К сожалению, в этих работах обычно не рассматривается развитие отечественной вероятностно-статистической научной школы (см., например, [3]). О причинах такой однобокости скажем ниже.
Реформы императора Александра Второго, прежде всего создание земств (органов местного самоуправления), дали мощный стимул развитию статистики. Связано это было прежде всего с тем, что штатное расписание губернских и уездных земств, как правило, включало должность статистика. Так, к концу 1894 г. за 15 лет активной статистической деятельности были собраны, разработаны и опубликованы земствами материалы крестьянских подворных переписей по 172 уездам, охватившим около 4 миллионов крестьянских дворов – примерно четвертую часть всего населения России [5, стр.109].
Проведение статистических исследований было делом чести для отечественной интеллигенции. Так, Антон Павлович Чехов по собственной инициативе в 1890 г. перепись на Сахалине, лично опросив несколько тысяч каторжников [27].
Расцвет статистики в конце XIX века проявился в появлении большого числа оригинальных исследований, выполненных на высоком профессиональном уровне. Одна из них хорошо известна и в настоящее время, что объясняется личностью автора. Речь идет о книге В.И. Ульянова (Ленина) «Развитие капитализма в России. Процесс образования внутреннего рынка для крупной промышленности [2].» Она была издана в 1899 г., когда автору было 29 лет. По современным критериям за эту монографию автору можно было бы присудить ученую степень доктора экономических наук. Это утверждение свидетельствует не только о высоком профессиональном уровне В.И. Ульянова как исследователя, но и об известной деградации социально-экономической статистики за последние сто лет.
Наибольшие достижения в XX веке были получены в России в математической статистике. Упомянем работы А.А. Чупрова (1874 – 1926) по теории корреляции. Несколько позже началась деятельность А.Н. Колмогорова.
Среди математиков ХХ столетия академик АН СССР А.Н. Колмогоров (1903-1987) должен быть назван первым. Именно его работы дали первоначальный толчок дальнейшему развитию ряда направлений, важных для современных статистических методов. Зачастую еще 50-70 лет назад А.Н. Колмогоров рассматривал те проблемы, которые только сейчас начинают широко обсуждаться.
Вероятностно-статистические методы исследования в работах А.Н.Колмогорова. С современной точки зрения [25] обсудим работы А.Н.Колмогорова по аксиоматическому подходу к теории вероятностей, критерию согласия эмпирического распределения с теоретическим, свойствам медианы как оценки центра распределения, эффекту «вздувания» коэффициента корреляции, теории средних величин, статистической теории кристаллизации металлов, методу наименьших квадратов, свойствам сумм случайного числа случайных слагаемых, статистическому контролю, несмещенным оценкам, аксиоматическому получению логарифмически нормального закона распределения при дроблении, методам обнаружения различий при экспериментах типа погодных.
Факты жизни и творчества А.Н. Колмогорова подробно рассмотрены в сборнике [28]. Его основные работы изданы в трех томах [29-31]. Андрей Николаевич считал, что хорошая математическая работа должна содержать простую идею (желательно геометрического характера), использовать «тонкую» аналитику, а хорошая и полезная прикладная работа должна опираться на фундаментальные теоретические основы.
Аксиоматический подход к теории вероятностей [32] позволил рассматривать теорию вероятностей и математическую статистику как часть математики, проводить рассуждения на математическом уровне строгости. В частности, было введено четкое различие между частотой и вероятностью, случайная величина стала рассматриваться как функция от элементарного исхода, и т.д. За основу методов статистического анализа данных стало возможным брать вероятностно-статистические модели, сформулированные в математических терминах. В результате удалось четко отделить строгие утверждения от обсуждения философских вопросов случайности, преодолеть подход на основе понятия равновозможности, имеющий ограниченное практическое значение. Наиболее существенно, что после работ А.Н.Колмогорова нет необходимости связывать вероятности тех или иных событий с пределами частот. Так называемые «субъективные вероятности» получили смысл экспертных оценок вероятностей.
После выхода (в 1933 г. на немецком языке и в 1936 г. – на русском) основополагающей монографии [32] аксиоматический подход к теории вероятностей стал общепринятым в научных исследованиях в этой области. Во многом перестроилось преподавание. Повысился научный уровень многих прикладных работ. Однако традиционный подход оказался живучим. С целью повышения строгости формулировок приходится помещать в наших учебниках ([16],[33] и др.) сводки терминов и определений в области вероятностно-статистических методов, опирающаяся на аксиоматику [32].
В послевоенные годы А.Н.Колмогоров формализовал понятие случайности на основе теории информации [31]. Грубо говоря, числовая последовательность является случайной, если ее нельзя заметно сжать (т.е. описать существенно короче) без потери информации. Однако этот подход не был предназначен для использования в прикладных работах и преподавании. Он представляет собой важное методологическое и теоретическое продвижение.
Критерии согласия. В работе 1933 г. «Об эмпирическом определении закона распределения» [30, с.134-141] А.Н.Колмогоров предложил и изучил «критерий Колмогорова». Пусть элементы выборки (независимые случайные величины) объема n имеют непрерывную функцию распределения F(x). Эмпирической функцией распределения Fn(x) называется доля элементов выборки, не превосходящих x. Критерий Колмогорова предназначен для проверки гипотезы
,
где F0(x) – заданная функция распределения. Его статистика имеет вид
В [30, с.134-141] показано, что функция распределения статистики Dn имеет предел,
и рассчитана первая таблица функции распределения Колмогорова
Работа [30, с.134-141] породила одно из основных направлений непараметрической статистики. И в настоящее время непараметрические критерии согласия (Колмогорова, Смирнова, омега-квадрат и др.) широко используются. Они были разработаны для проверки согласия с полностью известным теоретическим распределением. Основная идея критериев Колмогорова, омега-квадрат и аналогичных им состоит в измерении расстояния между функцией эмпирического распределения и функцией теоретического распределения. Различаются эти критерии видом расстояний в пространстве функций распределения. Расчетные формулы, таблицы распределений и критических значений широко распространены (см. [14] и главу 5 выше).
Часто возникает задача проверки гипотезы согласия эмпирического распределения с параметрическим семейством, например, с семейством нормальных, Вейбулла-Гнеденко или гамма-распределений. Представляется естественным оценить параметры распределения по выборке, а затем формально воспользоваться критериями согласия Колмогорова, Смирнова или омега-квадрат. При этом вместо фиксированной теоретической функции распределения подставляют функцию из параметрического семейства, в которой параметры заменены на их выборочные оценки. В отличие от классических критериев, при этом измеряются расстояния от эмпирической функции распределения до многообразий (в пространстве функций распределения), соответствующих параметрическим семействам. Развита [8] математическая техника проектирования в функциональных пространствах, которая позволяет строить методы проверки рассматриваемых гипотез.
Однако распределения таких критериев (как предельные, так и при конечных объемах выборок) существенно отличаются от распределений классических критериев согласия Колмогорова, Смирнова или омега-квадрат. Такие критерии в отличие от классических обычно называют "критериями согласия с параметрическим семейством типа Колмогорова-Смирнова и типа омега-квадрат". (Как показано в [35] на основе анализа исходных публикаций, корректно употреблять термины «критерий Колмогорова», «критерий Смирнова», «критерий типа Колмогорова-Смирнова», но нельзя говорить о несуществующем «критерии Колмогорова-Смирнова».) В [36] собраны основные факты о критериях согласия с параметрическими семействами типа Колмогорова-Смирнова и типа омега-квадрат и необходимые краткие таблицы. Современное положение дел в этой области отражено в [25]. Наиболее существенное продвижение в изучении критериев типа Колмогорова-Смирнова достигнуто Ю.Н.Тюриным [37].
«Вздувание» коэффициента корреляции – явление, обнаруженное А.Н.Колмогоровым в работе 1933 г. «К вопросу о пригодности найденных статистическим путем формул прогноза» [30, с. 161-167]. Предположим, что имеется много наборов предикторов (факторов, признаков). Для каждого из них строится наилучшее приближение отклика с помощью линейной функции от предикторов. Показателем качества приближения служит коэффициент корреляции между откликом и наилучшей линейной функцией от предикторов (в настоящее время чаще используют его квадрат, называемый коэффициентом детерминации). Эффект «вздувания» коэффициента корреляции состоит в том, что при увеличении числа проанализированных наборов предикторов заметно растет максимальный из соответствующих коэффициентов корреляции - показателей качества приближения. Создается впечатление, что тот набор предикторов, на котором достигается рассматриваемый максимум, дает хорошее приближение для отклика. Однако это приближение развеивается при попытке использовать соответствующую зависимость для прогноза – по новым данным коэффициент корреляции между откликом и ранее найденной линейной функцией от предикторов оказывается значительно меньшим.
В настоящее время весьма популярны методы поиска «наиболее информативного множества признаков» в регрессионном и дискриминантном анализе. Соответствующие алгоритмы, как правило, основаны на переборе большого числа наборов признаков. Поэтому, как показано в [38], актуальность работы А.Н.Колмогорова [30, с. 161-167] в настоящее время существенно повысилась. Эффект «вздувания» коэффициента корреляции является одним из проявлений неклассического поведения статистических характеристик в ситуации, когда одна и та же статистическая процедура осуществляется многократно, например, при множественных проверках статистических гипотез (см. раздел 4.5).
В течение полувека А.Н.Колмогоров интересовался статистическими постановками, в которых число неизвестных параметров растет вместе с объемом данных. К ним относится и работа [30, с. 161-167]. А в 1970-х годах он стимулировал исследования по т.н. «асимптотике Колмогорова»
,
где р - число параметров, n – объем выборки. Эта асимптотика весьма актуальна как для многомерного статистического анализа, так и для статистики нечисловых данных [39], а также для задач статистического приемочного контроля [16, раздел 13.5] и анализа социологических данных (см. главу 13).
Метод медианы в теории оценивания. Пусть X1, X2, …, Xn – независимые одинаково распределенные случайные величины с функцией распределения F и непрерывной плотностью f. Пусть μ и σ2 – соответственно математическое ожидание и дисперсия, а m – медиана распределения F (т.е. P{X1>m}>1/2 и P{X1<m}>1/2). Медиана всегда существует, но не всегда определяется однозначно. Обычно в качестве оценки для μ используют (в случае нормального закона, прежде всего) выборочное среднее арифметическое
,
обладающее при условии нормальности F оптимальными свойствами. Что делать, если распределение F отлично от нормального? В работе 1931 г. «Метод медианы в теории ошибок» [30, с.111-114] А.Н.Колмогоров предлагает в этом случае оценивать по выборке другую среднюю характеристику распределения – медиану m (для симметричных распределений эти две характеристики совпадают). Пусть Xn(k) – k-ая порядковая статистика, построенная по рассматриваемой выборке. Если n четно, то в качестве оценки mn медианы m возьмем Xn(n/2); если же n = 2k+1, то в качестве оценки m возьмем Xn(k) . С целью сравнения оценок и mn рассмотрим преобразованные величины
.
Согласно центральной предельной теореме предельное (при n → ∞) распределение величины является асимптотически нормальным с нулевым средним и дисперсией σ2. Можно показать [30, с.111-114], что распределение величины βn является асимптотически нормальным с нулевым средним и дисперсией σm = (1/2)/f(m), если f(m) отлично от 0. Мерой сравнительной точности обоих методов является отношение λ = σm/σ = (1/2)/[σf(m)]. В случае нормальной плотности f имеем λ = (π/2)1/2 ≈ 5/4. Как показал А.Н.Колмогоров [30, с.111-114], для унимодальных распределений отношение λ может принимать любое значение из интервала (0; ), но не может превосходить .
Средние по Колмогорову. Естественная система аксиом приводит к так называемым ассоциативным средним. Их общий вид нашел в 1930 г. А.Н.Колмогоров [29, с.136-138]. Теперь их называют «средними по Колмогорову». Для чисел X1, X2,...,Xn среднее по Колмогорову вычисляется как
G{(F(X1)+F(X2)+...+F(Xn))/n},
где F - строго монотонная функция (т.е. строго возрастающая или строго убывающая), G - функция, обратная к F. Среди средних по Колмогорову - много хорошо известных средних величин. Так, если F(x) = x, то среднее по Колмогорову - это среднее арифметическое. Для положительных X1, X2,...,Xn: если F(x) = ln x, то среднее по Колмогорову – это среднее геометрическое, если F(x) = 1/x, то среднее гармоническое, если F(x) = x2, то среднее квадратическое, и т.д. Однако такие популярные средние, как медиана и мода, нельзя представить в виде средних по Колмогорову. В настоящем учебнике к средним по Колмогорову обращались в связи с рассмотрением выбора алгоритмов для анализа данных, измеренных в той или иной шкале (см. раздел 10.3). Так, для алгоритмов усреднения установлено, что в шкале интервалов из всех средних по Колмогорову допустимым является только среднее арифметическое, а в шкале отношений - только степенные средние с F(x) = xс, (при с, отличном от 0) и среднее геометрическое. Таким образом, среднее геометрическое или среднее квадратическое температур (в шкале Цельсия) или расстояний не имеют смысла. В качестве среднего в шкале интервалов надо применять среднее арифметическое. А также можно использовать медиану или моду.
Статистической теории кристаллизации металлов посвящена работа 1937 г. [30, с. 178-182]. Построена модель возникновения центров кристаллизации и нарастания закристаллизованной массы. При широких допущениях найдена точная формула для вероятности p(t), с которой наудачу выбранная точка Р объема, заполненного подлежащим кристаллизации веществом, попадет в течение промежутка кристаллизации t внутрь уже закристаллизованной массы. С достаточным приближением можно считать, что доля вещества, закристаллизовавшегося за время t, также равно p(t). Рассчитано число центров кристаллизации, образующихся в течение всего процесса кристаллизации. Полученные в работе [30, с. 178-182] результаты до сих пор представляют интерес для всех специалистов, связанных с изучением и использованием процессов кристаллизации металлов и иных веществ.
Метод наименьших квадратов. В двух работах А.Н.Колмогорова [30, с.267-283, с. 283-288] 1946-1947 гг. построена геометрическая теория метода наименьших квадратов, выявляющая роль ортогонального проектирования на подпространства конечномерного евклидова пространства с целью получения оценок параметров. Эта идея затем широко использовалась как в научных исследованиях, так и при преподавании.
Вторая идея состоит в построении алгоритмов доверительного оценивания и проверки гипотез на основе предположения о нормальности распределения погрешностей измерения. К настоящему времени вторая идея изжила себя, поскольку установлено, что в подавляющем большинстве случаев распределение погрешностей заметно отличается от нормального (см. раздел 2.1). Поэтому современный подход (глава 6) к методу наименьших квадратов является непараметрическим, т.е. в определенном смысле наблюдается возврат к доколмогоровским взглядам.
Суммы случайного числа случайных слагаемых рассмотрены в работе 1949 г. [30, с.308-313], выполненной совместно с Ю.В.Прохоровым, в дальнейшем академиком АН СССР. Эта статья стимулировала исследования по важному для приложений виду предельных теорем (см. [40, с.300-312], [41 с.223-228]). Речь идет прежде всего о статистическом последовательном анализе [42], в частности, об изучении времени наблюдения в задаче последовательного различения двух простых гипотез. Предельные теоремы [43, 44] о суммах случайного числа случайных слагаемых находят применения в задачах статистического контроля качества и надежности по Вальду, в моделях управления запасами в логистике (см. раздел 8.3 и монографию [45]) и др.
Статистический контроль. А.Н.Колмогоров – основоположник современной теории статистического приемочного контроля в нашей стране. Более 150 лет статистические методы применяются в России для проверки соответствия продукции установленным требованиям, т.е. для сертификации. Так, еще в 1846 г. действительный член Петербургской академии наук М.В. Остроградский рассматривал задачу статистического контроля партий мешков муки или штук сукна армейскими поставщиками. Однако современный этап начался в 1951 г. с брошюры А.Н.Колмогорова [46]. С тех пор в России в статистическом контроле качества было сделано многое, особенно в области теории [47-49]. Вопросы статистического контроля постоянно рассматриваются на страницах журнала «Заводская лаборатория» - основного места публикации отечественных работ по статистическим методам [7, 19].
Большое значение для развития статистических методов управления качеством имеют статья А.Н.Колмогорова 1933 г. [30, с.134-141] о критерии согласия эмпирического распределения с теоретическим и статья 1950 г. о несмещенных оценках [30, с. 340-363]. Актуальность первой из них определяется недостатками в используемых до сих пор статистических методах управления качеством. Широко распространенные ошибки состоят в том, что для критериев согласия с параметрическими семействами используют критические значения классических критериев. При этом, например, гипотеза нормальности принимается гораздо чаще, чем следует. Поскольку в действующей нормативно-технической документации дальнейшие этапы анализа данных часто зависят от того, принимается нормальность или нет, то ошибки при такой проверке могут иметь далеко идущие последствия. Так, при анализе характеристик эластомерных материалов при ошибочном подходе из 30 выборок нормальность была отвергнута лишь для 2, а при правильном - для 26, т.е. в подавляющем большинстве случаев. Указанные ошибки встречаются в массе публикаций (хотя специалистам суть дела хорошо известна уже почти 50 лет [50]). Наиболее известным примером является полностью ошибочный ГОСТ 11.006-74 (СТ СЭВ 1190-78) "Прикладная статистика. Правила проверки согласия опытного распределения с теоретическим" (формально отменен в 1987 г., но продолжает использоваться как методический материал; об ошибочных стандартах по статистическим методам см. [19]).
Популярны и другие ошибки при применении рассматриваемых критериев согласия. Некоторые пытаются их использовать для сгруппированных данных, что приводит к излишне частому принятию гипотез [40]. Другие вместо эмпирической функции распределения рассматривают иные оценки теоретической функции распределения. Например, при использовании вероятностной бумаги удобно ординату точки, соответствующей i-ой порядковой статистике, установить равной (i-0.5)/n, а не i/n, как в классической эмпирической функции распределения. Возникает искушение построенную таким методом оценку использовать в критериях согласия вместо эмпирической функции распределения. Увы, распределение изменится (впрочем, в данном случае при росте объема выборки различие будет исчезать). Ряд ошибок рассмотрен в [14].
Несмещенные оценки. При оценивании по выборке параметров распределений (либо функций от них) рекомендуют использовать метод максимального правдоподобия, дающий при выполнении условий регулярности асимптотически оптимальные оценки. Однако часто возникают трудности с решением уравнений правдоподобия. Поэтому вместо оценок максимального правдоподобия применяют асимптотически им эквивалентные одношаговые оценки (см. раздел 3.2) или оценки иных видов. Среди последних популярными [52, гл.2] являются несмещенные оценки. При конечном объеме выборки оценки максимального правдоподобия в ряде случаев хуже несмещенных оценок [53]. Основная идея использования несмещенных оценок состоит по Колмогорову [30, с.340-363] в следующем. Во многих важных случаях эти оценки существуют. С другой стороны, чрезмерное разнообразие несмещенных оценок может быть значительно сокращено, если воспользоваться несмещенными оценками, которые выражаются через надлежащим образом выбранные достаточные статистики. Надо употреблять только несмещенные оценки, выражающиеся через достаточные статистики: оказывается, что при этом мы не суживаем круг задач, в котором несмещенные оценки существуют, и при переходе от произвольной (даже плохой) несмещенной оценки к осредненной оценке, выражающейся через достаточную статистику, мы можем только уменьшить дисперсию оценки. Имеет место [52, гл.2] теорема Рао – Блекуэлла – Колмогорова: оптимальная оценка, если она существует, является функцией от достаточной статистики.
А.Н.Колмогоров первым ([30, с.340-363], [46]) применил несмещенные оценки в задачах статистического контроля. Он впервые использовал несмещенные оценки для определения эффективности реально используемых планов выборочного контроля по альтернативному признаку. На основе идей А.Н.Колмогорова рядом авторов были построены несмещенные оценки для предъявленного и пропущенного брака, для априорного распределения числа дефектных изделий в контролируемых партиях, а также получены несмещенные оценки при контроле по альтернативному и количественному признакам (см. [49], а также комментарии Ю.К. Беляева и Я.П. Лумельского в [30, с.522-523]). Несмещенные оценки основных показателей контроля включены в некоторые государственные стандарты (ГОСТ 24660-81, например).
Полученная А.Н.Колмогоровым несмещенная оценка плотности нормального распределения нашла широкое применение в задачах контроля по количественному признаку. В дальнейшем этот результат был перенесен на многомерное нормальное распределение, а также применен для задач статистической классификации. Метод проверки гипотез по совокупности малых выборок, разработанный нами в [45], также основан на использовании несмещенных оценок. Этот метод применяется при статистическом приемочном контроле по нескольким альтернативным признакам [16, раздел 13.5]. Отметим, что в этом случае оказывается нецелесообразным переход к осредненной оценке, выражающейся через достаточную статистику.
Введенные А.Н.Колмогоровым верхние и нижние оценки могут быть использованы и в тех случаях, когда несмещенные оценки не существуют. Именно так обстоит дело при оценивании пропущенного брака при биномиальном распределении и плане одноступенчатого контроля. Рядом авторов были получены верхние и нижние оценки функций неизвестных параметров, а также оценки с минимальным смещением.
О логнормальном законе распределения. В 1940 г. Н.К.Разумовский привел много случаев, в которых логарифмы размеров частиц (золотин в золотоносных россыпях, частиц горных пород при их дроблении и т.п.) приближенно подчиняются нормальному закону распределения. В 1941 г. А.Н. Колмогоров указал общую схему случайного процесса последовательного дробления частиц, при которой в пределе, при неограниченном продолжении дробления, нормальный закон для логарифмов размеров частиц может быть установлен теоретически [30, с.264-266]. (Напомним, что положительная случайная величина Х имеет логнормальный закон распределения, если логарифм величины Х имеет нормальный закон распределения; условия, при которых вероятностная модель приводит к нормальному закону, хорошо известны.)
Обнаружение различий. В семидесятых – восьмидесятых годах ХХ в. под научным руководством А.Н.Колмогорова на механико-математическом факультете МГУ им. М.В. Ломоносова работала группа исследователей, занимавшаяся статистическим анализом эффективности экспериментальных методов управления погодой. Речь идет об изменении количеств выпавших осадков, борьбе с градом и рассеянии туманов. Среди прочих [54] вероятностных моделей использовалась и следующая.
Имеется n объектов U1, U2, … . Un и с каждым объектом Uk связана пара чисел ak и bk, k = 1, 2, …, n. Пусть ε1, ε2, …, εn – последовательность независимых случайных величин, причем величина εk принимает значение 1 (считаем, что имеет место воздействие) с вероятностью рk и значение 0 (воздействие отсутствует) с вероятностью qk = 1 – pk, k = 1, 2, …, n. В результате наблюдений над объектами нам известны значения случайных пар (εk, Xk), k = 1, 2, …, n, где Xk = ak при εk = 0 и Xk = bk при εk = 1. Задача состоит в сравнении двух последовательностей a(n) = (a1, a2, …, an) и b(n) = (b1, b2, …, bn). Тем самым в этой модели (могущей быть использованной и в других случаях, когда необходимо установить наличие или отсутствие эффекта воздействия) предполагается, что числа ak и bk неслучайны и вся случайность связана с процессом рандомизации. С помощью оценок Горвица – Томпсона и их обобщений [55] можно построить [54] ряд статистических критериев для проверки гипотезы
H(n): A(n) = B(n),
где
.
А.Н.Колмогоров заметил, что дисперсии оценок в критериях могут быть заметно уменьшены, если имеются хорошие методы прогноза, позволяющие до начала наблюдений указывать оценки ak* и bk* для ak и bk соответственно. Полагая ak = ak* + Δak и bk = bk* + Δbk, мы можем упомянутые выше процедуры применить не к ak и bk, а к Δak и Δbk. При этом получаются оценки, правильные независимо от качества прогноза, но они будут лучше оценок без обращения к прогнозам лишь в случае хороших прогнозов, когда величины |Δak| и |Δbk| значительно меньше |ak| и |bk| соответственно.
Упомянем также работы А.Н.Колмогорова по теории стрельбы, выполненные в военные годы, по генетике и биологии, по лингвистике. Особенно велик вклад, сделанный А.Н.Колмогоровым и его учениками (М.Д.Миллионщиков, А.С.Монин, А.М. Обухов, А.М. Яглом и др.) в теорию турбулентности. Здесь прежде всего следует упомянуть знаменитый колмогоровский «закон двух третей» о распределении энергии в спектре турбулентности, полученный из простых соображений размерности (подробнее см. [28, с.445, 475], [29]).
Бесспорно, что многие работы А.Н.Колмогорова [29-31] представляют несомненный интерес для всех, кто разрабатывает или применяет статистические методы. Его мысли еще долго будут приносить нам всем практическую пользу. Отечественная вероятностно-статистическая научная школа порождена идеями А.Н. Колмогорова. Это хорошо видно на примере работ его ученика Б.В. Гнеденко.
Статистические методы в работах Бориса Владимировича Гнеденко. При анализе актуальных для XXI в. работ академика АН УССР Б.В. Гнеденко (1912 – 1995) основное внимание уделим предельным теоремам теории вероятностей, математической статистике, теории надежности, статистическим методам управления качеством и теории массового обслуживания. Одна из основных научных заслуг Б.В. Гнеденко - обоснование необходимости развития статистических методов как самостоятельного научного направления, подробное рассмотрение ряда проблем, относящихся к этому направлению.
В XXI веке наиболее ценным для нас является удивительное умение Б.В. Гнеденко (далее - Б.В.) объединить в своем творчестве глубокие теоретические изыскания и практические разработки. В настоящее время всё глубже становится разрыв между внутриматематическими изысканиями, от которых в обозримом будущем нельзя ждать практической пользы, и попытками решения прикладных задач методами, устаревшими на полвека. Уникальность Б.В. и состоит в том, что он своей личностью устранял этот пагубный разрыв. Он был одновременно великим теоретиком и великим прикладником. Чем больше проходит времени с того момента, как Б.В. завершил свои труды, тем яснее становится основополагающая роль его идей, его методологического подхода в нашей нынешней работе. Научный путь Б.В. заслуживает подробного осмысления.
Из теоретических исследований Б.В. больше всего известны работы по предельным теоремам теории вероятностей, в том числе классическая монография о суммах независимых случайных величин 1949 г., написанная совместно с А.Н. Колмогоровым, статьи по предельным распределениям крайних членов вариационного ряда. Основополагающие результаты получены им в математической статистике, например, в задаче проверки однородности двух выборок. Для прикладников Б.В. - лидер в области теории надежности, массового обслуживания, статистических методов управления качеством продукции. По его "Курсу теории вероятностей" учились многие поколения специалистов. Большое значение имеют работы по истории науки и по другим направлениям, среди которых особенно выделяется методология научных исследований.
От практики - к теории, от теории - к практике (четыре этапа научного пути). Научный путь Б. В. можно разбить на четыре этапа. Первый (1930-1934) прошел на кафедре математики текстильного института в г. Иваново, куда он был направлен в 1930 г. после окончания Саратовского университета. Именно там Б.В. пришел к глубокому убеждению, что полноценная творческая жизнь математика связана с широким использованием математических методов в решении задач практики и одновременном развитии самих математических методов, без чего невозможно глубокое изучение и удовлетворение потребностей практики. В ивановский период он увлекся теорией вероятностей.
Второй этап (1934-1945) - исследовательская работа в Москве. В 1934 г. Б.В. поступил в аспирантуру Московского университета. Его научными руководителями стали А. Я. Хинчин и А. Н. Колмогоров. Еженедельно собирался общегородской семинар по теории вероятностей, где с новыми результатами выступали известные ученые А.Н. Колмогоров, Е.Е. Слуцкий, Н.В. Смирнов, А.Я. Хинчин, а также аспиранты, молодые физики, биологи и инженеры. Б.В. увлекся предельными теоремами для сумм независимых случайных величин. В июне 1937 г. он защитил кандидатскую диссертацию "О некоторых результатах по теории безгранично-делимых распределений", а в начале июня 1941 г. - докторскую диссертацию, состоящую из двух частей: теории суммирования независимых случайных величин и теории распределения максимального члена вариационного ряда. В годы Великой Отечественной войны Б.В. Гнеденко принимал активное участие в решении многочисленных задач, связанных с обороной страны.
Третий этап научного пути Б.В. - украинский (1945-1960). В 1945 г. Академия наук Украинской ССР избрала Б.В. Гнеденко своим членом-корреспондентом и направила во Львов, где он восстанавливал Львовский университет и организовывал учреждения Академии наук УССР. Во Львове Б.В. Гнеденко читал разнообразные курсы: математический анализ, вариационное исчисление, теорию аналитических функций, теорию вероятностей, математическую статистику и др. Его научная работа в этот период также была весьма разнообразна. Ему удалось доказать в окончательной формулировке локальную предельную теорему для независимых, одинаково распределенных решетчатых слагаемых (1948 г.). Здесь начались исследования по непараметрическим методам статистики. Но, по нашему мнению, основное значение имела работа Б. В. Гнеденко над учебником "Курс теории вероятностей" [41] (первое издание - 1949 г.) и монографией "Предельные распределения для сумм независимых случайных величин" [56].
В 1950 г. Президиум АН УССР перевел Б.В. в Киев, где в Институте математики АН УССР был организован отдел теории вероятностей и математической статистики. Одновременно Б.В. заведовал кафедрой математического анализа в Киевском университете.
Естественно, что очень скоро вокруг него образовалась группа молодых ученых, увлекшаяся теорией вероятностей и задачами математической статистики. Первыми киевскими учениками Б.В. были В.С. Королюк и В.С. Михалевич, впоследствии известные ученые. Характерно для Б.В., что в Киеве он организовал городской семинар по истории математики при Институте математики АН УССР. Он объединил многих ученых, работающих в области истории науки.
В 1953-1954 гг. Б. В. работал в ГДР, а по возвращении Президиум АН УССР поручил ему возглавить работу по организации Вычислительного центра. Ядром группы ученых были сотрудники академика С.А. Лебедева, разработчика первой в Европе ЭВМ, получившей название МЭСМ (малая электронная счетная машина). Одновременно Б.В. возглавил работу по созданию курса программирования для ЭВМ, который начал читать студентам Киевского университета - будущим сотрудникам Вычислительного центра. Этот курс [57] - первая в СССР книга по программированию. Начались работы по проектированию универсальной машины «Киев» и специализированной машины для решения систем линейных алгебраических уравнений. В этот период Президиум АН УССР возложил на Б.В. Гнеденко обязанности директора Института математики АН УССР и председателя бюро физико-математического отделения.
Широкая организационная деятельность не ослабила научной и педагогической деятельности Б. В. Гнеденко. Именно к этому периоду относится начало разработки им двух новых направлений прикладных научных исследований - теории массового обслуживания и вопросов использования математических методов в современной медицине.
Четвертый этап научного пути (1960-1995) - снова Москва. В 1960 г. Б.В. переехал в Москву и возобновил работу в Московском университете. Сразу же Б.В. организовал московский семинар по математической теории надежности и теории массового обслуживания, привлекший многочисленных участников. Большое внимание Б.В. уделял разработке основ теории надежности, решению задач теории резервирования с восстановлением, оптимальной профилактики, управлению качеством промышленной продукции в процессе производства.
В 1965 г. А.Н. Колмогоров передает Б.В. руководство кафедрой теории вероятностей механико-математического факультета МГУ, которой Б.В. заведовал до своих последних дней.
Методологическими проблемами математики Б.В. систематически интересовался с конца 1950-х годов. Он - член научного совета при Президиуме АН СССР по философским проблемам естествознания. С первых дней Общества по распространению научных и политических знаний (общество «Знание») он принимает активное участие в его работе. Жизненному и научному пути Б.В. посвящена статья [58] и другие публикации.
Общее количество опубликованных научных трудов Б.В. - около тысячи. Рассмотрим подробнее основные направления его научной деятельности.
Суммирование независимых случайных величин. В 30-е годы внимание Б.В. привлекли задачи, связанные с суммированием независимых случайных величин (с.в.). Интерес к таким задачам появился в математике еще в 17 веке. Невозможность прямых вычислений распределений сумм независимых с.в. приводит к необходимости получения и изучения асимптотических формул для них, т. е. таких формул, которые позволяют находить с нужной точностью требующиеся нам вероятности, связанные с суммами с.в. Эти формулы даются предельными теоремами теории вероятностей. Таким образом, аппроксимация многократных сверток распределений потребовала развития глубокой математической теории, которая называется теорией предельных теорем для сумм независимых с.в. или теорией суммирования.
Начало развития этой теории связано с работами Я.Бернулли и А.Муавра начала 18 века, в которых были доказаны закон больших чисел (ЗБЧ) и центральная предельная теорема (ЦПТ) для независимых с.в., принимающих два значения. Эти исследования были продолжены в 19 веке П.Лапласом, С.Пуассоном, К.Гауссом и другими учеными, но вплоть до 1860-х гг. рассматривались лишь с.в., принимающие два значения. Лишь в 1867 г. П.Л.Чебышев получил ЗБЧ в общем виде, а достаточно общая форма ЦПТ была найдена лишь в работах А.М.Ляпунова и А.А.Маркова на рубеже 19 и 20 веков. Наиболее бурное развитие теории суммирования пришлось на 20 - 40 гг. 20 в. и связано с именами А.Н.Колмогорова, Б.В.Гнеденко, А.Я. Хинчина, П.Леви, В. Феллера и Дж. Линдеберга.
Класс возможных предельных распределений для сумм независимых случайных величин, как показали А.Я. Хинчин и Г.М. Бавли, совпадает с классом безгранично-делимых распределений. Оставалось выяснить условия существования предельных распределений и условия сходимости к каждому возможному предельному распределению. Заслуга постановки этих задач и их решения принадлежит Б.В. Он в 1937 г. предложил оригинальный метод, получивший название метода сопровождающих безгранично-делимых законов. Единым приемом удалось получить все ранее найденные в этой области результаты, а также и ряд новых.
В теории суммирования доказывались как интегральные предельные теоремы, то есть теоремы о сходимости ф.р., так и локальные теоремы, то есть теоремы о сходимости плотностей (для гладких распределений) и об асимптотическом поведении вероятностей отдельных значений для решетчатых распределений. В 20 - 40 гг. ХХ в. были получены исчерпывающие результаты о ЗБЧ в классической формулировке. Отметим, что законы больших чисел в пространствах нечисловой природы, найденные в последней четверти 20 в., формулировались и доказывались исходя из совсем иных подходов - не на основе суммирования, а на основе решений оптимизационных задач (см., например, [16, 33]).
Во всех разделах теории суммирования Б.В. получил фундаментальные результаты, пролившие свет на существо дела. Итогом развития классической теории суммирования явилась публикация в 1949 г. монографии Б.В.Гнеденко и А.Н.Колмогорова [56], которую можно назвать монументом создателям этой теории. Методы и результаты теории суммирования применяются в различных разделах теории вероятностей, статистических методов и их применений, а книга [56] остается источником новых идей для многих исследователей. Эта книга - одно из наиболее замечательных достижений математики ХХ века.
Предельные теоремы для крайних порядковых и разделимых статистик. Работы по предельным теоремам для крайних порядковых статистик публикуются уже в течение почти сотни лет, начиная с двадцатых годов ХХ в. Среди авторов таких публикаций: Додж, фон Мизес, Фреше, Фишер и Типпет, Б. де Финетти, Гумбель. В.Б. Невзоров и другие. Здесь наиболее полные и глубокие результаты получены Б.В. [59].
Пусть x1,..., xn - независимые одинаково распределенные с функцией распределения F случайные величины; тогда величины и называются крайними (или экстремальными) порядковыми статистиками, а также крайними членами вариационного ряда. Предположим, что для функции распределения F найдутся последовательности констант , для которых существуют невырожденные предельные (с ростом n) функции распределения G крайних членов преобразованной выборки Тогда согласно общей теории функция G имеет один из трех типов. Среди них широко используемое на практике распределение Вейбулла-Гнеденко [60]. Борисом Владимировичем получены необходимые и достаточные условия, относящиеся к F, чтобы получить тот или иной тип G.
Являясь выдающимся специалистом по теории суммирования независимых случайных величин, Б.В. решил результаты этой теории применить к суммированию зависимых случайных величин. Поэтому он проявил интерес [61] к таким случайным величинам совместное распределение которых совпадает с условным совместным распределением некоторых независимых случайных величин при условии фиксации суммы последних в некоторой точке. Отправляясь от величин можно построить [61] класс сумм зависимых случайных величин, называемых в отечественной литературе разделимыми статистиками. Распределения последних известным образом выражаются через распределения сумм соответствующих независимых случайных величин (векторов). Тем самым, для получения предельных (с ростом числа слагаемых) теорем для разделимых статистик надо воспользоваться результатами суммирования независимых величин или их многомерными аналогами - в случае векторов.
Теория массового обслуживания. Большим и весьма практически важным разделом современных статистических методов, в становление и развитие которого Б.В. внес неоценимый вклад, является теория массового обслуживания (ТМО). Первый цикл работ в этом направлении он выполнил в Иванове. В частности, он занимался изучением связи неровноты пряжи по номеру и весу, выяснением эффёктивности перехода от обслуживания одного станка к обслуживанию нескольких станков, оценкой длины среднего перехода между станками, который выполняет ткачиха в процессе обслуживания ткацких станков, выявлением особенностей метода станкообходов для нормирования рабочего времени станка и рабочего. Этой тематике посвящена первая книга Б.В. [61].
В опубликованной перед самой войной работе [62] Б.В. решает задачу определения среднего числа зарегистрированных счетчиком Гейгера-Мюллера частиц (известно, что в силу наличия «мертвой зоны» счетчик Гейгера-Мюллера регистрирует не все попадающие в него частицы). В терминах ТМО рассматриваемая модель может быть описана как однолинейная система массового обслуживания (СМО) с потерями, нестационарным пуассоновским входящим потоком и постоянным временем обслуживания. Заметим, что и к настоящему времени СМО с нестационарным входящим потоком исследованы крайне мало.
К задачам ТМО Б.В. возвращается в 50-е годов, хотя, по собственному признанию, уже во время войны он не раз размышлял над ними. И теперь до последних дней жизни это направление, наряду с теорией суммирования и математической теорией надежности, становится одним из основных в его научной деятельности. Б.В. обобщает формулы Эрланга на системы с ненадежными восстанавливаемыми приборами, рассматривая как случай с потерей требования при отказе прибора, так и случай перехода недообслуженного требования на другой свободный прибор, и т.д.
В 1956 г. Б.В. прочитал первый в СССР спецкурс по ТМО. В 1958 г. цикл его лекций по теории массового обслуживания был опубликован, а затем послужил основой для широко известной монографии [63], выпущенной в 1966 г. Эта книга и до сих пор остается одной из основополагающих при подготовке специалистов по ТМО не только в нашей стране, но и за рубежом. Отметим еще две его монографии ([64, 65]), оказавших значительное влияние на развитие ТМО.
В последующие годы Б.В. опубликовал еще более 30 статей, относящихся к ТМО. В этих статьях, наряду с решением отдельных задач по ТМО, он дает детальные обзоры существующих методов исследования, формулирует новые проблемные направления. Важнейшей задачей Б.В. считал пропаганду на всех уровнях, начиная от школьников и кончая профессиональными математиками и управленцами высокого уровня, широчайшего внедрения методов ТМО в инженерную практику.
О работах Б.В. в области математической статистики, теории надежности и контроля качества. Статистические методы были в центре научных и педагогических интересов Б.В. на протяжении всей его творческой жизни. «Каждому специалисту нужно знать математическую статистику» – так называется одна из его статей [66]. Уже в первых его публикациях, посвященных математическому анализу проблем текстильного производства, проявился живой интерес и умение Б.В. работать с реальными данными.
Мировую известность Б.В. как статистику принес цикл работ, выполненный им вместе со своими учениками и сотрудниками в конце 40-х – первой половине 50-х годов. Он изучал проблему проверки гипотезы однородности двух независимых выборок с помощью статистики, равной максимуму разности соответствующих эмпирических функций распределения (т.н. двухвыборочная односторонняя статистика Н.В. Смирнова). Б.В. предложил метод вычисления точного распределения статистики критерия для конечных выборок равного объема, позволивший получить простое доказательство найденных ранее Н.В. Смирновым предельных теорем и достаточно точные асимптотические разложения. А.Н. Колмогоров высоко оценил исследования Б.В. по непараметрической статистике [67]. И сейчас, через 50 лет, эти результаты Б.В. по-прежнему актуальны для применения математических методов исследования (см., например, раздел 14.6 выше).
По статистике Б.В. опубликовал более 50 работ. Среди них - посвященные проблемам статистического образования, а также приложениям статистических методов в технических исследованиях, теории надежности и контроле качества, экономике и социальных науках, биологии и медицине, во многих других областях.
Б.В. всегда был среди тех ученых, которые, с одной стороны, глубоко понимали необходимость развития вычислительной техники как основы и предпосылки внедрения результатов теоретических (и в том числе математико-статистических) исследований в практику; а с другой - предвидели широкие горизонты новых исследований, которые представляли высокопроизводительные компьютеры. Он не только руководил созданием Вычислительного центра АН УССР, но и был у истоков создания Института кибернетики АН УССР. Как уже отмечалось, Б.В. был написан первый в СССР учебник по программированию [57]. Начатые Б.В. в сотрудничестве с Н.М.Амосовым работы по машинной диагностике сердечных заболеваний во многих своих аспектах являются примером высококлассного прикладного статистического исследования, по своей тематике относящегося к проблемам классификации. К сожалению, Б.В. не дали завершить эти исследования. Являясь одним из виднейших математиков, работавших в то время на Украине, он был вынужден покинуть Киев и переехать в 1960 г. в Москву.
Вопросами теории надежности и проблемами управления (а значит, и контроля) качества Б.В. начал заниматься еще во второй половине 50-х годов. По мере знакомства с уровнем качества продукции промышленных предприятий в нем крепла уверенность в необходимости использования математических методов для объективной оценки качества и прогноза надежности изделий. К разработке математической теории надежности он привлек своих учеников И.Н. Коваленко, В.С. Королюка, Т.П. Марьяновича. Сам Б.В. в это время выполнил ряд прикладных работ, связанных с анализом надежности и методикой расчета нагрузки электрических сетей промышленных предприятий.
В Москве, будучи одним из создателей и признанным лидером советской школы математической теории надежности, Б.В. приобрел огромное неформальное влияние на развитие этой теории не только на всей территории СССР, но и далеко за ее пределами. Другой мощной школой в теории надежности является североамериканская. Две школы отличались по тематике исследований и во многом дополняли друг друга. Достижения этих школ 60–80-х годов до сих пор предопределяют мировое развитие теории надежности.
Продвижению результатов математической теории надежности в практику Б.В. придавал не меньшее значение, чем развитию самой математической теории. По его мнению, важнейшими аспектами востребованности и успешного применения практикой являются
(а) наличие в теории богатого набора математических моделей, отражающих разнообразные явления предметной области;
(б) наличие в предметной области специалистов, способных понять математические модели и превратить их в «руководящие указания» на производстве;
(в) наличие литературы самого разного уровня, отражающей достижения теории и практику ее применения;
(г) возможность прямого контакта между создателями теории и специалистами предметной области для взаимной корректировки задач теории и методов ее приложения в предметной области.
Все перечисленные выше моменты нашли счастливое сочетание в работе огромного незримого коллектива ученых и практиков, имевших отношение к созданию и приложению теории надежности и управлению качеством в СССР. Усилиями Б.В., его сотрудников и учеников с 1960 по 1985 гг. была разработана весьма разветвленная математическая теория надежности и математическая теория контроля качества. Была налажена широкая пропаганда необходимости практического использования теоретических результатов, в том числе по линии общества «Знание». Организованы семинары и лекционные курсы в Политехническом музее, в МГУ им. М.В. Ломоносова, а затем и во многих городах СССР, где инженерный состав получал необходимую математическую подготовку для понимания и применения методов теории надежности и контроля качества. В кабинете надежности при Политехническом музее все заинтересованные лица могли получить консультации у ведущих специалистов, включая и самого Б.В. Издательства «Советское радио» и «Знание» выпустили серию книг, посвященных различным аспектам теории надежности и контроля качества. Огромное влияние оказала основополагающая монография [68], а также ряд других монографий с участием Б.В., в частности, небольшая яркая книга [47].
Была развернута большая работа по подготовке специалистов высшей категории в области теории надежности. В руководстве ряда отраслей промышленности оказались специалисты, хорошо понимающие необходимость внедрения современных методов теории надежности и контроля качества. И во всем этом самое непосредственное участие принимал Б.В. В результате, достижения математической теории надежности и контроля качества нашли широкое признание, как в научных кругах, так и среди прикладников. Правда, с сожалением приходится констатировать, что в целом на реальный подъем качества продукции в стране, за исключением предприятий оборонно-промышленного комплекса, эти достижения сказались мало.
Развитие теории управления качеством и надежностью активно продолжается и в настоящее время. В частности, в журнале №заводская лаборатория» постоянно обсуждаются различные прикладные и теоретические проблемы управления качеством [7, 19]. В современных условиях реализация накопленного научного потенциала может дать значительное ускорение экономического роста как отдельных предприятий, так и страны в целом.
Конечно, нельзя не отметить и огромный личный вклад Б.В. в математическую теорию надежности. Предметом его наибольшего интереса была теория резервированных систем с восстановлением. Здесь им была поставлена задача, которая имела многочисленные продолжения в работах других математиков, а именно – задача об асимптотическом распределении момента первого отказа резервной группы с быстрым восстановлением. Б.В. удалось установить связь с асимптотической теорией суммирования случайного числа случайных слагаемых. И эта задача была им с блеском решена. Отметим, что подобные суммы используются не только в теории надежности, но и в различных иных прикладных областях, в частности, в логистике, т.е. науке о движении материальных, финансовых и информационных потоков (см., например, раздел 8.3 и монографию [45]).
И как здесь не вспомнить слова Б.В. о взаимообогащении фундаментальных и прикладных наук: «Я глубоко убежден в том, что прикладные проблемы не только дают возможность демонстрации силы математических методов и решения множества задач, необходимых для жизненной практики, но имеют огромное значение для развития самой математики. Дело в том, что в прикладных задачах часто приходится сталкиваться с совсем новыми ситуациями, о которых математик-теоретик не может догадаться. Традиционные методы математики недостаточны для решения возникающих вопросов, требуется разработка новых методов исследования и, возможно, – даже новых ветвей математики. Но практика важна для науки и тем, что именно практика выясняет возможности той или иной области математики для решения актуальных проблем других научных дисциплин и повседневных нужд общества. И, в конечном счете, ценность исследований математика будет определяться по тому, насколько широко и глубоко развиваемые им теории позволяют проникнуть в проблемы познания законов окружающего мира, помогают решению житейских проблем, касающихся всего общества. Чем теснее связана та или иная ветвь математики с практикой жизни, тем разнообразнее ее проблемы, тем быстрее она развивается. Так было, так есть и так будет» [69].
История математики и преподавание. Вскоре после создания Академии педагогических наук РСФСР (основана в 1943 г.) Б.В. был приглашен в Институт методов обучения. Итог его работы - книга [70], адресованная в первую очередь учителям и школьникам. Эта замечательная книга была первым достаточно полным исследованием истории математики в нашей стране.
Несомненной заслугой Б. В. является то, что он показал, что история математики необходима действующему математику. На Третьем Всесоюзном математическом съезде (1956) Б.В. перечислил магистральные направления историко-научных исследований в этой области. Он подчеркнул значение истории математики "а) для целей выяснения общих закономерностей развития математики, б) для выявления общих перспектив ее последующего развития, для выявления методологических установок науки, г) для выяснения связей с другими науками и роли математики в истории культуры, д) для целей преподавания и воспитания" [71, c.100].
Эти задачи Б.В. реализовывал на протяжении пятидесяти лет, написав более 180 работ по истории математики. Среди них - более 32 биографических статей, посвященных Н.И. Лобачевскому, П.Л. Чебышеву, М.В. Остроградскому, А.Н. Колмогорову и др. В фундаментальной работе [3] он прослеживает предысторию теории вероятностей, анализируя труды ученых, стоящих у истоков этой науки: Л. Пачолли (основатель бухгалтерского учета), Дж. Кардано, Н. Тартальи, Г. Галилея, Б. Паскаля, П. Ферма, Х. Гюйгенса. Б.В. мастерски умел показать в элементарных рассуждениях предшественников зерна более широких идей. Изложение столь понятно и интересно, что хочется заглянуть в первоисточники – труды Я.Бернулли, П.Л. Чебышева, П. Леви и других.
Наиболее известной книгой Б.В. - учебником "Курс теории вероятностей" - пользуются студенты университетов уже свыше полувека. Он выдержал несколько десятков изданий в СССР, США, ГДР, Японии и многих других странах. Совместно с А. Я. Хинчиным Б. В. написал научно-популярную книгу [72], которая также вот уже более пятидесяти лет пользуется огромной популярностью и выдержала множество изданий в СССР и за рубежом.
Б.В. уделял большое внимание вопросам преподавания. Он руководил научно-исследовательскими семинарами но программированному обучению, по вопросам преподавания в средней школе, был председателем секции теории вероятностей и математической статистики и секции средней школы Московского математического общества. Большое число статей было им опубликовано в журналах «Вестник высшей школы», «Математика в школе», в сборниках научно-методического совета Минвуза СССР.
Лекции Б.В. пользовались большим успехом в любой аудитории. Естественна попытка проанализировать те средства, которые использовал Б. В. для воздействия на слушателей во время лекций. Суть их в простоте, в уважении своих слушателей, в желании передать им те сведения, которые им необходимы; в демонстрации на ярких и доступных примерах важности того, о чем идет речь; в умении связывать общие идеи с различными частными задачами, которые близки интересам слушателей; в ненавязчивом, постоянном воспитании научного мировоззрения. И все это вместе взятое высказывалось Б. В. Гнеденко на лекциях так, что в каждый момент звучало нужное слово с нужной интонацией.
Охватывая в своем творчестве весь диапазон, который может попасть в поле зрения математика - от исходной практической проблемы до теоретической чисто математической задачи и затем от решения этой задачи обратно к практической проблеме - Б.В. вполне естественно обращался к осмыслению своего пути исследователя. Он посвящал методологическим исследованиям отдельные работы, постоянно обращался к проблемам таких исследований в книгах более общего характера [73]. Методологические вопросы постоянно обсуждались также в публикациях, посвященных роли математических методов исследования в научно-техническом прогрессе [74] или применению современных статистических методов в управлении качеством продукции [47].
Своей личностью, своей собственной научной, педагогической и организационной работой Б.В. Гнеденко показывал пример плодотворного единения теории и практики. И символично, что он в 1961 г. создал раздел «Математические методы исследования» в журнале «Заводская лаборатория» и возглавлял его более 30 лет. И сейчас для нас важны его выступления на страницах этого журнала [74, 75], в котором публикуются основные отечественные работы по статистическим методам.
В довоенный период советская вероятностно-статистическая наука прославилась двумя достижениями. Об одном – построении А.Н. Колмогоровым теории вероятностей на основе теории меры и интеграла Лебега – уже говорилось. Второе – разработка непараметрических критериев проверки согласия и однородности. Сначала фундаментальный результат – критерий согласия эмпирического с распределения с теоретическим (критерий Колмогорова) - был получен А.Н.Колмогоровым [30, с.134-141], затем дело взял в свои руки член-корреспондент АН СССР Николай Васильевич Смирнов (1900 - 1966).
О работах Н.В. Смирнова. Его основные научные труды опубликованы в сборнике [76], на который и будем ссылаться. Наиболее ценная книга ХХ в. по статистическим методам, на наш взгляд, подготовлена членами-корреспондентами АН СССР Л.Н. Большевым и Н.В. Смирновым. Это – «Таблицы математической статистики» [14]. Название не должно обманывать – весьма полезна начинающая книгу пояснительная часть (разделы с кратким и строжайше выверенным описанием классических статистических методов, примерами их применения, комментариями к таблицам). Учебники Н.В. Смирнова по статистическим методам и по сей день остаются среди лучших [77, 78].
Мы уже упоминали, что с работы Н.В Смирнова 1951 г. «О приближении плотностей распределения случайной величины» [15; 76, с.205-223] началось развитие такого перспективного, в том числе в статистике нечисловых данных [33, гл.11], направления, как непараметрические оценки плотности. Однако с его именем связывают «критерии Смирнова». Пусть Fn(t) – эмпирическая функция распределения, построенная по выборке объема n из непрерывной функции распределения F(t). Напомним, что согласно Л.Н. Большеву и Н.В. Смирнову [14] значение эмпирической функции распределения в точке х равно доле результатов наблюдений в выборке, меньших х. Одновыборочные критерии Смирнова, введенные в статье 1939 г. «Об уклонениях эмпирической функции распределения» [76, с.88-107], основаны на статистиках
.
Очевидно, критерий Колмогорова есть максимум этих двух статистик. Поэтому возникает желание объединить все три критерия в одну группу – группу критериев Колмогорова-Смирнова. Однако разработанные Н.В. Смирновым методы рассуждений, использованные для получения распределений рассматриваемых статистик, совершенно оригинальны. Они не имеют ничего общего с подходом А.Н. Колмогорова. Поэтому мы считаем, что надо говорить отдельно о критерии Колмогорова и отдельно о критериях Смирнова, а если уж надо объединить их вместе, то говорить о критериях типа Колмогорова-Смирнова, но не о критериях Колмогорова-Смирнова, поскольку употребление последнего выражения приводит к искажению исторической правды [35].
Двухвыборочные критерии Смирнова однородности двух независимых выборок были им предложены и изучены в 1939 г. (см. [76, с.117-127]). Единственное ограничение - функции распределения F(x) и G(x) должны быть непрерывными. Критерии Смирнова основан на использовании эмпирических функций распределения Fm(x) и Gn(x), построенных по первой и второй выборкам соответственно. Значение двухсторонней статистики Смирнова
сравнивают с соответствующим критическим значением (см., например, [14]) и по результатам сравнения принимают или отклоняют гипотезу Н0 о совпадении (однородности) функций распределения (подробнее – в главе 5). Практически значение статистики Dm,п рекомендуется согласно [14] вычислять по формулам
,
,
,
где x'1<x'2<…<x'm - элементы первой выборки x1,x2,…,xm , переставленные в порядке возрастания, а y'1<y'2<…<y'n - элементы второй выборки y1,y2,…,yn , также переставленные в порядке возрастания. Поскольку функции распределения F(x) и G(x) предполагаются непрерывными, то вероятность совпадения каких-либо выборочных значений равна 0. Статистики также могут быть использованы для проверки однородности двух независимых выборок. Их называют двухвыборочными односторонними статистиками Смирнова.
Статистика омега-квадрат (подробнее см. о ней в [45, гл.2.3])
также используется для проверки согласия эмпирического распределения с фиксированным теоретическим. Эту статистику в 1928-1931 гг. предлагали использовать Г. Крамер и Р. фон Мизес, однако ее предельное распределение вычислил в 1937 г. Н.В. Смирнов в статье «О распределении – критерия Мизеса» [76, с.60-78], что и позволило использовать эту статистику в практических расчетах. Поэтому статистику обычно называют также статистикой Крамера-Мизеса-Смирнова. Имеющаяся в статье [76, с.60-78] погрешность в формулировке леммы 6 (с.75, формула (97)) (пропущен множитель (-1)k из-за неправильного применения теории функций комплексного переменного) исправлена нами в статье [79].
Как следует из сказанного выше, А.Н. Колмогоров и Б.В.Гнеденко внесли огромный вклад в развитие статистических методов. Однако они занимались и многими другими проблемами (особенно А.Н. Колмогоров). Полностью посвятили себя статистическим методам в ХХ в. только два исследователя с академическими званиями – члены-корреспонденты АН СССР Н.В. Смирнов и Л.Н. Большев.
Логин Николаевич Большев (1922-1978) до конца Великой Отечественной войны участвовал в боевых действиях как летчик-истребитель. В 1951 г. окончил механико-математический факультет МГУ им. М.В. Ломоносова, будучи учеником А.Н. Колмогорова. Затем стал сотрудником Математического института АН СССР, в котором работал бок о Н.В. Смирновым, которого и сменил в 1966 г. на посту руководителя отдела математической статистики. Для работ Л.Н. Большева [80] характерно сочетание высокого математического уровня с направленностью на практические приложения статистических методов. Его безвременная кончина обозначила рубеж, после которого разрыв между математической статистикой и статистическими методами (включая прикладную статистику) стал в сложившихся отечественных условиях неизбежным.
Профессор В.В. Налимов как организатор науки. Профессор МГУ им Ломоносова, доктор технических наук Василий Васильевич Налимов (1910 - 1997), далее В.В., —создатель и руководитель нескольких новых научных направлений: метрологии количественного анализа, химической кибернетики, математической теории эксперимента и наукометрии. Занимался проблемами математизации биологии, анализом оснований экологического прогноза, вероятностными аспектами эволюции, проблемами языка и мышления, философией и методологией науки, проблемами человека в современной науке, вероятностной теорией смыслов. Свой жизненный путь описал в книге [81].
Известность пришла к В.В. после выхода книги «Применение математической статистики при анализе вещества» [82] – справочника по применению классических статистических методов в работе химиков-аналитиков. Поскольку В.В. пришел в статистические методы не из математики, а из практической деятельности в заводских лабораториях, то и книга его была ориентирована на потребности практики.
Следующим шагом было создание секции «Математические методы исследования» в журнале «Заводская лаборатория». Сейчас под названием журнала стоит: «Ежемесячный научно-технический журнал по аналитической химии, физическим, математическим и механическим методам исследования, а также сертификации материалов». У истоков секции стояли Б.В. Гнеденко и В.В., однако реально работу секции организовывал В.В. Налимов. Под его руководством она стала и остается поныне штабом развертывания исследований по статистическим методам в нашей стране.
В соответствии с тематикой журнала публикации секции посвящены в основном статистическим методам анализа данных измерений, наблюдений, испытаний, анализов, опытов. Большое значение придается математическим методам планирования экспериментов. В частности, при оптимизации технологических процессов в металлургической, химико-технологической, фармацевтической и иных отраслях промышленности применение методов экстремального планирования экспериментов позволяет заметно повысить выход продукта, обычно на 30-300%.
Ос
|