Задача. Есть некоторая кинемотографическая компания, которая произвела на свет 5 фильмов. Есть 1000 человек, которые суммарно сделали 3000 просмотров. Каждый человек как минимум смотрел 1 фильм. Т.е. кто-то смотрел 1 фильм, а кто-то 5. После каждого просмотра производился опрос, нравиться/не нравится, голосовали все. Вот такая выборка у нас есть.
Предполагаем что факторы влияющие на людей одинаковы в каждом фильме (качество фильма, длинна видео дорожки и т.д.)
Я предполагаю, что исходя из ЦПТ, учитывая что факторы не влияют на отдельный голос, распределение св (удовлетворенность просмотра фильма данной кинокомпании) будет нормальным. Посчитал МО, (общее кол-во голосов понравилось) / 3000 = 0,6
Посчитал среднеквадратичное отклонение
n=3000
xi = (кол-во голосов понравилось i-ого человека) / (кол-во голосов этого человека)
X со штрихом = 0,6
В итоге получилось что среднеквадратичное отклонение равно 0,4
Построил график плотности вероятностей в экселе, получилось так:
http://joxi.ru/brRYeQeudabWA1по иксу номера ячеек, там вот эти значения
http://joxi.ru/D2P8e3eh4D9Y23В итоге получается что СВ в моем случае может принимать значения меньше нуля и больше 1, хотя эсперимент то биноминальный понравилось / не понравилось. В чем же ошибка, или ошибки нет?
Я так понимаю, что ошибка в том, что я распределил не ожидание удовлетворенности фильмом, а фактические, наблюдаемые результаты.
Для того что бы распределить именно ожидание, необходимо выяснить какое ожидание у отдельно взятого человека, но как это сделать по моей выборке?