Доверительный интервал для математического ожидания
Доверительный интервал для математического ожидания - это такой вычисленный по данным интервал, который с известной вероятностью содержит математическое ожидание генеральной совокупности. Естественной оценкой для математического ожидания является среднее арифметическое её наблюденных значений. Поэтому далее в течение урока мы будем пользоваться терминами "среднее", "среднее значение". В задачах рассчёта доверительного интервала чаще всего требуется ответ типа "Доверительный интервал [95%; 90%; 99%] среднего числа [величина в конкретной задаче] находится от [меньшее значение] до [большее значение]". С помощью доверительного интервала можно оценивать не только средние значения, но и удельный вес того или иного признака генеральной совокупности. Средние значения, дисперсия, стандартное отклонение и погрешность, через которые мы будем приходить к новым определениям и формулам, разобраны на уроке Характеристики выборки и генеральной совокупности.
Точечная и интервальная оценки среднего значения
Если среднее значение генеральной совокупности оценивается числом (точкой), то за
оценку неизвестной средней величины генеральной совокупности принимается конкретное среднее, которое
рассчитано по выборке наблюдений. В таком случае значение среднего выборки - случайной величины
- не совпадает
со средним значением генеральной совокупности. Поэтому, указывая среднее значение выборки, одновременно
нужно указывать и ошибку выборки. В качестве меры ошибки выборки используется стандартная ошибка
, которая выражена
в тех же единицах измерения, что и среднее. Поэтому часто используется следующая запись:
.
Если оценку среднего требуется связать с определённой вероятностью, то интересующий
параметр генеральной совокупности нужно оценивать не одним числом, а интервалом. Доверительным
интервалом называют интервал, в котором с определённой вероятностью P находится значение оцениваемого
показателя генеральной совокупности. Доверительный интервал, в котором с вероятностью
P = 1 - α находится случайная
величина ,
рассчитывается следующим образом:
,
где -
критическое значение стандартного нормального распределения для уровня значимости
α = 1 - P, которое можно найти
в приложении к практически любой книге по статистике.
На практике среднее значение генеральной совокупности
и дисперсия
не известны, поэтому дисперсия генеральной совокупности заменяется дисперсией выборки
,
а среднее генеральной совокупности - средним значением выборки
. Таким образом, доверительный
интервал в большинстве случаев рассчитывается так:
.
Формулу доверительного интервала можно использовать для оценки среднего генеральной совокупности, если
- известно стандартное отклонение генеральной совокупности;
- или стандартное отклонение генеральной совокупности не известно, но объём выборки - больше 30.
Среднее значение выборки
является несмещённой оценкой среднего генеральной совокупности
.
В свою очередь, дисперсия выборки
не является несмещённой оценкой дисперсии генеральной совокупности
.
Для получения несмещённой оценки дисперсии генеральной совокупности в формуле дисперсии выборки объём
выборки n следует заменить на n-1.
Пример 1. Собрана информация из 100 случайно выбранных кафе в некотором городе о том, что среднее число работников в них составляет 10,5 со стандартным отклонением 4,6. Определить доверительный интервал 95% числа работников кафе.
Решение:
,
где -
критическое значение стандартного нормального распределения для уровня значимости
α = 0,05.
Таким образом, доверительный интервал 95% среднего числа работников кафе составил от 9,6 до 11,4.
Пример 2. Для случайной выборки из генеральной совокупности из 64 наблюдений вычислены следующие суммарные величины:
сумма значений в наблюдениях ,
сумма квадратов отклонения значений от среднего .
Вычислить доверительный интервал 95 % для математического ожидания.
Решение:
вычислим стандартное отклонение:
,
вычислим среднее значение:
.
Подставляем значения в выражение для доверительного интервала:
.
где -
критическое значение стандартного нормального распределения для уровня значимости
α = 0,05.
Получаем:
.
Таким образом, доверительный интервал 95% для математического ожидания данной выборки составил от 7,484 до 11,266.
Пример 3. Для случайной выборки из генеральной совокупности из 100 наблюдений вычислено среднее значение 15,2 и стандартное отклонение 3,2. Вычислить доверительный интервал 95 % для математического ожидания, затем доверительный интервал 99 %. Если мощность выборки и её вариация остаются неизменными, а увеличивается доверительный коэффициент, то доверительный интервал сузится или расширится?
Решение:
Подставляем данные значения в выражение для доверительного интервала:
.
где -
критическое значение стандартного нормального распределения для уровня значимости
α = 0,05.
Получаем:
.
Таким образом, доверительный интервал 95% для среднего данной выборки составил от 14,57 до 15,82.
Вновь подставляем данные значения в выражение для доверительного интервала:
.
где -
критическое значение стандартного нормального распределения для уровня значимости
α = 0,01.
Получаем:
.
Таким образом, доверительный интервал 99% для среднего данной выборки составил от 14,37 до 16,02.
Как видим, при увеличении доверительного коэффициента увеличивается также критическое значение стандартного нормального распределения, а, следовательно, начальная и конечная точки интервала расположены дальше от среднего, и, таким образом, доверительный интервал для математического ожидания увеличивается.
Точечная и интервальная оценки удельного веса
Удельный вес
некоторого признака выборки можно интерпретировать как точечную оценку удельного веса p этого
же признака в генеральной совокупности. Если же эту величину нужно связать с вероятностью, то следует
рассчитать доверительный интервал удельного веса p признака в генеральной совокупности с
вероятностью P = 1 - α:
.
Пример 4. В некотором городе два кандидата A и B претендуют на пост мэра. Случайным образом были опрошены 200 жителей города, из которых 46% ответили, что будут голосовать за кандидата A, 26% - за кандидата B и 28% не знают, за кого будут голосовать. Определить доверительный интервал 95% для удельного веса жителей города, поддерживающих кандидата A.
Решение:
Таким образом, доверительный интервал 95% удельного веса горожан, поддерживающих кандидата A, составил от 0,391 до 0,529.
Пример 5. Чтобы проверить отношение покупателей к новому квасу, проведён опрос случайной выборки в 50 человек. Результаты обобщены в следующей таблице (0 - не понравился, 1 - понравился, 2 - нет ответа):
1 | 0 | 0 | 1 | 2 |
0 | 1 | 0 | 2 | 0 |
1 | 0 | 0 | 0 | 0 |
0 | 1 | 0 | 0 | 1 |
0 | 2 | 0 | 0 | 1 |
0 | 1 | 1 | 0 | 0 |
2 | 2 | 0 | 0 | 1 |
1 | 0 | 2 | 0 | 0 |
0 | 0 | 1 | 0 | 1 |
1 | 0 | 0 | 0 | 1 |
Найти доверительный интервал 95 % удельного веса покупателей, которым новый квас не понравился.
Решение.
Найдём удельный вес указанных покупателей в выборке: 29/50 = 0,58.
Таким образом, ,
. Мощность выборки известна (n = 50).
Критическое значение стандартного нормального распределения для уровня значимости
α = 0,05 равно 1,96. Подставляем имеющиеся показатели
в выражение интервала для удельного веса:
Таким образом, доверительный интервал 95% удельного веса покупателей, которым новый квас не понравился, составил от 0,45 до 0,71.
Назад<<< | Листать | Вперёд>>> |