Содержание
- Точечная и интервальная оценки среднего значения
- Точечная и интервальная оценки удельного веса
Доверительный интервал для математического ожидания — это такой вычисленный по данным
интервал, который с известной вероятностью содержит математическое ожидание генеральной совокупности.
Естественной оценкой для математического ожидания является среднее арифметическое её наблюденных значений.
Поэтому далее в течение урока мы будем пользоваться терминами «среднее», «среднее значение». В задачах
рассчёта доверительного интервала чаще всего требуется ответ типа «Доверительный интервал [95%; 90%; 99%] среднего числа
[величина в конкретной задаче] находится от [меньшее значение] до [большее значение]». С помощью
доверительного интервала можно оценивать не только средние значения, но и удельный вес того или иного признака
генеральной совокупности. Средние значения, дисперсия, стандартное отклонение и погрешность, через которые
мы будем приходить к новым определениям и формулам, разобраны на уроке Характеристики выборки и
генеральной совокупности.
Точечная и интервальная оценки среднего значения
Если среднее значение генеральной совокупности оценивается числом (точкой), то за
оценку неизвестной средней величины генеральной совокупности принимается конкретное среднее, которое
рассчитано по выборке наблюдений. В таком случае значение среднего выборки — случайной величины
— не совпадает
со средним значением генеральной совокупности. Поэтому, указывая среднее значение выборки, одновременно
нужно указывать и ошибку выборки. В качестве меры ошибки выборки используется стандартная ошибка
, которая выражена
в тех же единицах измерения, что и среднее. Поэтому часто используется следующая запись:
.
Если оценку среднего требуется связать с определённой вероятностью, то интересующий
параметр генеральной совокупности нужно оценивать не одним числом, а интервалом. Доверительным
интервалом называют интервал, в котором с определённой вероятностью P находится значение оцениваемого
показателя генеральной совокупности. Доверительный интервал, в котором с вероятностью
P = 1 — α находится случайная
величина ,
рассчитывается следующим образом:
,
где —
критическое значение стандартного нормального распределения для уровня значимости
α = 1 — P, которое можно найти
в приложении к практически любой книге по статистике.
На практике среднее значение генеральной совокупности
и дисперсия
не известны, поэтому дисперсия генеральной совокупности заменяется дисперсией выборки ,
а среднее генеральной совокупности — средним значением выборки . Таким образом, доверительный
интервал в большинстве случаев рассчитывается так:
.
Формулу доверительного интервала можно использовать для оценки среднего генеральной
совокупности, если
- известно стандартное отклонение генеральной совокупности;
- или стандартное отклонение генеральной совокупности не известно, но объём выборки — больше 30.
Среднее значение выборки
является несмещённой оценкой среднего генеральной совокупности .
В свою очередь, дисперсия выборки
не является несмещённой оценкой дисперсии генеральной совокупности .
Для получения несмещённой оценки дисперсии генеральной совокупности в формуле дисперсии выборки объём
выборки n следует заменить на n-1.
Пример 1. Собрана информация из 100 случайно выбранных кафе в
некотором городе о том, что среднее число работников в них составляет 10,5 со стандартным отклонением
4,6. Определить доверительный интервал 95% числа работников кафе.
Решение:
,
где —
критическое значение стандартного нормального распределения для уровня значимости
α = 0,05.
Таким образом, доверительный интервал 95% среднего числа работников кафе
составил от 9,6 до 11,4.
Пример 2. Для случайной выборки из генеральной совокупности из 64
наблюдений вычислены следующие суммарные величины:
сумма значений в наблюдениях ,
сумма квадратов отклонения значений от среднего .
Вычислить доверительный интервал 95 % для математического ожидания.
Решение:
вычислим стандартное отклонение:
,
вычислим среднее значение:
.
Подставляем значения в выражение для доверительного интервала:
.
где —
критическое значение стандартного нормального распределения для уровня значимости
α = 0,05.
Получаем:
.
Таким образом, доверительный интервал 95% для математического ожидания данной выборки
составил от 7,484 до 11,266.
Пример 3. Для случайной выборки из генеральной совокупности из 100
наблюдений вычислено среднее значение 15,2 и стандартное отклонение 3,2. Вычислить доверительный интервал
95 % для математического ожидания, затем доверительный интервал 99 %. Если мощность выборки и её
вариация остаются неизменными, а увеличивается доверительный коэффициент, то доверительный интервал
сузится или расширится?
Решение:
Подставляем данные значения в выражение для доверительного интервала:
.
где —
критическое значение стандартного нормального распределения для уровня значимости
α = 0,05.
Получаем:
.
Таким образом, доверительный интервал 95% для среднего данной выборки
составил от 14,57 до 15,82.
Вновь подставляем данные значения в выражение для доверительного интервала:
.
где —
критическое значение стандартного нормального распределения для уровня значимости
α = 0,01.
Получаем:
.
Таким образом, доверительный интервал 99% для среднего данной выборки
составил от 14,37 до 16,02.
Как видим, при увеличении доверительного коэффициента увеличивается также критическое
значение стандартного нормального распределения, а, следовательно, начальная и конечная точки интервала
расположены дальше от среднего, и, таким образом, доверительный интервал для математического ожидания
увеличивается.
Точечная и интервальная оценки удельного веса
Удельный вес
некоторого признака выборки можно интерпретировать как точечную оценку удельного веса p этого
же признака в генеральной совокупности. Если же эту величину нужно связать с вероятностью, то следует
рассчитать доверительный интервал удельного веса p признака в генеральной совокупности с
вероятностью P = 1 — α:
.
Пример 4. В некотором городе два кандидата A и B
претендуют на пост мэра. Случайным образом были опрошены 200 жителей города, из которых 46% ответили, что
будут голосовать за кандидата A, 26% — за кандидата B и 28% не знают, за кого будут
голосовать. Определить доверительный интервал 95% для удельного веса жителей города, поддерживающих
кандидата A.
Решение:
Таким образом, доверительный интервал 95% удельного веса горожан, поддерживающих
кандидата A, составил от 0,391 до 0,529.
Пример 5. Чтобы проверить отношение покупателей к новому квасу,
проведён опрос случайной выборки в 50 человек. Результаты обобщены в следующей таблице (0 — не понравился,
1 — понравился, 2 — нет ответа):
1 | 0 | 0 | 1 | 2 |
0 | 1 | 0 | 2 | 0 |
1 | 0 | 0 | 0 | 0 |
0 | 1 | 0 | 0 | 1 |
0 | 2 | 0 | 0 | 1 |
0 | 1 | 1 | 0 | 0 |
2 | 2 | 0 | 0 | 1 |
1 | 0 | 2 | 0 | 0 |
0 | 0 | 1 | 0 | 1 |
1 | 0 | 0 | 0 | 1 |
Найти доверительный интервал 95 % удельного веса покупателей, которым новый квас
не понравился.
Решение.
Найдём удельный вес указанных покупателей в выборке: 29/50 = 0,58.
Таким образом, ,
. Мощность выборки известна (n = 50).
Критическое значение стандартного нормального распределения для уровня значимости
α = 0,05 равно 1,96. Подставляем имеющиеся показатели
в выражение интервала для удельного веса:
Таким образом, доверительный интервал 95% удельного веса покупателей, которым
новый квас не понравился, составил от 0,45 до 0,71.