Доверительный интервал для математического ожидания

  • Точечная и интервальная оценки среднего значения
  • Точечная и интервальная оценки удельного веса

Доверительный интервал для математического ожидания — это такой вычисленный по данным
интервал, который с известной вероятностью содержит математическое ожидание генеральной совокупности.
Естественной оценкой для математического ожидания является среднее арифметическое её наблюденных значений.
Поэтому далее в течение урока мы будем пользоваться терминами «среднее», «среднее значение». В задачах
рассчёта доверительного интервала чаще всего требуется ответ типа «Доверительный интервал [95%; 90%; 99%] среднего числа
[величина в конкретной задаче] находится от [меньшее значение] до [большее значение]». С помощью
доверительного интервала можно оценивать не только средние значения, но и удельный вес того или иного признака
генеральной совокупности. Средние значения, дисперсия, стандартное отклонение и погрешность, через которые
мы будем приходить к новым определениям и формулам, разобраны на уроке Характеристики выборки и
генеральной совокупности
.

Точечная и интервальная оценки среднего значения

Если среднее значение генеральной совокупности оценивается числом (точкой), то за
оценку неизвестной средней величины генеральной совокупности принимается конкретное среднее, которое
рассчитано по выборке наблюдений. В таком случае значение среднего выборки — случайной величины
— не совпадает
со средним значением генеральной совокупности. Поэтому, указывая среднее значение выборки, одновременно
нужно указывать и ошибку выборки. В качестве меры ошибки выборки используется стандартная ошибка
, которая выражена
в тех же единицах измерения, что и среднее. Поэтому часто используется следующая запись:
.

Если оценку среднего требуется связать с определённой вероятностью, то интересующий
параметр генеральной совокупности нужно оценивать не одним числом, а интервалом. Доверительным
интервалом называют интервал, в котором с определённой вероятностью P находится значение оцениваемого
показателя генеральной совокупности. Доверительный интервал, в котором с вероятностью
P = 1 — α находится случайная
величина ,
рассчитывается следующим образом:

,

где
критическое значение стандартного нормального распределения для уровня значимости
α = 1 — P, которое можно найти
в приложении к практически любой книге по статистике.

На практике среднее значение генеральной совокупности
и дисперсия
не известны, поэтому дисперсия генеральной совокупности заменяется дисперсией выборки ,
а среднее генеральной совокупности — средним значением выборки . Таким образом, доверительный
интервал в большинстве случаев рассчитывается так:

.

Формулу доверительного интервала можно использовать для оценки среднего генеральной
совокупности, если

  • известно стандартное отклонение генеральной совокупности;
  • или стандартное отклонение генеральной совокупности не известно, но объём выборки — больше 30.

Среднее значение выборки
является несмещённой оценкой среднего генеральной совокупности .
В свою очередь, дисперсия выборки
не является несмещённой оценкой дисперсии генеральной совокупности .
Для получения несмещённой оценки дисперсии генеральной совокупности в формуле дисперсии выборки объём
выборки n следует заменить на n-1.

Пример 1. Собрана информация из 100 случайно выбранных кафе в
некотором городе о том, что среднее число работников в них составляет 10,5 со стандартным отклонением
4,6. Определить доверительный интервал 95% числа работников кафе.

Решение:

,

где
критическое значение стандартного нормального распределения для уровня значимости
α = 0,05.

Таким образом, доверительный интервал 95% среднего числа работников кафе
составил от 9,6 до 11,4.

Пример 2. Для случайной выборки из генеральной совокупности из 64
наблюдений вычислены следующие суммарные величины:

сумма значений в наблюдениях ,

сумма квадратов отклонения значений от среднего .

Вычислить доверительный интервал 95 % для математического ожидания.

Решение:

вычислим стандартное отклонение:

,

вычислим среднее значение:

.

Подставляем значения в выражение для доверительного интервала:

.

где
критическое значение стандартного нормального распределения для уровня значимости
α = 0,05.

Получаем:

.

Таким образом, доверительный интервал 95% для математического ожидания данной выборки
составил от 7,484 до 11,266.

Пример 3. Для случайной выборки из генеральной совокупности из 100
наблюдений вычислено среднее значение 15,2 и стандартное отклонение 3,2. Вычислить доверительный интервал
95 % для математического ожидания, затем доверительный интервал 99 %. Если мощность выборки и её
вариация остаются неизменными, а увеличивается доверительный коэффициент, то доверительный интервал
сузится или расширится?

Решение:

Подставляем данные значения в выражение для доверительного интервала:

.

где
критическое значение стандартного нормального распределения для уровня значимости
α = 0,05.

Получаем:

.

Таким образом, доверительный интервал 95% для среднего данной выборки
составил от 14,57 до 15,82.

Вновь подставляем данные значения в выражение для доверительного интервала:

.

где
критическое значение стандартного нормального распределения для уровня значимости
α = 0,01.

Получаем:

.

Таким образом, доверительный интервал 99% для среднего данной выборки
составил от 14,37 до 16,02.

Как видим, при увеличении доверительного коэффициента увеличивается также критическое
значение стандартного нормального распределения, а, следовательно, начальная и конечная точки интервала
расположены дальше от среднего, и, таким образом, доверительный интервал для математического ожидания
увеличивается.

Точечная и интервальная оценки удельного веса

Удельный вес
некоторого признака выборки можно интерпретировать как точечную оценку удельного веса p этого
же признака в генеральной совокупности. Если же эту величину нужно связать с вероятностью, то следует
рассчитать доверительный интервал удельного веса p признака в генеральной совокупности с
вероятностью P = 1 — α:

.

Пример 4. В некотором городе два кандидата A и B
претендуют на пост мэра. Случайным образом были опрошены 200 жителей города, из которых 46% ответили, что
будут голосовать за кандидата A, 26% — за кандидата B и 28% не знают, за кого будут
голосовать. Определить доверительный интервал 95% для удельного веса жителей города, поддерживающих
кандидата A.

Решение:

Таким образом, доверительный интервал 95% удельного веса горожан, поддерживающих
кандидата A, составил от 0,391 до 0,529.

Пример 5. Чтобы проверить отношение покупателей к новому квасу,
проведён опрос случайной выборки в 50 человек. Результаты обобщены в следующей таблице (0 — не понравился,
1 — понравился, 2 — нет ответа):

1 0 0 1 2
0 1 0 2 0
1 0 0 0 0
0 1 0 0 1
0 2 0 0 1
0 1 1 0 0
2 2 0 0 1
1 0 2 0 0
0 0 1 0 1
1 0 0 0 1

Найти доверительный интервал 95 % удельного веса покупателей, которым новый квас
не понравился.

Решение.

Найдём удельный вес указанных покупателей в выборке: 29/50 = 0,58.
Таким образом, ,
. Мощность выборки известна (n = 50).
Критическое значение стандартного нормального распределения для уровня значимости
α = 0,05 равно 1,96. Подставляем имеющиеся показатели
в выражение интервала для удельного веса:

Таким образом, доверительный интервал 95% удельного веса покупателей, которым
новый квас не понравился, составил от 0,45 до 0,71.

Ссылка на основную публикацию