"Чистая"
и прикладная математика

Нормальное распределение непрерывной случайной величины

Нормальное распределение: теоретические основы

Нормальное распределение вероятностей непрерывной случайной величины (иногда - распределение Гаусса) можно назвать колоколообразным из-за того, что симметричная относительно среднего функция плотности этого распределения очень похожа на сечение колокола.

На рисунке ниже представлена функция плотности нормального распределения, график которой получен при рассчёте некоторой выборки данных в пакете программных средств STATISTICA. На ней столбцы гистограммы представляют собой значения выборки, распределение которых близко (или, как принято говорить в статистике, незначимо отличаются от) к собственно графику функции плотности нормального распределения, который представляет собой кривую красного цвета. На графике видно, что эта кривая действительно колоколообразная.

Для увеличения рисунка можно щёлкнуть по нему левой кнопкой мыши.

гистограмма значений выборки, подчиняющейся нормальному закону распределения

Нормальное распределение во многом ценно благодаря тому, что зная только математическое ожидание непрерывной случайной величины и стандартное отклонение, можно вычислить любую вероятность, связанную с этой величиной.

В очень многих случаях практики ошибки измерения распределяются по закону, близкому к нормальному.

Нормальное распределение имеет ещё и то преимущество, что один из наиболее простых в использовании статистических критериев, используемых для проверки статистических гипотез - критерий Стьюдента - может быть использован только в том случае, когда данные выборки подчиняются нормальному закону распределения.

Функцию плотности нормального распределение непрерывной случайной величины можно найти по формуле:

,

где x - значение изменяющейся величины, - среднее значение, - стандартное отклонение, e=2,71828... - основание натурального логарифма, =3,1416...

Свойства функции плотности нормального распределения

  • для всех значений аргумента функция плотности положительна;
  • если аргумент стремится к бесконечности, то функция плотности стреится к нулю;
  • функция плотности симметрична относительно среднего значения: ;
  • наибольшее значение функции плотности - у среднего значения: ;
  • кривая функции плотности выпукла в интервале и вогнута на остальной части;
  • мода и медиана нормального распределения совпадает со средним значением;
  • нормальное распределение симметрично, поэтому коэффициент ассиметрии A = 0.

Изменения среднего значения перемещают кривую функции плотности нормального распределения в направлении оси Ox. Если возрастает, кривая перемещается вправо, если уменьшается, то влево.

Если меняется стандартное отклонение, то меняется высота вершины кривой. При увеличении стандартного отклонения вершина кривой находится выше, при уменьшении - ниже.

Интегральная функция нормального распределения:

.

Стандартизованным или нормированным называется нормальное распределение, среднее значение которого , а стандартное отклонение .

Функция плотности стандартизованного нормального распределения:

.

Интегральная функция стандартизованного нормального распределения:

.

На рисунке ниже представлена интегральная функция стандартизованного нормального распределения, график которой получен при рассчёте некоторой выборки данных в пакете программных средств STATISTICA. Собственно график представляет собой кривую красного цвета, а значения выборки приближаются к нему.

интегральная функция стандартизированного нормального распределения

Для увеличения рисунка можно щёлкнуть по нему левой кнопкой мыши.

Стандартизация случайной величины означает переход от первоначальных единиц, используемых в задании, к стандартизованным единицам. Стандартизация выполняется по формуле

.

На практике все возможные значения случайной величины часто не известны, поэтому значения среднего и стандартного отклонения точно определить нельзя. Их заменяют средним арифметическим наблюдений и стандартным отклонением s. Величина z выражает отклонения значений случайной величины от среднего арифметического при измерении стандартных отклонений.

Практически в любом учебнике статистики в приложениях в конце книги можно найти таблицы значений функции плотности стандартизованного нормального распределения и интегральной функции. Чтобы использовать эти значения, нужно вычислить стандартизованное значение изменяющейся величины. Функция

позволяет определить вероятность того, что стандартизованное значение Z не меньше -z и не больше +z, где z - произвольно выбранное значение стандартизованной случайной величины.

Нормальное распределение и расчёты в MS Excel

Значения функции плотности f(x) и интегральной функции F(x) нормального распределения можно вычислить при помощи функции MS Excel НОРМ.РАСП. Окно для соответствующего расчёта показано ниже (для увеличения нажать левой кнопкой мыши).

окно ms excel для расчёта нормального распределения

MS Excel требует ввести следующие данные:

  • x - значение изменяющегося признака;
  • среднее значение;
  • стандартное отклонение;
  • интегральная - логическое значение: 0 - если нужно вычислить функцию плотности f(x) и 1 - если вероятность F(x).

Нормальное распределение: решения примеров

Пример 1. Предприятие производит детали, срок службы которых нормально распределён со средним значением 1000 и стандартным отклонением 200 часов.

Для случайно отобранной детали вычислим вероятность того, что её срок службы будет не менее 900 часов. Чтобы вычислить эту вероятность, используя таблицы, случайную величину нужно сначала стандартизовать. Затем можно использовать соответствующее значение интегральной функции из таблиц. Получаем:

Итак, вероятность того, что срок службы детали будет не менее 900 часов, составляет 69%.

Эту вероятность можно получить, используя функцию MS Excel НОРМ.РАСП (значение интегральной величины - 1):

P(X≥900) = 1 - P(X≤900) = 1 - НОРМ.РАСП(900; 1000; 200; 1) = 1 - 0,3085 = 0,6915.

Пример 2. В некотором городе среднегодовой доход семьи является нормально распределённой случайной величиной со средним значением 300000 и стандартным отклонением 50000. Известно, что доходы 40 % семей меньше величины A. Найти величину A.

Решение. Чтобы найти величину A, составим интегральную функцию:

Пользуясь статистическими таблицами, находим:

Ответ: доходы 40 % семей менее 287300.

Пример 3. О случайной величине X известно, что она нормально распределена, а вероятности того, что она составит 10 или меньше и больше 25, соответственно и . Найти среднее значение (математическое ожидание) случайной величины и её дисперсию.

Решение. Используем данные в условии задачи вероятности:

Пользуясь статистическими таблицами, находим:

Составляем систему из полученных равенств:

Решая систему, находим:

.

Начало темы "Теория вероятностей"