Вероятность попадания случайной величины на заданный интервал. Вероятность попадания нормально распределенной случайной величины в заданный интервал. Правило трёх сигма Вероятность попадания случайной величины в заданный интервал

Страница 1
Тест 7
Нормальный закон распределения. Вероятность попадания нормально распределенной случайной величины (НРСВ) в заданный интервал.
Основные сведения из теории.

Нормальным называют распределение вероятностей случайной величины (СВ) X , если плотность распределения определяется уравнением:

Где a – математическое ожидание СВ X ; - среднее квадратическое отклонение.

График
симметричен относительно вертикальной прямой
. Чем больше , тем больше размах кривой
. Значения функции
имеются в таблицах.

Вероятность того, что СВ X примет значение, принадлежащее интервалу
:
, где
- функция Лапласа. Функция
определяется по таблицам.

При =0 кривая
симметрична относительно оси ОУ- это стандартное (или нормированное) нормальное распределение.

Так как функция плотности вероятности НРСВ симметрична относительно математического ожидания, то можно простроить так называемую шкалу рассеивания:

Видно, что с вероятностью 0,9973 можно утверждать, что НРСВ примет значения в пределах интервала
. Это утверждение получило в теории вероятностей название “правила Трех сигм”.


1. Сравните величины для двух кривых НРСВ.

1)
2)


2. Непрерывная случайная величина Х задана плотностью распределения вероятностей
. Тогда математическое ожидание этой нормально распределенной случайной величины равно:

1) 3 2) 18 3) 4 4)

3. НРСВ Х задана плотностью распределения:
.

Математическое ожидание и дисперсия этой СВ равны:

1) =1 2) =5 3) =5

=25 =1 =25
4. Правило трех сигм означает, что:

1) Вероятность попадания СВ в интервал
, то есть близка к единице;

2) НРСВ не может выйти за пределы
;

3) График плотности НРСВ симметричен относительно математического ожидания

5. СВ Х распределена нормально с математическим ожиданием, равным 5 и СКО, равным 2 единицы. Выражение для плотности распределения этой НРСВ имеет вид:

1)

2)

3)

6. Математическое ожидание и СКО НРСВ Х равны 10 и 2. Вероятность того, что в результате испытания СВ Х примет значение, заключенное в интервале , составляет:

1) 0,1915 2) 0,3830 3) 0,6211


7. Деталь считается годной, если отклонение Х действительного размера от размера на чертеже по абсолютной величине меньше, чем 0,7 мм. Отклонения Х от размера на чертеже являются НРСВ со значением =0,4 мм. Изготовлено 100 деталей; из них годных будет:

1) 92 2) 64 3) 71


8. Математическое ожидание и СКО НРСВ Х равны 10 и 2. Вероятность того, что в результате испытания СВ Х примет значение, заключенное в интервале составляет:

1) 0,1359 2) 0,8641 3) 0,432


9. Погрешность Х изготовления детали является НРСВ со значением a =10 и =0,1. Тогда с вероятностью 0,9973 интервал размеров деталей, симметричный относительно a =10 будет:

1) 9,7; 10,3 2) 9,8; 10,2 3) 9,9; 10,1

10. Взвешивают все изделия без систематических ошибок. Случайные ошибки Х измерения подчинены нормальному закону со значением =10 г. Вероятность того, что взвешивание будет произведено с ошибкой не превосходящей по абсолютной величине 15 г составляет:

1) 0,8664 2) 0,1336 3) 0,4332


11. НРСВ Х имеет математическое ожидание a =10 и СКО =5. С вероятностью 0,9973 величина Х попадет в интервал:

1) (5; 15) 2) (0; 20) 3) (-5; 25)


12. НРСВ Х имеет математическое ожидание a =10. Известно, что вероятность попадания Х в интервал равна 0,3. Тогда вероятность попадания СВ Х в интервал будет равна:

1) 0,1 2) 0,2 3) 0,3


13. НРСВ Х имеет математическое ожидание a =25. Вероятность попадания Х в интервал равна 0,2. Тогда вероятность попадания Х в интервал будет равна:

1) 0,1 2) 0,2 3) 0,3


14. Температура в помещении поддерживается нагревателем и имеет нормальное распределение с
и
. Вероятность того, что температура в этом помещении будет в пределах от
до
составляет:

1) 0,95 2) 0,83 3) 0,67


15. Для стандартизованного нормального распределения величина равна:

1) 1 2) 2 3)

16. Эмпирическое нормальное распределение образуется в том случае, когда:

1) действует большое число независимых случайных причин, имеющих примерно одинаковый статистический вес;

2) действует большое число сильно зависимых между собой случайных величин;

3) объем выборки небольшой.


1

Значение определяет размах кривой плотности распределения относительно математического ожидания. Для кривой 2 размах больше, то есть


(2)

2

В соответствии с уравнением для плотности НРСВ математическое ожидание a =4.

(3)

3

В соответствии с уравнением для плотности НРСВ имеем: =1; =5, то есть
.

(1)

4

Верным является ответ (1).

(1)

5

Выражение для плотности распределении НРСВ имеет вид:
. По условию: =2; a =5, то есть верным является ответ (1).

(1)

6

По условию =10; =2. Интервал равен . Тогда:
;
.

По таблицам функции Лапласа:
; . Тогда искомая вероятность:



(2)

7

По условию: =0;
;=0,4. Значит интервал будет [-0,7; 0,7].


;
.

;

То есть из 100 деталей наиболее вероятно будет годных 92 штуки.


(1)



8

По условию: =10 и =2. Интервал равен . Тогда:
;
. По таблицам функции Лапласа:
;
;

(1)

9

В интервал, симметричный относительно математического ожидания a =10 с вероятностью 0,9973, попадают все детали, имеющие размеры, равные
, то есть ; . Таким образом:

(1)

10

По условию
,то есть =0, а интервал будет [-15;15]

Тогда:
;
.

Во многих задачах, связанных с нормально распределенными случайными величинами, приходится определять вероятность попадания случайной величины , подчиненной нормальному закону с параметрами , на участок от до . Для вычисления этой вероятности воспользуемся общей формулой

где - функция распределения величины .

Найдем функцию распределения случайной величины , распределенной по нормальному закону с параметрами . Плотность распределения величины равна:

. (6.3.2)

Отсюда находим функцию распределения

. (6.3.3)

Сделаем в интеграле (6.3.3) замену переменной

и приведем его к виду:

(6.3.4)

Интеграл (6.3.4) не выражается через элементарные функции, но его можно вычислить через специальную функцию, выражающую определенный интеграл от выражения или (так называемый интеграл вероятностей), для которого составлены таблицы. Существует много разновидностей таких функций, например:

;

и т.д. Какой из этих функций пользоваться – вопрос вкуса. Мы выберем в качестве такой функции

. (6.3.5)

Нетрудно видеть, что эта функция представляет собой не что иное, как функцию распределения для нормально распределенной случайной величины с параметрами .

Условимся называть функцию нормальной функцией распределения. В приложении (табл. 1) приведены таблицы значений функции .

Выразим функцию распределения (6.3.3) величины с параметрами и через нормальную функцию распределения . Очевидно,

. (6.3.6)

Теперь найдем вероятность попадания случайной величины на участок от до . Согласно формуле (6.3.1)

Таким образом, мы выразили вероятность попадания на участок случайной величины , распределенной по нормальному закону с любыми параметрами, через стандартную функцию распределения , соответствующую простейшему нормальному закону с параметрами 0,1. Заметим, что аргументы функции в формуле (6.3.7) имеют очень простой смысл: есть расстояние от правого конца участка до центра рассеивания, выраженное в средних квадратических отклонениях; - такое же расстояние для левого конца участка, причем это расстояние считается положительным, если конец расположен справа от центра рассеивания, и отрицательным, если слева.

Как и всякая функция распределения, функция обладает свойствами:

3. - неубывающая функция.

Кроме того, из симметричности нормального распределения с параметрами относительно начала координат следует, что

Пользуясь этим свойством, собственно говоря, можно было бы ограничить таблицы функции только положительными значениями аргумента, но, чтобы избежать лишней операции (вычитание из единицы), в таблице 1 приложения приводятся значения как для положительных, так и для отрицательных аргументов.

На практике часто встречается задача вычисления вероятности попадания нормально распределенной случайной величины на участок, симметричный относительно центра рассеивания . Рассмотрим такой участок длины (рис. 6.3.1). Вычислим вероятность попадания на этот участок по формуле (6.3.7):

Учитывая свойство (6.3.8) функции и придавая левой части формулы (6.3.9) более компактный вид, получим формулу для вероятности попадания случайной величины, распределенной по нормальному закону на участок, симметричный относительно центра рассеивания:

. (6.3.10)

Решим следующую задачу. Отложим от центра рассеивания последовательные отрезки длиной (рис. 6.3.2) и вычислим вероятность попадания случайной величины в каждый из них. Так как кривая нормального закона симметрична, достаточно отложить такие отрезки только в одну сторону.

По формуле (6.3.7) находим:

(6.3.11)

Как видно из этих данных, вероятности попадания на каждый из следующих отрезков (пятый, шестой и т.д.) с точностью до 0,001 равны нулю.

Округляя вероятности попадания в отрезки до 0,01 (до 1%), получим три числа, которые легко запомнить:

0,34; 0,14; 0,02.

Сумма этих трех значений равна 0,5. Это значит, что для нормально распределенной случайной величины все рассеивания (с точностью до долей процента) укладывается на участке .

Это позволяет, зная среднее квадратическое отклонение и математическое ожидание случайной величины, ориентировочно указать интервал её практически возможных значений. Такой способ оценки диапазона возможных значений случайной величины известен в математической статистике под названием «правило трех сигма». Из правила трех сигма вытекает также ориентировочный способ определения среднего квадратического отклонения случайной величины: берут максимальное практически возможное отклонение от среднего и делят его на три. Разумеется, этот грубый прием может быть рекомендован, только если нет других, более точных способов определения .

Пример 1. Случайная величина , распределенная по нормальному закону, представляет собой ошибку измерения некоторого расстояния. При измерении допускается систематическая ошибка в сторону завышения на 1,2 (м); среднее квадратическое отклонения ошибки измерения равно 0,8 (м). Найти вероятность того, что отклонение измеренного значения от истинного не превзойдет по абсолютной величине 1,6 (м).

Решение. Ошибка измерения есть случайная величина , подчиненная нормальному закону с параметрами и . Нужно найти вероятность попадания этой величины на участок от до . По формуле (6.3.7) имеем:

Пользуясь таблицами функции (приложение, табл. 1), найдем:

; ,

Пример 2. Найти ту же вероятность, что и в предыдущем примере, но при условии, что систематической ошибки нет.

Решение. По формуле (6.3.10), полагая , найдем:

.

Пример 3. По цели, имеющей вид полосы (автострада), ширина которой равна 20 м, ведется стрельба в направлении, перпендикулярном автостраде. Прицеливание ведется по средней линии автострады. Среднее квадратическое отклонение в направлении стрельбы равно м. Имеется систематическая ошибка в направлении стрельбы: недолет 3 м. Найти вероятность попадания в автостраду при одном выстреле.

Рис. 4. Плотность нормального распределения.

Пример 6. Определение числовых характеристик случайной величины по её плотности рассматривается на примере. Непрерывная случайная величина задана плотностью

Определить вид распределения, найти математическое ожидание M(X) и дисперсию D(X).

Решение. Сравнивая заданную плотность распределения с (1.16) можно сделать вывод, что задан нормальный закон распределения с m=4. Следовательно, математическое ожидание

M(X)=4, дисперсия D(X)=9.

Среднее квадратическое отклонение σ =3.

Функция нормального распределения (1.17) связана с функцией Лапласа, имеющей вид:

соотношение: Φ (− x ) = −Φ (x ). (Функции Лапласа нечётная). Значения функций f(x) и Ф(х) можно вычислить с помощью таблицы.

Нормальное распределение непрерывной случайной величины играет важную роль в теории вероятностей и при описании реальности, имеет очень широкое распространение в случайных явлениях природы. На практике очень часто встречаются случайные величины, образующиеся именно в результате суммирования многих случайных слагаемых. В частности, анализ ошибок измерения показывает, что они являются суммой разного рода ошибок. Практика показывает, что распределение вероятностей ошибок измерения близко к нормальному закону.

С помощью функции Лапласа можно решать задачи вычисления вероятности попадания в заданный интервал и заданного отклонения нормальной случайной величины.

3.4. Вероятность попадания в заданный интервал нормальной случайной величины

Если случайная величина Х задана плотностью распределения f(x), то вероятность того, что Х примет значение, принадлежащее заданному интервалу, вычисляется по формуле (1.9а). Подставив в формулу (1.9а) значение плотности распределения из (1.16) для нормального распределения N(a, σ ) и сделав ряд преобразований, вероятность того, что Х примет значение, принадлежащее заданному интервалу , будет равна:

P { x 1 ≤ X ≤ x 2 } = Φ(x 2 σ − а )

где: а – математическое ожидание.

−Φ(

x1 − а

Пример 7. Случайная величина Х распределена по нормальному закону. Математическое ожидание a=60, среднеквадратическое отклонение σ =20. Найти вероятность попадания случайной величины Х в заданный интервал (30;90).

Решение. Искомая вероятность вычисляется по формуле (1.18).

Получим: P(30 < X < 90) = Ф((90 – 60) / 20) –Ф((30 – 60)/20) = 2Ф(1,5).

По таблице Приложения 1: Ф(1,5) = 0,4332.. P(30 < X < 90)=2 Ф(1,5) = 2 0,4332 = 0,8664.

Вероятность попадания случайной величины Х в заданный интервал (30; 90) равна: P(30 < X < 90) = 0,8664.

3.5. Вычисление вероятности заданного отклонения нормальной случайной величины

Задачи вычисления вероятности отклонения нормальной случайной величины от заданного значения связаны с различного рода ошибками (измерения, взвешивания). Ошибки разного рода обозначаются переменной ε .

Пусть ε - отклонение нормально распределённой случайной величины Х по модулю. Требуется найти вероятность того, что отклонение случайной величины Х от математического ожидания не превысит заданного значения ε . Данная вероятность записывается в виде: P(|X–a| ≤ ε ). Предполагается, что в формуле (1.18) отрезок [х1 ; х2 ] симметричен относительно математического ожидания а. Таким образом: a–х1 =ε ; х2 –a =ε . Если эти выражения сложить, можно записать: х2 – х1 =2ε . Границы интервала [х1 ; х2 ] будут иметь вид:

х1 =а –ε ; х2 =а + ε .

В правую часть (1.18) подставляются значения х1 , х2 из (1.19), а выражение в фигурных скобках переписывается в виде двух неравенств:

1) х 1 ≤ X и заменяется в нём х1 согласно (1.19), получится: а–ε ≤ X или а–X ≤ ε .

2) X ≤ х 2 , аналогично заменяется х2 , получится: X ≤ а+ε или X–a ≤ ε .

Пример 8. Производится измерение диаметра детали. Случайные ошибки измерения принимаются за случайную величину Х и подчинены нормальному закону с математическим ожиданием а=0, со средним квадратическим отклонение σ =1 мм. Найти вероятность того, что измерение будет сделано с ошибкой, не превышающей по абсолютной величине 2 мм.

Решение. Дано: ε =2, σ =1мм, а=0.

По формуле (5.20): P (|X–0| ≤ 2) = 2Ф(ε /σ ) = 2Ф(2/1) = 2Ф(2,0).

Вероятность того, что измерение будет сделано с ошибкой, не превышающей по абсолютной величине 1мм равна:

P (|X| ≤ ε ) = 2 0,4772 = 0,9544.

Пример 9. Случайная величина, распределенная по нормальному закону с параметрами: а=50 и σ =15. Найти вероятность того, что отклонение случайной величина от своего математического ожидания – а будет меньше 5 ,т.е. P(|X–a| <5).

Решение. С учетом (1.18) будем иметь: P(|X– a| < ε )=2Ф(ε /σ );

Найдем функцию распределения случайной величины Х , подчиненной нормальному закону распределения:

сделаем в интеграле замену и приведем его к виду:

.

Интеграл не выражается через элементарные функции, но его можно вычислить через специальную функцию, выражающую определенный интеграл от выражения или . Выразим функцию через функцию Лапласа Ф(х):

.

Вероятность попадания случайной величины Х на участок (α, β) выражается формулой:

.

С помощью последней формулы можно оценить вероятность отклонения нормальной случайной величины от своего математического ожидания на заранее заданную сколь угодно малую положительную величину ε:

.

Пусть , тогда и . При t =3 получим , т.е. событие, заключающееся в том, что отклонение нормально распределенной случайной величины от математического ожидания, будет меньше , является практически достоверным.

В этом состоит правило трех сигм : если случайная величина распределена нормально, то абсолютная величина отклонения ее значений от математического ожидания не превосходит утроенного среднего квадратического отклонения.

Задача. Пусть диаметр изготовляемой цехом детали является случайной величиной, распределенной нормально, m = 4,5 см, см. Найти вероятность того, что размер диаметра наудачу взятой детали отличается от ее математического ожидания не более, чем на 1 мм.

Решение . Данная задача характеризуется следующими значениями параметров, определяющих искомую вероятность: , , Ф(0,2)=0,0793,

Контрольные вопросы

1. Какое распределение вероятностей называется равномерным?

2. Какой вид имеет функция распределения случайной величины, равномерно распределенной на отрезке [а; b ]?

3. Как вычислить вероятность попадания значений равномерно распределенной случайной величины в заданный промежуток?

4. Как определяется показательное распределение случайной величины?

5. Какой вид имеет функция распределения случайной величины, распределенной по показательному закону?

6. Какое распределение вероятностей называется нормальным?

7. Какими свойствами обладает плотность нормального распределения? Как влияют параметры нормального распределения на вид графика плотности нормального распределения?

8. Как вычислить вероятность попадания значений нормально распределенной случайной величины в заданный промежуток?

9. Как вычислить вероятность отклонения значений нормально распределенной случайной величины от ее математического ожидания?

10. Сформулируйте правило «трех сигма»?

11. Чему равны математическое ожидание, дисперсия и среднее квадратическое отклонение случайной величины, распределенной по равномерному закону на отрезке [а; b ]?

12. Чему равны математическое ожидание, дисперсия и среднее квадратическое отклонение случайной величины, распределенной по показательному закону с параметром λ?

13. Чему равны математическое ожидание, дисперсия и среднее квадратическое отклонение случайной величины, распределенной по нормальному закону с параметрами m и ?

Контрольные задания

1. Случайная величина Х распределена равномерно на отрезке [−3, 5]. Найти плотность распределения и функцию распределения Х . Построить графики обеих функций. Найти вероятности и . Вычислить математическое ожидание, дисперсию и среднее квадратическое отклонение Х .

2. Автобусы маршрута №21 идут регулярно с интервалом 10 мин. Пассажир выходит на остановку в случайный момент времени. Рассматривается случайная величина Х − время ожидания пассажиром автобуса (в мин.). Найти плотность распределения и функцию распределения Х . Построить графики обеих функций. Найти вероятность того, что пассажиру придется ждать автобуса не более пяти минут. Найти среднее время ожидания автобуса и дисперсию времени ожидания автобуса.

3. Установлено, что время ремонта видеомагнитофона (в днях) есть случайная величина Х , распределенная по показательному закону. Среднее значение времени ремонта видеомагнитофона равно 10 дням. Найти плотность распределения и функцию распределения Х . Построить графики обеих функций. Найти вероятность того, что на ремонт видеомагнитофона потребуется не менее 11 дней.

4. Изобразите графики плотности и функции распределения случайной величины Х , распределенной по нормальному закону с параметрами m = = − 2 и = 0,2.

Дисперсия нормальной случайной величины.

Дисперсия случайной величины есть математическое ожидание квадрата соответствующей центрированной случайной величины.

Она характеризует степень разброса значений случайной величины относительно ее математического ожидания, т.е. ширину диапазона значений.

Расчетные формулы:

Дисперсия может быть вычислена через второй начальный момент:

(6.10)

Дисперсия случайной величины характеризует степень рассеивания (разброса) значений случайной величины относительно ее математического ожидания. Дисперсия СВ (как дискретной, так и непрерывной) есть неслучайная (постоянная) величина.

Дисперсия СВ имеет размерность квадрата случайной величины. Для наглядности характеристики рассеивания пользуются величиной, размерность которой совпадает с размерностью СВ.

Средним квадратическим отклонением (СКО) СВ X называется характеристика

. (6.11)

СКО измеряется в тех же физических единицах, что и СВ, и характеризует ширину диапазона значений СВ.

Свойства дисперсии

Дисперсия постоянной величины с равна нулю.

Доказательство: по определению дисперсии

При прибавлении к случайной величине Х неслучайной величины с ее дисперсия не меняется.

D [X +c ] = D [X ].

Доказательство: по определению дисперсии

(6.12)

3. При умножении случайной величины Х на неслучайную величину с ее дисперсия умножается на с 2 .

Доказательство: по определению дисперсии

. (6.13)

Для среднего квадратичного отклонения это свойство имеет вид:

(6.14)

Действительно, при ½С½>1 величина сХ имеет возможные значения (по абсолютной величине), большие, чем величина Х. Следовательно, эти значения рассеяны вокруг математического ожидания М [сХ ] больше, чем возможные значения Х вокруг М [X ], т.е. . Если 0<½с½<1, то .

Правило 3s. Для большинства значений случайной величины абсолютная величина ее отклонения от математического ожидания не превосходит утроенного среднего квадратического отклонения, или, другими словами, практически все значения СВ находятся в интервале:

[ m - 3s ; m + 3 s; ].(6.15)

Вероятность попадания в заданный интервал нормальной случайной величины

Как уже было установлено, вероятность того, что непрерывная случайная величина примет значение, принадлежащее интервалу , равна определенному интегралу от плотности распределения, взятому в соответствующих пределах:
.
Для нормально распределенной случайной величины соответственно получим:
.
Преобразуем последнее выражение, введя новую переменную . Следовательно, показатель степени выражения, стоящего под интегралом преобразуется в:
.
Для замены переменной в определенном интеграле еще необходимо заменить дифференциал и пределы интегрирования, предварительно выразив переменную из формулы замены:
;
;
– нижний предел интегрирования;
– верхний предел интегрирования;
(для нахождения пределов интегрирования по новой переменной в формулу замены переменной были подставлены и – пределы интегрирования по старой переменной ).
Подставим все в последнюю из формул для нахождения вероятности:


где – функция Лапласа.
Вывод: вероятность того, что нормально распределенная случайная величина примет значение, принадлежащее интервалу , равна:
,
где – математическое ожидание, – среднее квадратическое отклонение данной случайной величины.

23. Распределения «хи-квадрат», Стьюдента и Фишера

С помощью нормального распределения определяются три распределения, которые в настоящее время часто используются при статистической обработке данных. В дальнейших разделах книги много раз встречаются эти распределения.

Распределение Пирсона (хи - квадрат) – распределение случайной величины

где случайные величины X 1 , X 2 ,…, X n независимы и имеют одно и тоже распределение N (0,1). При этом число слагаемых, т.е. n , называется «числом степеней свободы» распределения хи – квадрат.

Распределение хи-квадрат используют при оценивании дисперсии (с помощью доверительного интервала), при проверке гипотез согласия, однородности, независимости, прежде всего для качественных (категоризованных) переменных, принимающих конечное число значений, и во многих других задачах статистического анализа данных .

Распределение t Стьюдента – это распределение случайной величины

где случайные величины U и X независимы, U имеет распределение стандартное нормальное распределение N (0,1), а X – распределение хи – квадрат с n степенями свободы. При этом n называется «числом степеней свободы» распределения Стьюдента.

Распределение Стьюдента было введено в 1908 г. английским статистиком В. Госсетом, работавшем на фабрике, выпускающей пиво. Вероятностно-статистические методы использовались для принятия экономических и технических решений на этой фабрике, поэтому ее руководство запрещало В. Госсету публиковать научные статьи под своим именем. Таким способом охранялась коммерческая тайна, «ноу-хау» в виде вероятностно-статистических методов, разработанных В. Госсетом. Однако он имел возможность публиковаться под псевдонимом «Стьюдент». История Госсета - Стьюдента показывает, что еще сто лет назад менеджерам Великобритании была очевидна большая экономическая эффективность вероятностно-статистических методов.

В настоящее время распределение Стьюдента – одно из наиболее известных распределений среди используемых при анализе реальных данных. Его применяют при оценивании математического ожидания, прогнозного значения и других характеристик с помощью доверительных интервалов, по проверке гипотез о значениях математических ожиданий, коэффициентов регрессионной зависимости, гипотез однородности выборок и т.д. .