Пусть дискретная физическая величина Х может принимать в результате опыта значения . Отношение числа опытов , в результате которых величина принимает значение , к общему числу проведенных опытов n называется частотой появления события . Частота является случайной величиной и меняется в зависимости от количества проведенных опытов. Однако при большом количестве опытов (в пределе n → ∞) она стабилизируется около некоторого значения , называемого вероятностью события (статистическое определение):
Очевидно, что сумма вероятностей реализации всех возможных значений случайной величины равна единице:
Дискретную случайную величину можно полностью задать вероятностным рядом, указав вероятность для каждого значения :
Законом распределения случайной величины называют любое соотношение, устанавливающее связь между возможными значениями случайной величины и соответствующими им вероятностями. Вероятностный ряд является одним из видов законов распределения случайной величины. Распределение непрерывной случайной величины нельзя задать вероятностным рядом, поскольку число значений, которое она может принимать, так велико, что для большинства из них вероятность принять эти значения равна нулю. Поэтому для непрерывных физических величин изучается вероятность того, что в результате опыта значение случайной величины попадет в некоторый интервал. Удобно пользоваться вероятностью события , где - произвольное действительное число. Эта вероятность
является функцией от и называется функцией распределения (предельной функцией распределения, функцией распределения генеральной совокупности) случайной величины. В виде функции распределения можно задать распределение как непрерывной, так и дискретной случайной величины (рис. 2 и 3). F(x) является неубывающей функцией, т.е. если х1 ≤ х2, то F(х1) ≤ F(х2) (рис. 3).
Рис. 2. Функция распределения Рис. 3. Функция распределения
дискретной случайной величины. непрерывной случайной величины.
Ордината кривой , соответствующая точке , представляет собой вероятность того, что случайная величина при испытании окажется . Тогда вероятность того, что значения случайной величины будут лежать в интервале от , до , равна
Значения при предельных значениях аргумента равны , . Следует отметить, что функция распределения дискретной случайной величины всегда есть разрывная функция. Скачки происходят в точках, соответствующих возможным значениям этой величины, и равны вероятностям этих значений (рис. 2).
Даны определения Функции распределения случайной величины и Плотности вероятности непрерывной случайной величины. Эти понятия активно используются в статьях о статистике сайта . Рассмотрены примеры вычисления Функции распределения и Плотности вероятности с помощью функций MS EXCEL .
Введем базовые понятия статистики, без которых невозможно объяснить более сложные понятия.
Генеральная совокупность и случайная величина
Пусть у нас имеется генеральная совокупность (population) из N объектов, каждому из которых присуще определенное значение некоторой числовой характеристики Х.
Примером генеральной совокупности (ГС) может служить совокупность весов однотипных деталей, которые производятся станком.
Поскольку в математической статистике, любой вывод делается только на основании характеристики Х (абстрагируясь от самих объектов), то с этой точки зрения генеральная совокупность представляет собой N чисел, среди которых, в общем случае, могут быть и одинаковые.
В нашем примере, ГС - это просто числовой массив значений весов деталей. Х – вес одной из деталей.
Если из заданной ГС мы выбираем случайным образом один объект, имеющей характеристику Х, то величина Х является случайной величиной . По определению, любая случайная величина имеет функцию распределения , которая обычно обозначается F(x).
Функция распределения
Функцией распределения
вероятностей случайной величины
Х называют функцию F(x), значение которой в точке х равно вероятности события X F(x) = P(X Поясним на примере нашего станка. Хотя предполагается, что наш станок производит только один тип деталей, но, очевидно, что вес изготовленных деталей будет слегка отличаться друг от друга. Это возможно из-за того, что при изготовлении мог быть использован разный материал, а условия обработки также могли слегка различаться и пр. Пусть самая тяжелая деталь, произведенная станком, весит 200 г, а самая легкая - 190 г. Вероятность того, что случайно выбранная деталь Х будет весить меньше 200 г равна 1. Вероятность того, что будет весить меньше 190 г равна 0. Промежуточные значения определяются формой Функции распределения. Например, если процесс настроен на изготовление деталей весом 195 г, то разумно предположить, что вероятность выбрать деталь легче 195 г равна 0,5.
Типичный график Функции распределения
для непрерывной случайной величины приведен на картинке ниже (фиолетовая кривая, см. файл примера
): В справке MS EXCEL Функцию распределения
называют Интегральной
функцией распределения
(Cumulative
Distribution
Function
,
CDF
). Приведем некоторые свойства Функции распределения:
Напомним, что плотность распределения
является производной от функции распределения
, т.е. «скоростью» ее изменения: p(x)=(F(x2)-F(x1))/Dx при Dx стремящемся к 0, где Dx=x2-x1. Т.е. тот факт, что плотность распределения
>1 означает лишь, что функция распределения растет достаточно быстро (это очевидно на примере ). Примечание
: Площадь, целиком заключенная под всей кривой, изображающей плотность распределения
, равна 1. Примечание
: Напомним, что функцию распределения F(x) называют в функциях MS EXCEL интегральной функцией распределения
. Этот термин присутствует в параметрах функций, например в НОРМ.РАСП
(x; среднее; стандартное_откл; интегральная
). Если функция MS EXCEL должна вернуть Функцию распределения,
то параметр интегральная
, д.б. установлен ИСТИНА. Если требуется вычислить плотность вероятности
, то параметр интегральная
, д.б. ЛОЖЬ. Примечание
: Для дискретного распределения
вероятность случайной величине принять некое значение также часто называется плотностью вероятности (англ. probability mass function (pmf)). В справке MS EXCEL плотность вероятности
может называть даже "функция вероятностной меры" (см. функцию БИНОМ.РАСП()
). Понятно, что чтобы вычислить плотность вероятности
для определенного значения случайной величины, нужно знать ее распределение. Найдем плотность вероятности
для N(0;1) при x=2. Для этого необходимо записать формулу =НОРМ.СТ.РАСП(2;ЛОЖЬ)
=0,054 или =НОРМ.РАСП(2;0;1;ЛОЖЬ)
. Напомним, что вероятность
того, что непрерывная случайная величина
примет конкретное значение x равна 0. Для непрерывной случайной величины
Х можно вычислить только вероятность события, что Х примет значение, заключенное в интервале (а; b). 1) Найдем вероятность, что случайная величина, распределенная по (см. картинку выше), приняла положительное значение. Согласно свойству Функции распределения
вероятность равна F(+∞)-F(0)=1-0,5=0,5. НОРМ.СТ.РАСП(9,999E+307;ИСТИНА) -НОРМ.СТ.РАСП(0;ИСТИНА)
=1-0,5. 2) Найдем вероятность, что случайная величина, распределенная по , приняла отрицательное значение. Согласно определения Функции распределения,
вероятность равна F(0)=0,5. В MS EXCEL для нахождения этой вероятности используйте формулу =НОРМ.СТ.РАСП(0;ИСТИНА)
=0,5. 3) Найдем вероятность того, что случайная величина, распределенная по стандартному нормальному распределению
, примет значение, заключенное в интервале (0; 1). Вероятность равна F(1)-F(0), т.е. из вероятности выбрать Х из интервала (-∞;1) нужно вычесть вероятность выбрать Х из интервала (-∞;0). В MS EXCEL используйте формулу =НОРМ.СТ.РАСП(1;ИСТИНА) - НОРМ.СТ.РАСП(0;ИСТИНА)
. Все расчеты, приведенные выше, относятся к случайной величине, распределенной по стандартному нормальному закону
N(0;1). Понятно, что значения вероятностей зависят от конкретного распределения. В статье функции распределения
найти точку, для которой F(х)=0,5, а затем найти абсциссу этой точки. Абсцисса точки =0, т.е. вероятность, того что случайная величина Х примет значение <0, равна 0,5. В MS EXCEL используйте формулу =НОРМ.СТ.ОБР(0,5)
=0. Однозначно вычислить значение случайной величины
позволяет свойство монотонности функции распределения.
Обратная функция распределения
вычисляет , которые используются, например, при . Т.е. в нашем случае число 0 является 0,5-квантилем нормального распределения
. В файле примера
можно вычислить и другой квантиль
этого распределения. Например, 0,8-квантиль равен 0,84. В англоязычной литературе обратная функция распределения
часто называется как Percent Point Function (PPF). Примечание
: При вычислении квантилей
в MS EXCEL используются функции: НОРМ.СТ.ОБР()
, ЛОГНОРМ.ОБР()
, ХИ2.ОБР(),
ГАММА.ОБР()
и т.д. Подробнее о распределениях, представленных в MS EXCEL, можно прочитать в статье . Про случайную
величину Х говорят, что она имеет
распределение (распределена) с плотностью
Свойства
плотности вероятности непрерывной
случайной величины.
☺
☺ Геометрически
полученная вероятность равна площади
фигуры, ограниченной сверху кривой
распределения и опирающейся на отрезок
[а,b]
(рис. 3.8). Функция
распределения непрерывной случайной
величины может быть выражена через
плотность вероятности по формуле
: . Геометрически
функция распределения равна площади
фигуры, ограниченной сверху кривой
распределения и лежащей левее точки х
(рис. 3.9). Геометрически
свойства 1 и 4 плотности вероятности
означают, что ее график - кривая
распределения - лежит не ниже оси абсцисс,
и полная площадь фигуры, ограниченной
кривой распределения и осью абсцисс,
равна единице. Определение
.
Дискретная случайная величина Х имеет
биномиальный
закон распределения
с параметрами npq,
если она принимает значения 0, 1, 2,...,
m,...
,n с вероятностями где 0<р Как видим, вероятности
Р(Х=m)
находятся по формуле Бернулли,
следовательно, биномиальный закон
распределения представляет собой закон
распределения числа Х=m
наступлений события А в n независимых
испытаниях, в каждом из которых оно
может произойти с одной и той же
вероятностью р. Ряд распределения
биномиального закона имеет вид: Очевидно, что
определение биномиального закона
корректно, т.к. основное свойство ряда
распределения
Математическое
ожидание
случайной величины Х, распределенной
по биноминальному закону, а ее дисперсия
Определение
.
Дискретная
случайная величина Х имеет закон
распределения Пуассона
с параметром λ > 0, если она принимает
значения 0, 1, 2,..., m,
... (бесконечное, но счетное множество
значений) с вероятностями Ряд распределения
закона Пуассона имеет вид: Очевидно, что
определение закона Пуассона корректно,
так как основное свойство ряда
распределения
На рис. 4.1 показан
многоугольник (полигон) распределения
случайной величины, распределенной по
закону Пуассона Р(Х=m)=Р m (λ)
с параметрами λ
= 0,5, λ
= 1, λ
= 2, λ
= 3,5. Теорема
.
Математическое
oжидaниe и дисперсия
случайной величины, распределенной по
закону Пуассона, совпадают и равны
параметру λ
этого закона, т.е. и
Пусть $X$ -- непрерывная случайная величина с функцией распределения вероятностей $F(x)$. Напомним определение функции распределения: Определение 1
Функцией распределения называется функция $F(x)$ удовлетворяющая условию $F\left(x\right)=P(X Так как случайная величина является непрерывной, то, как нам уже известно, функция распределения вероятностей $F(x)$ будет непрерывной функцией. Пусть $F\left(x\right)$ также дифференцируема на всей области определения. Рассмотрим интервал $(x,x+\triangle x)$ (где $\triangle x$ - приращение величины $x$). На нем Теперь устремляя значения приращения $\triangle x$ к нулю, получим: Рисунок 1.
Таким образом, получаем: Плотность распределения, как и функция распределения, - это одна из форм закона распределения случайной величины. Однако закон распределения может быть записан через плотность распределения только для непрерывных случайных величин. Определение 3
Кривая распределения -- это график функции $\varphi \left(x\right)$ плотность распределения случайной величины (рис.1). Рисунок 2. График плотности распределения.
Геометрический смысл 1:
Вероятность попадания непрерывной случайной величины в интервал $(\alpha ,\beta)$ равна площади криволинейной трапеции, ограниченной графиком функции распределения $\varphi \left(x\right)$ и прямыми $x=\alpha ,$ $x=\beta $ и $y=0$ (рис. 2). Рисунок 3. Геометрическое изображение вероятности попадания непрерывной случайной величины в интервал $(\alpha ,\beta)$.
Геометрический смысл 2:
Площадь бесконечной криволинейной трапеции, ограниченной графиком функции распределения $\varphi \left(x\right)$, прямой $y=0$ и переменной прямой $x$ есть ни что иное как функция распределения $F(x)$(рис. 3). Рисунок 4. Геометрическое изображение функции вероятности $F(x)$ через плотность распределения $\varphi \left(x\right)$.
Пример 1
Пусть функция распределения $F(x)$ случайной величины $X$ имеет следующий вид. Дисперсия
непрерывной случайной величины X , возможные значения которой принадлежат всей оси Ох, определяется равенством:
Назначение сервиса
. Онлайн калькулятор предназначен для решения задач, в которых заданы либо плотность распределения
f(x) , либо функция распределения F(x) (см. пример). Обычно в таких заданиях требуется найти математическое ожидание, среднее квадратическое отклонение, построить графики функций f(x) и F(x)
. Инструкция
. Выберите вид исходных данных: плотность распределения f(x) или функция распределения F(x) .
Задана плотность распределения f(x): Задана функция распределения F(x): Непрерывная случайна величина задана плотностью вероятностей Случайную величину X называют непрерывной
, если ее функция распределения F(X)=P(X < x) непрерывна и имеет производную.
Вычисление плотности вероятности с использованием функций MS EXCEL
Вычисление вероятностей с использованием функций MS EXCEL
Вместо +∞ в формулу введено значение 9,999E+307= 9,999*10^307, которое является максимальным числом, которое можно ввести в ячейку MS EXCEL (так сказать, наиболее близкое к +∞).Плотность вероятности непрерывной случайной величины, ее определение, свойства и график.
на определенном участке оси абсцисс.
Плотность вероятности
,
как и функция распределения F(x), является
одной из форм закона распределения, но
в отличие от функции распределения она
существует толькодля
непрерывных
случайных
величин
.
Плотность вероятности иногда называют
дифференциальной
функцией
или дифференциальным
законом распределения
.
График плотности вероятности
называетсякривой
распределения
.
как
производная монотонно неубывающей
функции F(х).
☻
Согласно свойству
4 функции распределения
.
Так как F(x) - первообразная для плотности
вероятности
(т.к.
,
то по формуле Ньютона-Лейбница приращение
первообразной на отрезке [а,b]
– определенный интеграл
.
☻Случайная величина, распределенная по биномиальному закону, ее математическое ожидание и дисперсия. Закон распределения Пуассона.
выполнено, ибоесть не что иное, как сумма всех членов
разложения бинома Ньютона:
,
выполнено,
ибо сумма ряда.
"
(закон распределения Релея – применяется в радиотехнике). Найти M(x) , D(x) .
Функция распределения непрерывной случайной величины применяется для вычисления вероятностей попадания случайной величины в заданный промежуток:
P(α < X < β)=F(β) - F(α)
причем для непрерывной случайной величины не имеет значения, включаются в этот промежуток его границы или нет:
P(α < X < β) = P(α ≤ X < β) = P(α ≤ X ≤ β)
Плотностью распределения
непрерывной случайной величины называется функция
f(x)=F’(x) , производная от функции распределения.Свойства плотности распределения
1. Плотность распределения случайной величины неотрицательна (f(x) ≥ 0) при всех значениях x.
2. Условие нормировки:
Геометрический смысл условия нормировки: площадь под кривой плотности распределения равна единице.
3. Вероятность попадания случайной величины X в промежуток от α до β может быть вычислена по формуле
Геометрически вероятность попадания непрерывной случайной величины X в промежуток (α, β) равна площади криволинейной трапеции под кривой плотности распределения, опирающейся на этот промежуток.
4. Функция распределения выражается через плотность следующим образом:
Значение плотности распределения в точке x не равно вероятности принять это значение, для непрерывной случайной величины речь может идти только о вероятности попадания в заданный интервал. Пусть }