Найти распределение суммы случайных величин. Закон распределения суммы двух случайных величин

Пусть имеется система двух случайных величин X и Y , совместное распределение которых известно. Ставится задача найти распределение случайной величины . В качестве примеров СВ Z можно привести прибыль с двух предприятий; число определенным образом проголосовавших избирателей с двух разных участков; сумму очков на двух игральных костях.

1.Случай двух ДСВ. Какие бы значения ни принимали дискретные СВ (в виде конечной десятичной дроби, с разным шагом), ситуацию почти всегда можно свести к следующему частному случаю. Величины X и Y могут принимать только целые значения, т.е. где . Если изначально они являлись десятичными дробями, то целыми числами их можно сделать умножением на 10 k . А отсутствующим значениям между максимумами и минимумами можно приписать нулевые вероятности. Пусть известно совместное распределение вероятностей. Тогда, если пронумеровать строки и столбцы матрицы по правилам: , то вероятность суммы:

Элементы матрицы складываются по одной из диагоналей.

2. Случай двух НСВ. Пусть известна совместная плотность распределения . Тогда плотность распределения суммы:

Если X и Y независимы, т.е. , то

Пример 1. X , Y – независимые, равномерно распределенные СВ:

Найдём плотность распределения случайной величины .

Очевидно, что ,

СВ Z может принимать значения в интервале (c+d ; a+b ), но не при всех x . За пределами этого интервала . На координатной плоскости (x , z ) областью возможных значений величины z является параллелограмм со сторонами x =с ; x =a ; z=x+d ; z=x+b . В формуле для пределами интегрирования будут c и a . Однако ввиду того, что в производится замена y=z-x , при некоторых значениях z функция . Например, если c, то при z=x+c и любом x будем иметь: . Поэтому вычисление интеграла следует осуществлять по отдельности для различных областей изменения величины z , в каждой из которых пределы интегрирования будут разными, но при всех x и z . Проделаем это для частного случая, когда а+d < b+c . Рассмотрим три различные области изменения величины z и для каждой из них найдём .

1) c+d ≤ z ≤ a+d . Тогда

2) а+d ≤ z ≤ b+c . Тогда

3) b+c ≤ z ≤ a+b . Тогда

Такое распределение называется законом Симпсона. На рис.8, 9 изображены графики плотности распределения СВ при с =0, d =0.

ТЕМА 3

понятие функции распределения

математическое ожидание и дисперсия

равномерное (прямоугольное) распределение

нормальное (гауссово) распределение

Распределение

t - распределение Стьюдента

F - распределение

распределение суммы двух случайных независимых величин

пример: распределение суммы двух независимых

равномерно распределенных величин

преобразование случайной величины

пример: распределение гармонического колебания

со случайной фазой

центральная предельная теорема

моменты случайной величины и их свойства

ЦЕЛЬ ЦИКЛА

ЛЕКЦИЙ:

СООБЩИТЬ НАЧАЛЬНЫЕ СВЕДЕНИЯ О ВАЖНЕЙШИХ ФУНКЦИЯХ РАСПРЕДЕЛЕНИЙ И ИХ СВОЙСТВАХ

ФУНКЦИИ РАСПРЕДЕЛЕНИЯ

Пусть x(k) - некоторая случайная величина. Тогда для любого фиксированного значения x случайное событие x(k) x определяется как множество всех возможных исходов k таких, что x(k) x . В терминах исходной вероястностной меры, заданной на выборочном пространстве, функция распределения P(x) определяется как вероятность, приписанная множеству точек k x(k) x . Заметим, что множество точек k , удовлетворяющих неравенству x(k) x , является подмножеством совокупности точек, которые удовлетворяют неравенству x(k) . Формально

Очевидно, что

Если область значений случайной величины непрерывна, что и предполагается в дальнейшем, то плотность вероятности (одномерная) p(x) определяется дифференциальным соотношением

(4)

Следовательно,

(6)

Для того, чтобы можно было рассматривать дискретные случаи, следует допустить наличие в составе плотности вероятности дельта - функций.

МАТЕМАТИЧЕСКОЕ ОЖИДАНИЕ

Пусть случайная величина x(k) принимает значения из области от -  до + . Среднее значение (иначе, математическое ожидание или ожидаемое значение ) x(k) вычисляется с помощью соответствующего предельного перехода в сумме произведений значений x(k) на вероятности наступления этих событий:

(8)

где E - математическое ожидание выражения в квадратных скобках по индексу k . Аналогично определяется математическое ожидание действительной однозначной непрерывной функции g (x) от случайной величины x(k)

(9)

где p(x) - плотность вероятности случайной величины x(k). В частности, взяв g(x)=x, получим средний квадрат x(k) :

(10)

Дисперсия x(k) определяется как средний квадрат разности x(k) и ее среднего значения,

т. е. в этом случае g(x)= и

По определению, стандартное отклонение случайной величины x(k), обозначаемое , есть положительное значение квадратного корня из дисперсии. Стандартное отклонение измеряется в тех же единицах, что и среднее значение.

ВАЖНЕЙШИЕ ФУНКЦИИ РАСПРЕДЕЛЕНИЯ

РАВНОМЕРНОЕ (ПРЯМОУГОЛЬНОЕ) РАСПРЕДЕЛЕНИЕ.

Допустим, что эксперимент состоит в случайном выборе точки из интервала [a,b ] , включая его конечные точки. В этом примере в качестве значения случайной величины x(k) можно взять числовое значение выбранной точки. Соответствующая функция распределения имеет вид

Поэтому плотность вероятности задается формулой

В данном примере вычисление среднего значения и дисперсии по формулам (9) и (11) дает

НОРМАЛЬНОЕ (ГАУССОВО) РАСПРЕДЕЛЕНИЕ

, - среднее арифметическое, - СКО.

Значение z, соответствующее вероятности P(z)=1-, т. е.

ХИ - КВАДРАТ РАСПРЕДЕЛЕНИЕ

Пусть - n независимых случайных величин, каждая из которых имеет нормальное распределение с нулевым средним и единичной дисперсией.

Хи- квадрат случайная величина с n степенями свободы.

плотность вероятности .

DF: 100 - процентные точки - распределения обозначаются , т. е.

среднее значение и дисперсия равны

t - РАСПРЕДЕЛЕНИЯ СТЬЮДЕНТА

y, z - независимые случайные величины; y - имеет - распределение, z - нормально распределена с нулевым средним и единичной дисперсией.

величина - имеет t - распределение Стьюдента с n степенями свободы

DF: 100 - процентная точка t - распределения обозначается

Среднее значение и дисперсия равны

F - РАСПРЕДЕЛЕНИЕ

Независимые случайные величины; имеет - распределение с степенями свободы; распределение с степенями свободы. Случайная величина:

,

F распределенная случайная величина с и степенями свободы.

,

DF: 100 - процентная точка:

Среднее и дисперсия равны:

РАСПРЕДЕЛЕНИЕ СУММЫ

ДВУХ СЛУЧАЙНЫХ ВЕЛИЧИН

Пусть x(k) и y(k) – случайные величины, имеющие совместную плотность вероятности p(x,y). Найдем плотность вероятности суммы случайных величин

При фиксированном x имеем y= z– x. Поэтому

При фиксированном z значения x пробегают интервал от – до +. Поэтому

(37)

откуда видно, что для вычисления искомой плотности суммы нужно знать исходную совместную плотность вероятности. Если x(k) и y(k) – независимые случайные величины, имеющие плотности и соответственно, то и

(38)

ПРИМЕР: СУММА ДВУХ НЕЗАВИСИМЫХ, РАВНОМЕРНО РАСПРЕДЕЛЕННЫХ СЛУЧАЙНЫХ ВЕЛИЧИН.

Пусть две случайные независимые величины имеют плотности вида

В остальных случаях Найдем плотность вероятности p(z) их суммы z= x+ y.

Плотность вероятности для т. е. для Следовательно, x не превышает z . Кроме того, не равно нулю для По формуле (38) находим, что

Иллюстрация:

Плотность вероятности суммы двух независимых, равномерно распределенных случайных величин.

ПРЕОБРАЗОВАНИЕ СЛУЧАЙНОЙ

ВЕЛИЧИНЫ

Пусть x(t) - случайная величина с плотностью вероятности p(x), и пусть g(x) - однозначная действительная непрерывная функция от x . Рассмотрим сначала случай, когда обратная функция x(g) тоже является однозначной непрерывной функцией от g. Плотность вероятности p(g), соответсвующую случайной величине g(x(k)) = g(k), можно определить по плотности вероятности p(x) случайной величины x(k) и производной dg/dx в предположении, что производная существует и отлична от нуля, а именно:

(12)

Поэтому в пределе при dg/dx # 0

(13)

Используя эту формулу, следует в её правой части вместо переменной x подставить соответствующее значение g .

Рассмотрим теперь случай, когда обратная функция x(g) является действительной n -значной функцией от g , где n - целое и все n значений равновероятны. Тогда

(14)

ПРИМЕР:

РАСПРЕДЕЛЕНИЕ ГАРМОНИЧЕСКОЙ ФУНКЦИИ.

Гармоническая функция с фиксированными амплитудой X и частотой f будет случайной величиной, если её начальный фазовый угол = (k) - случайная величина. В частности, пусть t фиксировано и равно t o , и пусть гармоническая случайная величина имеет вид

Предположим, что (k) имеет равномерную плотность вероятности p() вида

Найдем плотность вероятности p(x) случайной величины x(k).

В этом примере прямая функция x() однозначно, а обратная функция (x) двузначна.

На практике часто возникает надобность находить закон распределения суммы случайных величин.

Пусть имеются система (Х ь Х 2) двух непрерывных с. в. и их сумма

Найдем плотность распределения с. в. У. В соответствии с общим решением предыдущего пункта, находим область плоскости где х+ х 2 (рис. 9.4.1):

Дифференцируя это выражение по у, получим п. р. случайной величины У= Х + Х 2:

Так как функция ф (х ь х 2) = Xj + х 2 симметрична относительно своих аргументов, то

Если с. в. Х и Х 2 независимы, то формулы (9.4.2) и (9.4.3) примут вид:


В случае, когда складываются независимые с. в. Х х и Х 2 , говорят о композиции законов распределения. Произвести композицию двух законов распределения - это значит найти закон распределения суммы двух независимых с. в., распределенных по этим законам. Для обозначения композиции законов распределения применяется символическая запись

которой по существу обозначаются формулы (9.4.4) или (9.4.5).

Пример 1. Рассматривается работа двух технических устройств (ТУ). Сначала работает ТУь после его выхода из строя (отказа) включается в работу ТУ 2 . Времена безотказной работы ТУ Ь ТУ 2 - Х х и Х 2 - независимы и распределены по показательным законам с параметрами А,1 и Х 2 . Следовательно, время Y безотказной работы ТУ, состоящего из ТУ! и ТУ 2 , будет определяться по формуле

Требуется найти п. р. случайной величины Y, т. е. композицию двух показательных законов с параметрами и Х 2 .

Решение. По формуле (9.4.4) получим (у > 0)


Если находится композиция двух показательных законов с одинаковыми параметрами (?ц = Х 2 = У), то в выражении (9.4.8) получается неопределенность типа 0/0, раскрывая которую, получим:

Сравнивая это выражение с выражением (6.4.8), убеждаемся в том, что композиция двух одинаковых показательных законов (?ц = Х 2 = X) представляет собой закон Эрланга второго порядка (9.4.9). При композиции двух показательных законов с различными параметрами Х х и А-2 получают обобщенный закон Эрланга второго порядка (9.4.8). ?

Задача 1. Закон распределения разности двух с. в. Система с. в. (Х и Х 2) имеет совместную п. р./(х ь х 2). Найти п. р. их разности У= Х - Х 2 .

Решение. Для системы с. в. (Х ь - Х 2) п. р. будет/(х ь - х 2), т. е. мы разность заменили суммой. Следовательно, п. р. случайной величины Убудет иметь вид (см. (9.4.2), (9.4.3)):

Если с. в. Х х иХ 2 независимы, то

Пример 2. Найти п. р. разности двух независимых показательно распределенных с. в. с параметрами Х х и Х 2 .

Решение. По формуле (9.4.11) получим

Рис. 9.4.2 Рис. 9.4.3

На рисунке 9.4.2 изображена п. р. g (у). Если рассматривается разность двух независимых показательно распределенных с. в. с одинаковыми параметрами (A-i = Х 2 = А,), то g (у) = /2 - уже знакомый

закон Лапласа (рис. 9.4.3). ?

Пример 3. Найти закон распределения суммы двух независимых с. в. Х и Х 2 , распределенных по закону Пуассона с параметрами а х и а 2 .

Решение. Найдем вероятность события (Х х + Х 2 = т) (т = 0, 1,



Следовательно, с. в. У= Х х + Х 2 распределена по закону Пуассона с параметром а х2) - а х + а 2 . ?

Пример 4. Найти закон распределения суммы двух независимых с. в. Х х и Х 2 , распределенных по биномиальным законам с параметрами п х ри п 2 , р соответственно.

Решение. Представим с. в. Х х в виде:

где Х 1) - индикатор события А ву"-м опыте:

Ряд распределения с. в. X,- имеет вид


Аналогичное представление сделаем и для с. в. Х 2: где Х] 2) - индикатор события А в у"-м опыте:


Следовательно,

где Х? 1)+(2) если индикатор события А:

Таким образом, мы показали, что с. в. Тесть сумма (щ + п 2) индикаторов события А , откуда следует, что с. в. ^распределена по биномиальному закону с параметрами (п х + п 2), р.

Заметим, что если вероятности р в различных сериях опытов различны, то в результате сложения двух независимых с. в., распределенных по биномиальным законам, получится с. в., распределенная не по биномиальному закону. ?

Примеры 3 и 4 легко обобщаются на произвольное число слагаемых. При композиции законов Пуассона с параметрами а ъ а 2 , ..., а т снова получается закон Пуассона с параметром а (т) = а х + а 2 + ... + а т.

При композиции биномиальных законов с параметрами (п ь р ); (я 2 , р) , (п т, р) снова получается биномиальный закон с параметрами («(«), Р), где п (т) = щ+ п 2 + ... + п т.

Мы доказали важные свойства закона Пуассона и биномиального закона: «свойство устойчивости». Закон распределения называется устойчивым, если при композиции двух законов одинакового типа получается закон того же типа (различаются только параметры этого закона). В подразделе 9.7 мы покажем, что таким же свойством устойчивости обладает нормальный закон.

Лицо, принимающее решения, может использовать страхование для уменьшения неблагоприятного финансового воздействия некоторых типов случайных событий.

Но это рассмотрение весьма общее, так как под лицом, принимающим решения, мог подразумеваться как отдельный человек, ищущий защиту от ущерба, причиняемого собственности, сбережениям или доходам, так и организация, ищущая защиту от того же рода ущерба.

На самом деле такой организацией может оказаться страховая компания, которая ищет способы защитить себя от финансовых потерь из-за слишком большого числа страховых случаев, произошедших с отдельным ее клиентом или с ее страховым портфелем. Такая защита называется перестрахованием .

Рассмотрим одну из двух моделей (а именно модель индивидуальных рисков ) широко используемых в определении страховых тарифов и резервов, а также в перестраховании.

Обозначим через S величину случайных потерь страховой компании по некоторой части ее рисков. В этом случае S является случайной величиной, для которой мы должны определить распределение вероятностей. Исторически для распределений с.в. S имелось два набора постулатов. Модель индивидуальных рисков определяет S следующим образом:

где с.в. бозначает потери, причиненные объектом страхования с номером i, а n обозначает общее количество объектов страхования.

Обычно предполагается, что являются независимыми случайными величинами, поскольку в этом случае проще математические расчеты и не требуется сведений о характере зависимости между ними. Второй моделью является модель коллективных рисков.

Рассматриваемая модель индивидуальных рисков не отражает изменения ценности денег с течением времени. Это делается для упрощения модели, и именно поэтому в заглавии статьи говорится о коротком интервале времени.

Будем рассматривать только замкнутые модели, т.е. те, в которых число объектов страхования n в формуле (1.1) известно и зафиксировано в самом начале рассматриваемого интервала времени. Если мы вводим предположения о наличии миграции из или в страховую систему, то получаем открытую модель.

Случайные величины, описывающие индивидуальные выплаты

Сначала напомним основные положения, касающиеся страхования жизни.

При страховании на случай смерти на срок один год страховщик обязуется выплатить величину b , если страхователь умрет в течение года с момента заключения договора страхования, и не выплачивает ничего, если страхователь проживет этот год.

Вероятность наступления страхового случая в течение указанного года обозначается через .

Случайная величина , описывающая страховые выплаты, имеет распределение, которое может задаваться либо функцией вероятностей

(2.1)

либо соответствующей функцией распределения

(2.2)

Из формулы (2.1) и из определения моментов получаем

(2.4)

Эти формулы можно также получить, записав X в виде

где — постоянная величина, выплачиваемая на случай смерти, а - случайная величина, принимающая значение 1 при наступлении смерти и 0 в противном случае.

Таким образом, и , и среднее значение и дисперсия с.в. равны и соответственно, а среднее значение и дисперсия с.в. равны и , что совпадает с выписанными выше формулами.

Случайная величина с областью значений {0,1} широко применяется в актуарных моделях.

В учебниках по теории вероятностей она называется индикатором , бернуллиевской случайной величиной или биномиальной случайной величиной в схеме единственного испытания.

Мы будем называть ее индикатором из соображений краткости, а также потому, что она указывает наступление, , или не наступление, , рассматриваемого события.

Перейдем к поиску более общих моделей, в которых величина страховой выплаты также является случайной величиной и в рассматриваемом интервале времени может произойти несколько страховых случаев.

Страхование на случай болезни, страхование автомобилей и прочих видов собственности, а также страхование гражданской ответственности сразу же предоставляют множество примеров. Обобщая формулу (2.5), положим

где - случайная величина, описывающая страховые выплаты в рассматриваемом интервале времени, с.в. обозначает общую величину выплат в этом интервале и с.в. является индикатором для события, состоящего в том, что произошел по меньшей мере один страховой случай.

Являясь индикатором такого события, с.в. фиксирует наличие () или отсутствие () страховых случаев в этом интервале времени, но не количество страховых случаев в нем.

Вероятность по-прежнему будет обозначаться через .

Обсудим несколько примеров и определим распределение случайных величин и в некоторой модели.

Рассмотрим сначала страхование на случай смерти на срок один год с дополнительной выплатой, если смерть наступила в результате несчастного случая.

Для определенности предположим, что если смерть произошла в результате несчастного случая, то величина выплаты составит 50000. При наступлении смерти по прочим причинам величина выплаты составит 25000.

Предположим, что для лица данного возраста, состояния здоровья и профессии вероятность смерти в результате несчастного случая в течение года равна 0,0005, а вероятность смерти по прочим причинам равна 0,0020. В виде формулы это выглядит так:

Суммируя по всем возможным значениям , получим

,

Условное распределение с. в. при условии имеет вид

Рассмотрим теперь страхование автомобилей от столкновений (возмещение выплачивается собственнику автомобиля за ущерб, нанесенный его автомобилю) с величиной безусловной франшизы 250 и с максимальным размером выплаты 2000.

Для наглядности предположим, что вероятность наступления одного страхового случая в рассматриваемый период времени для отдельного лица составляет 0,15, а вероятность наступления более чем одного столкновения равна нулю:

, .

Нереалистическое предположение о том, что в течение одного периода может произойти не более одного страхового случая, делается для того, чтобы упростить распределение с.в. .

Мы откажемся от этого предположения в следующем разделе после того, как рассмотрим распределение суммы нескольких страховых случаев.

Поскольку является величиной выплат страховщика, а не ущербом, нанесенным автомобилю, мы можем рассматривать две характеристики, и .

Во-первых, событие включает в себя те столкновения, в которых ущерб меньше, чем безусловная франшиза, которая равна 250.

Во-вторых, распределение с.в. будет иметь "сгусток" вероятностной массы в точке максимального размера страховых выплат, который равен 2000.

Предположим, что вероятностная масса, сосредоточенная в этой точке, равна 0,1. Далее, предположим, что величину страховых выплат в интервале от 0 до 2000 можно моделировать непрерывным распределением с функцией плотности, пропорциональной для (На практике непрерывная кривая, которая выбирается для представления распределения страховых выплат, является результатом исследований размеров выплат в предыдущем периоде.)

Суммируя эти предположения об условном распределении с.в. при условии , мы приходим к распределению смешанного типа, имеющему положительную плотность в интервале от 0 до 2000 и некоторый «сгусток» вероятностной массы в точке 2000. Это иллюстрируется графиком на рис. 2.2.1.

Функция распределения этого условного распределения выглядит так:

Рис.2.1. Функция распределения с.в. В при условии I = 1

Вычислим математическое ожидание и дисперсию в рассматриваемом примере с автомобильным страхованием двумя способами.

Во-первых, выпишем распределение с.в. и воспользуемся им для расчета и . Обозначая через функцию распределения с.в. , имеем

Для x <0

Это распределение смешанного типа. Как показано на рис. 2.2, оно имеет как дискретную («сгусток» вероятностной массы в точке 2000), так и непрерывную часть. Такой функции распределения соответствует комбинация функции вероятностей

Рис. 2.2. Функция распределения с.в. X = IB

и функции плотности

В частности, и . Поэтому .

Имеется ряд формул, связывающих моменты случайных величин с условными математическими ожиданиями. Для математического ожидания и для дисперсии эти формулы имеют вид

(2.10)

(2.11)

Подразумевается, что выражения в левых частях этих равенств вычисляются непосредственно по распределению с.в. . При вычислении выражений в правых частях, а именно и , используется условное распределение с.в. при фиксированном значении с.в. .

Эти выражения являются, таким образом, функциями с.в. , и мы можем вычислить их моменты, используя распределение с.в. .

Условные распределения используются во многих актуарных моделях, и это позволяет непосредственно применять выписанные выше формулы. В нашей модели . Рассматривая с.в. в качестве и с.в. в качестве , получаем

(2.12)

, (2.14)

, (2.15)

и рассмотрим условные математические ожидания

(2.16)

(2.17)

Формулы (2.16) и (2.17) определяют как функцию от с.в. , что может быть записано в виде следующей формулы:

Так как при , то (2.21)

Для мы имеем и (2.22)

Формулы (2.21) и (2.22) можно объединить: (2.23)

Таким образом, (2.24)

Подставляя (2.21), (2.20) и (2.24) в (2.12) и (2.13), мы получаем

Применим полученные формулы для вычисления и в примере автомобильного страхования (рис. 2.2). Поскольку функция плотности с.в. В при условии выражается формулой

причем P(B=2000|I=1) = 0,1, мы имеем

Наконец, полагая q = 0,15, из формул (2.25) и (2.26) мы получим следующие равенства:

Для описания другой страховой ситуации можно предложить другие модели для с.в. .

Пример: модель для числа смертей в результате авиационных катастроф

В качестве примера рассмотрим модель для числа смертей, произошедших в результате авиационных катастроф за годичный период деятельности авиакомпании.

Мы можем начать со случайной величины , описывающей число смертей для одного рейса, а потом просуммировать такие случайные величины по всем рейсам за год.

Для одного рейса событие будет обозначать наступление авиакатастрофы. Число смертей, которое повлекла за собой эта катастрофа, будет представляться произведением двух случайных величин и ,где - коэффициент загруженности самолета, т. е. число лиц, находившихся на борту в момент авиакатастрофы, и - доля смертельных исходов среди лиц, находившихся на борту.

Число смертей представляется именно таким образом, поскольку раздельная статистика для величин и бывает более доступной, чем статистика для с.в. . Итак, Хотя доля смертельных исходов среди лиц, находившихся на борту, и число лиц, находившихся на борту, вероятно, связаны между собой, в качестве первого приближения можно предположить, что с.в. и независимы.

Суммы независимых случайных величин

В модели индивидуальных рисков страховые выплаты, производимые страховой компанией, представляются как сумма выплат многим отдельным лицам.

Напомним два метода определения распределения суммы независимых случайных величин. Рассмотрим сначала сумму двух случайных величин,, выборочное пространство которых изображено на рис. 3.1.

Рис. 2.3.1. Событие

Прямая и область, находящаяся под этой прямой, представляют собой событие . Поэтому функция распределения с.в. S имеет вид (3.1)

Для двух дискретных неотрицательных случайных величин мы можем воспользоваться формулой полной вероятности и записать (3.1) в виде

Если X и Y независимы, последняя сумма может быть переписана в виде

(3.3)

Функция вероятностей, соответствующая этой функции распределения, может быть найдена по формуле

(3.4)

Для непрерывных неотрицательных случайных величин формулы, соответствующие формулам (3.2), (3.3) и (3.4), имеют вид

Когда либо одна, либо обе случайные величины X и Y имеют распределение смешанного типа (что характерно для моделей индивидуальных рисков), формулы аналогичны, но более громоздки. Для случайных величин, которые могут принимать также отрицательные значения, суммы и интегралы в приведенных формулах берутся по всем значениям у от до .

В теории вероятностей операция в формулах (3.3) и (3.6) называется сверткой двух функций распределения и и обозначается через . Операция свертки может также быть определена для пары функций вероятностей или функций плотности с помощью формул (3.4) и (3.7).

Для определения распределения суммы более чем двух случайных величин мы можем использовать итерации процесса взятия свертки. Для , где являются независимыми случайными величинами, обозначает функцию распределения с.в., а является функцией распределения с.в. , мы получим

Пример 3.1 иллюстрирует эту процедуру для трех дискретных случайных величин.

Пример 3.1. Случайные величины , и независимы и имеют распределения, которые определяются столбцами (1), (2) и (3) приведенной ниже таблицы.

Выпишем функцию вероятностей и функцию распределения с.в.

Решение. В таблице используются обозначения, введенные перед примером:

В столбцах (1)-(3) содержится имеющаяся информация.

Столбец (4) получен из столбцов (1) и (2) с применением (3.4).

Столбец (5) получен из столбцов (3) и (4) с применением (3.4).

Определение столбца (5) завершает нахождение функции вероятностей для с.в. . Ее функция распределения в столбце (8) является набором частичных сумм столбца (5), начиная сверху.

Для наглядности мы включили столбец (6), функцию распределения для столбца (1), столбец (7), который можно получить непосредственно из столбцов (1) и (6), применяя (2.3.3), и столбец (8), определяемый аналогично по столбцам (3) и (7). Столбец (5) можно определить из столбца (8) последовательным вычитанием.

Перейдем к рассмотрению двух примеров с непрерывными случайными величинами.

Пример 3.2. Пусть с.в. имеет равномерное распределение на интервале (0,2), и пусть с.в. не зависит от с.в. и имеет равномерное распределение на интервале (0,3). Определим функцию распределения с.в.

Решение. Поскольку распределения с.в. и непрерывны, воспользуемся формулой (3.6):

Тогда

Выборочное пространство с.в. и иллюстрируется рис. 3.2. Прямоугольная область содержит все возможные значения пары и . Интересующее нас событие, , изображается на рисунке для пяти значений s .

Для каждого значения прямая пересекает ось Y в точке s и прямую в точке . Значения функции для этих пяти случаев описываются следующей формулой:

Рис. 3.2. Свертка двух равномерных распределений

Пример 3.3. Рассмотрим три независимые с.в. . Для с.в. имеет показательное распределение и . Найдем функцию плотности с.в. , применяя операцию свертки.

Решение. Имеем

Воспользовавшись формулой (3.7) трижды, мы получим

Другой метод определения распределения суммы независимых случайных величин основан на единственности производящей функции моментов, которая для с.в. определяется соотношением .

Если это математическое ожидание конечно для всех t из некоторого открытого интервала, содержащего начало координат, то является единственной производящей функцией моментов распределения с.в. в том смысле, что не существует другой функции, отличной от , которая была бы производящей функцией моментов распределения с.в. .

Эту единственность можно использовать следующим образом: для суммы

Если независимы, то математическое ожидание произведения в формуле (3.8) равно ..., так что

Нахождение явного выражения для того единственного распределения, которое соответствует производящей функции моментов (3.9), завершило бы нахождение распределения с.в. . Если указать его в явном виде не удается, то можно проводить его поиск численными методами.

Пример 3.4 . Рассмотрим случайные величины из примера 3.3. Определим функцию плотности с.в. , пользуясь производящей функцией моментов с.в. .

Решение. Согласно равенству (3.9), что можно записать в виде с помощью метода разложения на простейшие дроби. Решением является . Но является производящей функцией моментов показательного распределения с параметром , так что функция плотности с.в. имеет вид

Пример 3.5 . При исследовании случайных процессов было введено обратное гауссовское распределение. Оно используется в качестве распределения с.в. В , величины страховых выплат. Функция плотности и производящая функция моментов обратного гауссовского распределения задаются формулами

Найдем распределение с.в., где с.в. независимы и имеют одинаковые обратные гауссовские распределения.

Решение. Воспользовавшись формулой (3.9), получим следующее выражение для производящей функции моментов с.в. :

Производящей функции моментов соответствует единственное распределение, и можно убедиться, что имеет обратное гауссовское распределение с параметрами и .

Приближения для распределения суммы

Центральная предельная теорема дает метод нахождения численных значений для распределения суммы независимых случайных величин. Обычно эта теорема формулируется для суммы независимых и одинаково распределенных случайных величин, где .

Для любого n распределение с.в. где = , имеет математическое ожидание 0 и дисперсию 1. Как известно, последовательность таких распределений (при n = 1, 2, ...) стремится к стандартному нормальному распределению. Когда n велико эта теорема применяется, чтобы приблизить распределение с.в. нормальным распределением со средним μ и дисперсией . Аналогично, распределение суммы n случайных величин приближается нормальным распределением со средним и дисперсией.

Эффективность такой аппроксимации зависит не только от числа слагаемых, но и от близости распределения слагаемых к нормальному. Во многих элементарных курсах статистики указывается, что n должно быть не меньше 30 для того, чтобы аппроксимация была разумной.

Однако одна из программ для генерации нормально распределенных случайных величин, используемых в имитационном моделировании, реализует нормальную случайную величину в виде среднего 12 независимых равномерно распределенных на интервале (0,1) случайных величин.

Во многих моделях индивидуальных рисков случайные величины, входящие в суммы, не являются одинаково распределенными. Это будет проиллюстрировано примерами в следующем разделе.

Центральная предельная теорема распространяется и на последовательности неодинаково распределенных случайных величин.

Для иллюстрации некоторых приложений модели индивидуальных рисков мы воспользуемся нормальной аппроксимацией распределения суммы независимых случайных величин, чтобы получить численные решения. Если , то

и далее, если с.в. независимы, то

Для рассматриваемого приложения нам нужно лишь:

  • найти средние и дисперсии случайных величин, моделирующих индивидуальные потери,
  • просуммировать их для того, чтобы получить среднее и дисперсию потерь страховой компании в целом,
  • воспользоваться нормальным приближением.

Ниже мы проиллюстрируем эту последовательность действий.

Приложения к страхованию

В этом разделе на четырех примерах иллюстрируется использование нормального приближения.

Пример 5.1. Компания, занимающаяся страхованием жизни, предлагает договор страхования на случай смерти на срок один год с выплатами размера 1 и 2 единиц лицам, вероятности смерти которых составляют 0,02 или 0,01. Приводимая ниже таблица показывает число лиц nk в каждом из четырех классов, образованных в соответствии с выплатой b k и вероятностью наступления страхового случая q k:

k q k b k n k
1 0,02 1 500
2 0,02 2 500
3 0,10 1 300
4 0,10 2 500

Страховая компания хочет собрать с этой группы из 1800 лиц сумму, равную 95-й процентили распределения общей величины страховых выплат по этой группе. Кроме того, она хочет, чтобы доля каждого лица в этой сумме была пропорциональна ожидаемому размеру страховой выплаты для данного лица.

Доля лица с номером , средняя выплата которому равна , должна составить . Из требования 95-й процентили следует, что . Величина превышения, , является рисковой надбавкой, а называется относительной рисковой надбавкой. Подсчитаем .

Решение. Величина определяется соотношением = 0,95, где S = X 1 + X 2 + ... + X 1800 . Это утверждение о вероятности эквивалентно следующему:

В соответствии с тем, что говорилось о центральной предельной теореме в разд. 4, мы аппроксимируем распределение с.в. стандартным нормальным распределением и воспользуемся его 95-й процентилью, откуда получаем:

Для четырех классов, на которые разбиты страхователи, мы получаем приведенные ниже результаты:

k q k b k Среднее b k q k Дисперсия b 2 k q k (1-q k) n k
1 0,02 1 0,02 0,0196 500
2 0,02 2 0,04 0,0784 500
3 0,10 1 0,10 0,0900 300
4 0,10 2 0,20 0,3600 500

Таким образом,

Поэтому относительная рисковая надбавка равна

Пример 5.2. Клиенты компании, занимающейся страхованием автомобилей, распределены по двум классам:

Класс Число в классе

Вероятность наступления

страхового случая

Распределение страховых выплат,

параметры усеченного показательного

распределения

k L
1 500 0,10 1 2,5
2 2000 0,05 2 5,0

Усеченное показательное распределение определяется посредством функции распределения

Это распределение смешанного типа с функцией плотности , и «сгустком» вероятностной массы в точке L . График этой функции распределения показан на рис.5.1.

Рис. 5.1. Усеченное показательное распределение

Как и ранее, вероятность того, что общая величина страховых выплат превосходит сумму, собранную со страхователей, должна быть равной 0,05. Мы предположим, что относительная рисковая надбавка должна быть одинаковой в каждом из двух рассматриваемых классов. Вычислим .

Решение. Этот пример очень похож на предыдущий. Разница состоит лишь в том, что величины страховых выплат являются теперь случайными величинами.

Сначала мы получим выражения для моментов усеченного показательного распределения. Это будет подготовительный шаг для применения формул (2.25) и (2.26):

Воспользовавшись значениями параметров, данными в условии, и применяя формулы (2.25) и (2.26), мы получаем следующие результаты:

k q k μ k σ 2 k Среднее q k μ k Дисперсия μ 2 k q k (1-q k)+σ 2 k q k n k
1 0,10 0,9139 0,5828 0,09179 0,13411 500
2 0,05 0,5000 0,2498 0,02500 0,02436 2000

Итак, S , общая сумма страховых выплат, имеет моменты

Условие для определения остается тем же, что и в примере 5.1, а именно,

Воспользовавшись снова аппроксимацией нормальным распределением, получаем

Пример 5.3. В портфель страховой компании входит 16 000 договоров страхования на случай смерти на срок один год согласно следующей таблице:

Вероятность наступления страхового случая q для каждого из 16 000 клиентов (эти события предполагается взаимно независимыми) равна 0,02. Компания хочет установить уровень собственного удержания. Для каждого страхователя уровень собственного удержания является величиной, выплаты ниже которой эта компания (компания-цедент) осуществляет самостоятельно, а выплаты, превосходящие эту величину, покрываются по договору перестрахования другой компанией (перестраховщиком).

Например, если уровень собственного удержания равен 200 000, то компания оставляет за собой покрытие суммы до 20 000 для каждого страхователя и покупает перестрахование для покрытия разницы между страховой выплатой и суммой 20 000 для каждого из 4500 страхователей, страховые выплаты для которых превосходят сумму 20 000.

В качестве критерия для принятия решения компания выбирает минимизацию вероятности того, что страховые выплаты, оставленные на собственном удержании, плюс та сумма, которая платится за перестрахование, превзойдет сумму 8 250 000. Перестрахование стоит 0,025 на единицу покрытия (т.е 125% от ожидаемой величины страховых выплат за единицу 0,02).

Мы считаем, что рассматриваемый портфель замкнут: новые страховые договоры, заключенные в течение текущего года, не будут учитываться в описанном процессе принятия решения.

Частичное решение. Проведем сначала все вычисления, выбрав за единицу выплат 10 000. В качестве иллюстрации предположим, что с. в. S является величиной выплат, оставленных на собственном удержании, имеет следующий вид:

К этим страховым выплатам, оставленным на собственном удержании, S , прибавляется сумма перестраховочных премий. Итого, общая величина покрытия по такой схеме составляет

Сумма, оставленная на собственном удержании, равна

Таким образом, общая перестрахованная величина составляет 35 000-24 000=11 000 и стоимость перестрахования составляет

Значит, при уровне собственного удержания, равном 2, оставленные на собственном удержании страховые выплаты плюс стоимость перестрахования составляют . Критерий для принятия решения основан на вероятности того, что эта общая сумма превзойдет 825,

Используя нормальное распределение, мы получаем, что эта величина приблизительно равна 0,0062.

Средние значения страховых выплат при страховании эксцедента убыточности, как одного из видов перестрахования, можно аппроксимировать, пользуясь нормальным распределением в качестве распределения общих страховых выплат.

Пусть общие страховые выплаты Х имеют нормальное распределение со средним и дисперсией

Пример 5.4. Рассмотрим страховой портфель, как в примере 5.3. Найдем математическое ожидание величины страховых выплат при договоре страхования эксцедента убыточности, если

(а) индивидуальное перестрахование отсутствует и безусловная франшиза установлена равной 7 500 000

(b) установлено собственное удержание в размере 20 000 по индивидуальным страховым договорам и величина безусловной франшизы по портфелю составляет 5 300 000.

Решение.

(а) При отсутствии индивидуального перестрахования и при переходе к 10 000 в качестве денежной единицы

применение формулы (5.2) дает

что составляет сумму 43 770 в исходных единицах.

(b) В примере 5.3 мы получили среднее и дисперсию суммарной величины страховых выплат при индивидуальном уровне собственного удержания 20 000, равные 480 и 784 соответственно, если рассматривать 10 000, в качестве единицы. Таким образом, =28.

применение формулы (5.2) дает

что составляет сумму 4140 в исходных единицах.

Чрезвычайно важным объектом теории вероятностей является сумма независимых случайных величин. Именно исследования распределения сумм независимых случайных величин заложили фундамент для развития аналитических методов теории вероятностей.

Распределение суммы независимых случайных величин

В данном разделе мы получим общую формулу, позволяющую вычислить функцию распределения суммы независимых случайных величин, и рассмотрим несколько примеров.

Распределение суммы двух независимых случайных величин. Формула свертки

независимые случайные величины с функциями распределения

соответственно

Тогда функцию распределения F суммы случайных величин

можно вычислить по следующей формуле (формула свертки )

Для доказательства воспользуемся теоремой Фубини.

Аналогично доказывается вторая часть формулы.

Плотность распределения суммы двух независимых случайных величин

Если распределения обеих случайных величины имеют плотности, то плотность суммы этих случайных величин можно вычислить по формуле

Если распределение случайной величины (или ) имеет плотность, то плотность суммы этих случайных величин можно вычислить по формуле

Для доказательства этих утверждений достаточно воспользоваться определением плотности.

Кратные свертки

Вычисление суммы конечного числа независимых случайных величин производится с помощью последовательного применения формулы свертки. Функция распределения суммы k независимых одинаково распределенных случайных величин с функцией распределения F

называется k –кратной сверткой функции распределения F и обозначается

Примеры вычисления распределения сумм независимых случайных величин

В этом пункте приведены примеры ситуаций, при суммировании случайных величин сохраняется вид распределения. Доказательства представляют собой упражнения на суммирование и вычисление интегралов.

Суммы независимых случайных величин. Нормальное распределение

Суммы независимых случайных величин.Биномиальное распределение

Суммы независимых случайных величин.Пуассоновское распределение

Суммы независимых случайных величин.Гамма распределение

Пуассоновский процесс

последовательность независимых одинаково распределенных случайных величин, имеющих экспоненциальное распределение с параметром



Случайная последовательность точек

на неотрицательной полуоси называется пуассоновский (точечный) процесс .

Вычислим распределение числа точек

пуассоновского процесса в интервале (0,t)

эквиваленты, поэтому

Но распределение случайной величины

является распределением Эрланга порядка k, поэтому

Таким образом распределение количества точек пуассоновского процесса в интервале (o,t) это пуассоновское распределение с параметром

Пуассоновский процесс используется для моделирования моментов наступления случайных событий – процесса радиоактивного распада, моментов поступления звонков на телефонную станцию, моментов появления клиентов в системе обслуживания, моментов отказа оборудования.