МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ПРИРОДООБУСТРОЙСТВА

 

 
"РОЛЬ ПРИРОДООБУСТРОЙСТВА В ОБЕСПЕЧЕНИИ УСТОЙЧИВОГО ФУНКЦИОНИРОВАНИЯ И РАЗВИТИЯ ЭКОСИСТЕМ "
 
(МАТЕРИАЛЫ МЕЖДУНАРОДНОЙ НАУЧНО-ПРАКТИЧЕСКОЙ КОНФЕРЕНЦИИ)
 
Москва 2006

УДК 631.6

Использование распределений Джонсона для статистической характеристики исходных данных

 

 

Димитриос Пападопулос

Проблемная лаборатория г. Сидней, Австралия

ФГОУ ВПО «Московский государственный университет природообустройства»,

г. Москва, Россия

 

Введение

Многие параметры, связанные с разного рода инженерными расчетами определяются в нескольких точках исследуемой области. Расчетное значение определяемых параметров может быть получено или осреднением проведенных измерений, или используя другие, приемлемые в каждом конкретном случае соображения. В качестве рабочего примера мы воспользуемся определением некоторых параметров при определении промывных норм засоленных земель.

Основнoe ypaвнeниe движeния coлeй coдeржит ceмь пapaмeтров пpостpaнствeнныe кoopдинaты x, y, z, вpeмя t, пористость грунта μ, коэффициент конвективной диффузии D,  cкopocти фильтpaции , кoэффициeнт coлeвогo o6мeнa  и кoнцeнтpaцию (или сoдepжаниe) coлeй с (х, у, z, t) и сs.

Koоpдинaты       x, y, z и кoнцeнтpaция нacыщeния сs являются вeличинaми точными, вce оcтaльныe – cлyчaйными, тaк кaк нa пpaктикe oни oпpeдeляютcя лишь в нecколькиx тoчкax и c кaкoй-тo пoгpeшнocтью.

Пapaмeтp μ вapьиpyeт нecильно, кoлeбляcь для cyглинков в пpeдeлax 0,4-0,5. Пpи oпpeдeлeнии пpoмывныx ноpм он иrpaeт нe глaвнyю poль. 3нaя opиeнтиpoвoчнo нaимeньшee знaчeниe μ = μmin и нaибoльшee μ = μmax, можнo оцeнить мaкcимaльнyю oшибкy пpи oпpeдeлeнии пpoмывныx ноpм.

Подобными соображениями устанавливается, кaкиe из пapaмeтров cлeдyeт paccмaт-pивaть кaк cтoxаcтичecкиe, и кaкиe мoжнo, хотя 6ы в пepвoм пpиближeнии, считaть нe cлyчaйными. Правильное задание расчетного значения содержания солей –  ср имеет большое значение. Очевидно, что расчет промывной нормы по среднему значению создает риск недопромывки дo половины площади. Тaк как для характеристики массива по степени исходного засоления проводится более или менее детальная солевая съемка, то есть xaрактеристика проводится на основании некоторой выборки, то представляется возможным применение аппарата математической статистики, которая может дать ответ на многие важные вопросы, в частности,  об определении расчетного значения содержания солей.

Поскольку наши исследования показали, что огромное большинство из 90 выборок, бывших в нашем распоряжении, подчиняются SB распределению Джонсона (см. [2]), делаем особый упор на изложение материала по семейству распределений Джонсона, а также напишем программу для облегчения требуемых расчетов. Программа рассчитывает среднюю дисперсию и все необходимые параметра для распределений Джонсона. Затем проверяется вероятность соответствия для каждого распределения.

Особенность подхода заключается в том, что, кроме обычных расчетов необходимых параметров, программа оптимизирует два параметра, выбирая наилучшее их сочетание из сотен возможных комбинаций.

Программа может быть запрошена в Проблемной лаборатории МГУП у проф. В.В. Шабанова.

Расчет параметров и установление закона распределения

Статистическая характеристика исходных данных – этот вопрос очень хорошо освещен в литературе [1, 3, 4, 5, 6 и др. ]. Мы постараемся привести лишь минимум информации, необходимой для изложения интересующего нас вопроса.

Функции распределения

Для выбора расчетного значения содержания солей по данным солевой съемки необходимо знать их закон распределения. Можно сказать, что в общем случае закон распределения случайной величины Х, представленной некоторой выборкой {х1, х2,... хn}, описывается двумя функциями – f(x) и F(x), которые, как правило, зависят от некоторых параметров. Первая функция – f(x) – называется дифференциальной функцией распределения  или плотностью распределения, вторая – F(x)  интегральной, или просто функцией распределения. Цель статистического анализа при обработке данных исходного засоления – найти функции f(x) и F(x), а следовательно, и параметры распределения по данным солевой съемки Х = {х1, х2, ...хn}.

Одним из наиболее распространенных является так называемый нормальный закон распределения. Он описывается функциями:

                         ,                              

где параметры MX = μ;  DX = σ2, математическое ожидание и дисперсия, равно как и квадратный корень дисперсии σ (так называемое стандартное отклонение), имеют вполне определенный физический смысл и могут быть оценены с помощью выборочных значений х1, х2, ..., хn.

Оценки математического ожидания МХ = μ и дисперсии DX = σ2 называются выборочным и средними  m (или ) и выборочной дисперсией s2 соответственно, и определяются по формулам:

                                      .                             

Грубо говоря, функция распределения дает вероятность того, что случайная величина Х  примет значение меньшее или равное х, а плотность распределения дает вероятность того, что случайная величина Х примет значение равное х.

Особый интерес представляет случай, когда математическое ожидание μ = 0, а  дисперсия σ2 = 1. Такое распределение называется нормированным нормальным распределением.

Таблицы со значениями функций f(x) и F(x)  приводятся во всех книгах по математической статистике (см. [1, 4, 5]). Для их использования изучаемую случайную величину Х нормируют путем замены переменной: вместо Х рассматривают нормированную случайную величину Z, которая связана с Х формулой

                                                          .                                                                

Так как нормальный закон распределения хорошо изучен, то часто стараются свести изучение наблюдаемой величины к нормально распределенной.

В математической статистике нет способа, по которому, имея исходные данные, можно найти достоверно закон распределения, поэтому сначала выдвигают, так называемую, нулевую гипотезу Н0, состоящую в том, что данная выборка подчиняется данному закону распределения, и затем уже проверяют справедливость нулевой гипотезы. Нулевая гипотеза выдвигается на основании построения эмпирической функции распределения – дифференциальной или интегральной.

Частотные таблицы

Первое и довольно хорошее представление о законе распределения изучаемой случайной величины дает частотная таблица. Построение частотных таблиц довольно просто: 

Пусть дана выборка X = {x1, x2, …, xn}, представляющая собой содержание солей в каком-нибудь горизонте или во всем расчетном слое. Для построения частотной таблицы, многоугольника распределения (дифференциальной функции) и кривой накопленных частостей (эмпирической интегральной функции) поступают следующим образом:

Разбивают область определения Х на несколько интервалов. Число интервалов обычно равно 8-12, а иногда и больше. Его также можно оценить по формуле

                                                            k = [lg2n] + 1,                                                         

где [lg2n] – наименьшее целое число, непревосходящее lg2n.

Зная размах R = xmaxxmin (xmax – наибольший элемент из Х, xmin – наименьший), по формуле

                                                               Δx = R / k                                                            

находят приближенную длину каждого интервала.

При наличии некоторой практики вопрос о количестве и ширине интервалов решается и без применения формул , . Надо только помнить, что слишком большая ширина интервала делает картинy менее наглядной, слишком маленькая может выделять нехарактерные особенности выборки.

Значениям х, попавшим в i-й интервал приписывают значение, равное его середине.

Подсчитывают частоты ni – число элементов хÎХ, попавших в каждый интервал. Тем самым, в дальнейшем оперируют k числами вместо n.

Подсчитывают накопленные (кумулятивные) частоты Ni , выражающие сумму частот до данного интервала включительно.

По формулам   расcчитывают среднее и дисперсию

Проверяется наличие «грубых промахов», то есть ошибочных измерений. При нормальном распределении 99,7% возможных значений случайной величины лежит внутри интервала μ ± 3σ, где μ – математическое ожидание, σ2 – дисперсия. Для большей уверенности будем пользоваться 4-сигмовым интервалом. Значения х, не попадающие в интервал (m - 4s, m + 4s), по принципу практической достоверности, можем отбросить как грубые ошибки измерений. Основание для этого дает неравенство Чебышева [5 и др.], согласно которому для любого распределения вероятность попадания некоторого значения х за пределы интервала (m - ks, m + ks) не больше 1/k2. Для k = 4 эта вероятность будет не больше 0,06. Другими словами, для любого распределения не менее 94 % возможных значений случайной величины лежит внутри интервала m ± 4s.

Затем опять находятся среднее и дисперсия (с учетом уменьшения объема выборки) и опять применяется «правило 4-х сигм» и так до тех пор, пока все значения случайной величины не лягут в 4-сигмовый интервал.

Находят эмпирические частности  равные отношению частоты ni к числу n элементов выборки Х.

Находятся накопленные (кумулятивные) частности , представляющие сумму частностей до данного интервала включительно. Последний интервал будет иметь значение = 1.

Этих данных достаточно для построения эмпирических функций распределения: по оси абсцисс откладывают значения х, по оси ординат – значенияи F* полученные точки соединяют. График f*(x), называемый также полигоном распределения, подскажет приближенно, какому закону подчиняется изучаемая случайная величина. График F* будет полезен для проверки гипотезы о законе распределения.

Логнормальное распределение

Логнормальное распределение характеризуется тем, что если дана случайная величина Х, представленная выборкой объема n (то есть X = {x1, x2, …, xn}), то случайная величина Y, полученная логарифмированием Х, то есть Y = {y1, y2, …, yn} =  {ln x1,ln x2, …, ln xn} распределена нормально. Если при этом  my и    оценки математического ожидание и дисперсии, то оценки параметров случайной величины Х находятся по формулам:

                                           ;                                                            

                                      .                                         

Поскольку на практике сначала находим параметры величины Х, следующие формулы для определения  my и  sy из  mx и  sx  могут быть полезны:

                                                  ;                                                               

                                                ;                                                           

                                                      kvx = sx / mx.                                                                 

Центральные моменты и плоскость (β1, β2)

В принципе любое распределение однозначно определяется своими моментами [8].

Заметим, что в дальнейшем будем пользоваться оценками параметров, а не их значениями для всей генеральной совокупности.

Выборочный момент 1-го порядка – это среднее случайной величины Х

              .                

Центральные выборочные моменты  r-го (r > 1) порядка определяются по формуле

               .                                       

В большинстве случаев первые четыре момента вполне адекватны для описания случайной величины Х. Первый момент m1 или среднее m геометрически определяет положение (Location), второй выборочный момент m2 равен выборочной дисперсии s2  и определяет рассеяние вокруг среднего, третий момент определяет асимметрию, а четвертый момент – крутизну. Поскольку первый и второй моменты содержат информацию о положении и рассеянии, но не формы, система классификации может быть ограничена к третьему и четвертому моментам [6, 8].

Введем так называемые постоянные Пирсона b1 и b2

                                       .                                           

 

 

Рис. 1. Плоскость (b1, b2) для выбора аппроксимирующего распределения Джонсона

 

Удобным способом описания распределений является их представление на плоскости (b1, b2) [6]. Из рис. 1 видно, что плоскость (b1, b2) разделена на несколько частей. Верхняя линия является «областью невозможных значений»  или «критической областью»: распределений с b2 < 1 + b1 не существует. У нормального распределения b1 = 0, b2 = 3, то есть оно представлено только одной точкой.

Логнормальное распределение представлено на графике нижней линией, средняя линия представляет гамма распределение и т.д.

Распределения Джонсона

Семейство эмпирических распределений Джонсона [6, 7, 8] удобно тем, что эти распределения получаются путем преобразования нормального распределения, покрывают всю плоскость (β1, β2) и могут быть использованы вместо других распределений.

В работах [6, 7] дается подробное изложение распределений Джонсона. Приведем только часть материла, которая, на наш взгляд, адекватна для анализа одной выборки, описывающей состояние некоторой физической среды (содержание солей в почве, коэффициент фильтрации, влажность почвы и т.д.)

В общем случае это преобразование имеет вид:

                         z = γ + ητ(х, ε, ζ);   (η > 0, ζ > 0; γ, εÎ(-¥, +¥)),                                  

где   τ – произвольная фyнкция;   γ, η, ε, ζ – параметры распределения;  z – нормированная случайная величина, распределенная по нормальному закону.

Н. Л. Джонсон [6, 7] предложил три различные фyнкции τ:

                                                 ;                                                              

                                     ;                                       

                                      .                                      

При  τ = τ1 получаем логнормальный закон распределения (или SL- распределение Джонсона), при τ = τ2 - SВ – распределение Джонсона и при τ = τ3распределение SU (см.рис. 1), которое почти симметрично или имеет левую асимметрию.

Расчет параметров для SL (логнормального) распределения

Как показано в [6], для SL распределения можно написать:

                                               ,                                                           

где                                           γ* = γη lnζ.                                                                                 

Параметр ε в данном случае является наименьшим значением случайной величины Х и мы его примем равным нулю.

Оценки  η и  γ* можно получить из формул

                                        ,                                           

где my, sy – среднее выборки и стандартное отклонение, определяемые или непосред-ственно из формул -.

Имея частотную таблицу и используя формулы -, можем вычислить значения теоретической функции распределения F(z) и значения Х, соответствующие некоторой вероятности р.

В [6] также приводятся формулы для случая, когда ε > 0 и неизвестно:

                                             ;                                                      

                                              ;                                                     

                                                   ,                                                            

где  β = 1α, zβ = z1-α = -zα – квантили нормального распределения, соответствующие вероятностям α  и β = 1α;  x0.5, xα,  xβ – значения случайной величины, соответствующие вероятностям 0,5, α и β; находятся по упорядоченной выборке как значения с номерами 0,5(n+1), α(n+1), β(n+1), соответственно. Если эти числа нецелые, то расчетные значения получают линейной интерполяцией двух ближайших  значений х.

При использовании частотных таблиц значения x0.5, xα, xβ также находятся интерполяцией. Мы предлагаем следующую формулу для их определения

                                                 ,                                                        

где   np = (n+1)p и   (р = 0,5, α  или  β)  nR – накопленная частота интервала, в который попадает nр.;    nL – накопленная частота предыдущего интервала;   Δx – ширина интервалов; xL – левое значение интервала с nр;

Значения X, соответствующие вероятности р, можно найти по формуле

                                                     .                                                

Расчет параметров для SВ распределения

Для SВ распределения параметры ε и ζ являются наименьшим и наибольшим возможными значениями случайной величины Х. Мы примем ε = 0, а ζ равным наибольшему выборочному значению Х или чуть больше правого значения последнего интервала, получаемому при группировке данных (впредь для удобства вместо ζ будем писать xmax).

Формула с учетом принимает вид

                                                                  .                                                

Параметры η и γ определяются по формулам:

                                                        ;                                           

                                                       .                                          

где  zα, zβ – квантили нормированного нормального распределения, соответствующие вероятностьям α и β;    хα,  xβсоответствующие эмпирические квантили;  хα, xβ находятся как и выше как α(n+1)-е и β(n+1)-е значения исходного вариационного ряда.

Зная γ, η, ζ, можем построить функцию распределения случайной величины. Задаваясь значениями х, равным правым концам интервалов разбиения и подставляя их в формулу , получаем соответствующие значения z, для которых по таблицам нормального распределения находим интегральную вероятность F(z). Имея эмпирические вели-чины интегральной вероятности, накопленные частости F*(х), можем по критериям соответствия оценить  вероятность справедливости нулевой гипотезы. Слегка меняя параметры α и β, можно добиться наилучшего представления распределения случайной величины.

В Приложении 2 приводится программа такого подбора значений α и β.

Формулу можно разрешить относительно х

                                                   .                                                 

По удобно находить значения х, требуемой вероятности.

Пусть нас интересует содержание солей, соответствующие вероятности р = 0,9; тогда, зная параметры  γ, η, xmax и, принимая  z = 1,282, находим по формуле требуемое значение х.

Расчеты, проведенные для 90 выборок, характеризующих исходное засоление в ряде массивов Средней Азии, подтверждают предположение, что распределение солей в этих массивах большею частью может быть описано SB распределением Джонсона.

Расчет параметров для  SU распределения

SU распределения, как мы отметили выше, являются или симметричными или имеют левую асимметрию. Если точка (b1, b2) попадает в зону SU, то параметры распределения определяются следующим образом:

По таблицам SU  распределения [6] находятся оценки   η и  γ*.

По прилагаемым ниже формулам находятся величины ζ  и  ε:

                              ;                                            

                                           ;                                                       

                                                .                                                                 

Далее по формуле

                                                                                                         

определяются значения z и по таблицам нормального распределения – значения функции распределения F(z), которые можно использовать для проверки гипотезы о законе  распределения.

Наконец, по формуле

                                                 ,                                                     

можно найти значения x, соответствующие вероятности р (например значения содержания солей, соответствующие вероятности  р = 0,9).

Проверка гипотезы о законе распределения

Проверка соответствия эмпирического распределения теоретическому осуществляется с помощью различных критериев соответствия, таких как критерий Пирсона (χ2), критерий Колмогорова-Смирнова и т.д. Мы будем пользоваться критерием Колмогорова-Смирнова и впредь, для краткости будем писать «критерий Колмогорова».

Критерий соответствия Колмогорова

Критерий Колмогорова [4] – один из наиболее простых и распространенных. Схема его применения такова:

Находится наибольшая разность между эмпирической F*(x) и теоретической F(x) фyнкциями распределения:

                                       D = max|F(xi) – F*(xi)|      (i=1,2,…,k).                                    

Находится величина    

По таблице 1 находится вероятность  р(λ) того, что расхождение D между F(x) и F*(x) носит случайный характер.

Если эта вероятность велика, то нет оснований, считать, что гипотеза о законе распределения несправедлива, если же р(λ) мала (обычно меньше 0,1), то нулевая гипотеза нуждается в дополнительной проверке, так как есть основания считать, что распределение величины Х не описывается удовлетворительно выбранной функцией.

 

Таблица 1

Значения λ и р(λ) для критерия соответствия Колмогорова

 

λ

p(λ)

λ

p(λ)

λ

p(λ)

λ

p(λ)

0,0

1,00

0,6

0,86

1,1

0,18

1,6

0,01

0,1

1,00

0,7

0,71

1,2

0,11

1,7

0,01

0,2

1,00

0,8

0,54

1,3

0,07

1,8

0,00

0,3

1,00

0,9

0,39

1,4

0,04

1,9

0,00

0,4

1,00

1,0

0,27

1,5

0,02

2,0

0,00

0,5

0,96

 

 

 

 

 

 

 

В зависимости от выдвинутой (так называемой нулевой) гипотезы подсчитывают значения эмпирических квантилей zi для правых значений интервалов xi.

Затем по [1 и др.] находятся значения функции нормального распределения F(z), представляющие вероятность того, что наблюденное значение х будет меньше правого конца хi интервалa с номером i.

Далее, согласно критерию Колмогорова, находится наибольшая разность D и затем – λ (см. формулу ). По табл. 1 оценивается вероятность справедливости нулевой гипотезы.

Пример вычислений

Пусть дана упорядоченная выборка, представленная в табл. 2.

Имеем:

n = 100,  xmin = 0,05, xmax = 0.98;

R = xmaxxmin = 0.93;

k = [log2n] + 1 = 7;

Δx = R/k = 0,93/7 = 0,133.

Как видим, интервалы получаются не очень удобными. Поэтому мы положим номер интервалов k = 10 и ширину интервалов примем, равной 0,1: Δх = 0,1

Таблица 2

Пример выборки

 

Номер

х

х

Номер

х

Номер

х

Номер

х

1

2

3

4

5

6

7

8

9

10

1

0,05

21

0,34

41

0,43

61

0,49

81

0,59

2

0,12

22

0,34

42

0,43

62

0,50

82

0,60

3

0,15

23

0,35

43

0,43

63

0,50

83

0,60

4

0,18

24

0,35

44

0,44

64

0,51

84

0,61

5

0,21

25

0,36

45

0,44

65

0,51

85

0,62

6

0,22

26

0,36

46

0,44

66

0,52

86

0,63

7

0,23

27

0,37

47

0,45

67

0,52

87

0,64

8

0,24

28

0,37

48

0,45

68

0,53

88

0,65

9

0,25

29

0,38

49

0,45

69

0,53

89

0,66

10

0,25

30

0,38

50

0,46

70

0,54

90

0,67

11

0,26

31

0,39

51

0,46

71

0,54

91

0,68

12

0,27

32

0,39

52

0,46

72

0,55

92

0,69

13

0,28

33

0,40

53

0,47

73

0,55

93

0,70

14

0,28

34

0,40

54

0,47

74

0,56

94

0,73

15

0,31

35

0,41

55

0,47

75

0,56

95

0,75

Продолжение табл. 2

1

2

3

4

5

6

7

8

9

10

16

0,31

36

0,41

56

0,48

76

0,57

96

0,78

17

0,32

37

0,41

57

0,48

77

0,57

97

0,84

18

0,32

38

0,42

58

0,48

78

0,58

98

0,86

19

0,33

39

0,42

59

0,49

79

0,58

99

0,92

20

0,33

40

0,42

60

0,49

80

0,59

100

0,98

 

В таблице 3 представлены результаты расчетов.

Пользуясь вышеприведенными формулами,  находим

     .   

Приведем сначала результаты вычислений с использованием программы, и затем проведем расчеты «вручную»

Таблица 3

Частотная таблица для выборки из табл. 2

 

х1

х2

хi

ni

nx

n(x-m)2

n(x-m)3

n(x-m)4

Ni

f*

F*

0,0

0,1

0,05

1

0,1

0,17

-0,071

0,0294

1

0,010

0,010

0,1

0,2

0,15

3

0,5

0,30

-0,093

0,0292

4

0,030

0,040

0,2

0,3

0,25

10

2,5

0,46

-0,098

0,0210

14

0,100

0,140

0,3

0,4

0,35

20

7,0

0,26

-0,030

0,0034

34

0,200

0,340

0,4

0,5

0,45

29

13,1

0,01

0,000

0,0000

63

0,290

0,630

0,5

0,6

0,55

20

11,0

0,15

0,013

0,0011

83

0,200

0,830

0,6

0,7

0,65

10

6,5

0,35

0,064

0,0120

93

0,100

0,930

0,7

0,8

0,75

3

2,3

0,25

0,070

0,0201

96

0,030

0,960

0,8

0,9

0,85

2

1,7

0,30

0,115

0.0444

98

0,020

0,980

0,9

1,0

0,95

2

1,9

0,47

0,230

0,1116

100

0,020

1,000

 

 

Суммы

100

46,4

2,70

0,200

0,2720

 

 

 

 

 

Из рисунка 2 видно, что все гипотезы дают довольно высокие вероятности, однако предпочтение может быть отдано SU распределению Джонсона.

Расчеты для  SL распределения

Пользуясь формулами - и , получаем:

 

;

sy = 0,3454;

;

η = 1 / 0,3454 = 2,895;

γ = 0,8275 / 0,3454 = 2,396.

 

Значения z вычисляем по формуле

z1 = γ* + ηlnx1 = 2,396 + 2,895 * ln(0,1) = -4,290 и т.д.

Обратите внимание, что х1 равно правому значению первого интервала. F(z) можно найти по таблицам нормального распределения.

Наибольшая разница D  между  F*(x) и F(z) достигается при  х = 0,4 и равна 0,059.

Далее имеем   .

Соответствующая вероятность соответствия  p(λ) = 0,88.

Наконец, значение х, соответствующее вероятности р = 0,9

х0.9 = ехр((1,282-2,396)/2,895) = 0.681.

 

 

Рис. 2. Результаты расчетов программы после оптимизации α и β

 

Наша программа затем варьирует α от 0,01 до 0,3 с шагом 0,01 и находит для каждого α  значение  р(λ). Если какое-либо из них меньше вычисленного по формулам - и , то это значение берется за расчетное и показывается в столбце с расчетами для SL распределения.

Расчеты для SВ распределения

Программа варьирует α от 0,01 до 0,30 с шагом 0,01 и β от 0,99 до 0,7 с шагом -0,01. Из 900 результатов выбирается тот, у которого λ имеет наименьшее значение.  Рисунок 2  показывает, что наименьшее λ = 0,295 достигается при α = 0,10  и  β = 0,85.

В самом деле: имеем Δx = 0,1,  n = 100.

Примем  α = 0,10 и  β = 0,85 и xmax = 1,001.

Пользуясь формулами - находим:

 

nα

10.10

xLα

0.2

nRα

14

nLα

4

хα = 0.2 + 0.1 * (10.10 – 4)/(14-4)

0.261

nβ

85.85

xLβ

0.6

nRβ

93

nLβ

83

хβ = 0.6 + 0.1 * (85.85 – 83/(93-83)

0.629

;

;

 

;

 

х0,9 = 1,001 / (1 + exp[(0,26 – 1,282) / 1,48]) = 0,67.

 

Для значений  z  имеем

z1 = γ + ηln(x1 /(xmax - x1)= 0,26 + 1,48 * ln(0,1/(1,001 – 0,1)) = -2,994.

Таким образом находятся все остальные значения  z и F(z).

Значения F(z) находятся по таблицам нормального распределения. Наибольшая разница D между  F*(x) и F(z) достигается при х = 0,8 и равна 0,029.

Далее имеем .

Соответствующая вероятность соответствия  p(λ) = 1,00.

Наконец, значение х, соответствующее вероятности р = 0.9:

х0.9 = 1,001/ехр((0,26 - 1,28)/1,48) = 0.67.

Расчеты для SU распределения

Мы уже вычислили m = 0,464, s = 0,165, b1 = 0,2038 и b2 = 3,7301. Нам также нужен . По таблицам для  γ и η в [6] и, пользуясь линейной интерполяцией, можно найти

γ = -1,527,    η = 3,214.

Пользуясь формулами - находим

ω = exp(1 / 3,2142) = 1,102;

 

;

        ;

                                ;

  .

Таким образом находятся все остальные значения z и F(z).

Значения F(z) находятся по таблицам нормального распределения. Наибольшая разница D между F*(x) и F(z) достигается при   х = 0,3 и равна 0,025.

Далее имеем 

Соответствующая вероятность соответствия p(λ) = 1,00.

Наконец, значение х, соответствующее вероятности р = 0,9

.

 

Библиографический список

 

1.         Вентцель Е. С. Теория вероятностей. – М.: Наука, 1969.

2.         Голованов А И., Пападопулос Д. Г. Статистическая характеристика данных исходного засоления.  //Вестник с/х науки. 1972. №2.

3.         Mитропольский А.К.  Техника статистических вычислений. – М.: Наука, 1971.

4.         Пустыльник Е.И. Статистические методы анализа и обработки наблюдений. – М.: Наука, 1968.

5.         Смирнов Н.В., Дунин-Барковский И.В. Курс теории вероятностей и математической статистики. – М.: Наука, 1969.

6.         Hahn G., Shapiro Samuel S. Statistical Models in Engineering New York.

7.         Johnson N.L. Systems of Frequency Curves Generated by Methods of Translation, Biometrica, 36, 149, (1949).

8.         Shapiro Samuel S., Gross Alan G. Statistical Modeling Techniques Marcel Dekker, New York.