Идентифицировать закон распределения генеральной совокупности. Идентифицировать методом проб закон распределения генеральной совокупности, определив его параметры
Идентифицировать методом проб закон распределения генеральной совокупности, определив его параметры. Для каждой пробы необходимо проверить гипотезу о соответствии предполагаемого закона распределения исходной выборке с помощью двух критериев: Колмогорова-Смирнова, “омега-квадрат” Мизеса. Уровень значимости выбрать α= 0,05. Для начальной ориентировки в выборе закона использовать вид гистограммы, соотношения между моментами и полученные значения коэффициентов асимметрии и эксцесса. Нанести поверх гистограммы идентифицированный закон распределения. Рис.5 Наложение гипотетического закона распределения на выборочную функцию распределения Рис.6 Наложение идентифицированного закона распределения на гистограмму На основании вида гистограммы и того, что коэффициенты ассиметрии и эксцесса равны соответственно -0,0471 и 3,0355 мы можем выдвинуть гипотезу о том, что предполагаемый закон распределения является законом распределения нормального вида. Для проверки гипотезы о соответствии предполагаемого закона распределения исходной выборке с помощью критерия Колмогорова – Смирнова было определено: Значение плотности распределения вероятности в Matlab с помощью функции normpdf(X(i),m1,mC2.^(1/2)). Значение функции распределения вероятности можно вычислить в Matlab с помощью функции normcdf(X(i),m1,mC2.^(1/2)), где m1 – мат. ожидание, а mC2 – дисперсия. Максимальная разница между гипотетической функцией распределения и выборочной функцией распределения для оценки по критерию Колмогорова-Смирнова должна быть меньше критического значения, рассчитываемого по формуле:
Сама максимальная разница получилась равна 0,0392, что меньше критического значения. Из этого следует, что у нас нет достаточных оснований отвергнуть выдвинутую гипотезу. Для оценки по критерию Мизеса нам необходимо рассчитать значение Ω по формуле:
Приложение 1
Исходный код расчетов в инженерной системе MatLab clear all; X = importdata('data2.txt'); x = X(1:20); %выборка 20 значений X = sort(X);%сортировка исходных данных n = 201;%общее количество случайных значений в выборке xn = 20;%количество значений части выборки for i = 1:201,%массив значений i/201 y(i)=i/201; end;
%1.1 stairs(X,y);%построение выборочной функции распределения ylabel('F(X)');%подписи осей xlabel('X'); hold on;
%1.2 k=9; delta=(max(X)-min(X))/k; for j = 1:k, center(j) = min(X)+delta*(j-1+0.5); end; Z=hist(X,k); Z1=Z/n*delta; bar(center,Z1,1);% построение гистограммы ylabel('Phi*(X)'); xlabel('X'); hold on;
%2.1 m1 = 1/n*sum(X); %среднее арифметическое(математическое ожидание) med =(X(100)+X(101))/2; %выборочная медиана medX = median(X);% выборочная медиана по функции MatLab Xp =(X(1)+X(n))/2; %середина размаха
%2.2 mC2 = 1/n*sum((X-m1).^2); %дисперсия(2-й центральный момент) mC3 = 1/n*sum((X-m1).^3); %3-й центральный момент mC4 = 1/n*sum((X-m1).^4); %4-й центральный момент
%2.3 As = mC3/(mC2).^(3/2); %Выборочная ассиметрия AsX = skewness(X); %Выборочная ассиметрия по функции MatLab
Ex = mC4/mC2.^2; %выборочный эксцесс ExX = kurtosis(X); %выборочный эксцесс по функции MatLab
%2.4 %Интерквантильный промежуток Jp=[ -3,2315; -1,1173]
%2.5 xm1 = (1/xn)*sum(x); %среднее арифметическое(математическое ожидание) для выборки из 20 значений xmed = x(10)/2; %выборочная медиана для выборки из 20 значений xmedX = median(x);%выборочная медиана по функции MatLab для выборки из 20 значений xXp = (x(1)+x(xn))/2; %середина размаха для выборки из 20 значений
xmC2 = 1/20*sum((x-xm1).^2); %дисперсия для выборки из 20 значений xmC3 = 1/20*sum((x-xm1).^3); %3-й центральный момент для выборки из 20 значений xmC4 = 1/20*sum((x-xm1).^4); %4-й центральный момент для выборки из 20 значений
xAs = xmC3/(xmC2).^(3/2); %Выборочная ассиметрия для выборки из 20 значений xAsX = skewness(x); %Выборочная ассиметрия по функции MatLab для выборки из 20 значений xEx = xmC4/(xmC2).^2; %выборочный эксцесс для выборки из 20 значений xExX = kurtosis(x); %выборочный эксцесс по функции MatLab для выборки из 20 значений
%3.1 Q = 0.8;%доверительная вероятность sigma1 = sqrt((1/(n-1))*sum((X-m1).^2)); %эффективная оценка с.к.о. k1 = tinv((1+Q)/2, n-1);% коэффициент Стьдента IOMO = [m1-k1*(1/n)*sigma1,m1+k1*(1/n)*sigma1];%Интервальная оценка для математического ожидания
xsigma1 = sqrt((1/(xn-1))*sum((x-xm1).^2)); %эффективная оценка с.к.о. для выборки из 20 значений xk1 = tinv((1+Q)/2, xn-1);%коэффициент Стьдента для выборки из 20 значений xIOMO = [xm1-xk1*(1/xn)*xsigma1,xm1+xk1*(1/xn)*xsigma1];%Интервальная оценка математического ожидания для выборки из 20 значений
sigma2 = (1/(n-1))*sum((X-m1).^2);%эффективная оценка дисперсии k21 = chi2inv((1+Q)/2, n-1);%квантили распределения хи-квадрат k22 = chi2inv((1-Q)/2, n-1); IOD = [(sigma2*(n-1))/k21,(sigma2*(n-1))/k22];%интервальная оценка для дисперсии
xsigma2 = (1/(xn-1))*sum((x-xm1).^2);%эффективная оценка дисперсии для выборки из 20 значений xk21 = chi2inv((1+Q)/2, xn-1);%квантили распределения хи-квадрат для выборки из 20 значений xk22 = chi2inv((1-Q)/2, xn-1); xIOD = [(xsigma2*(xn-1))/xk21,(xsigma2*(xn-1))/xk22];%интервальная оценка для дисперсии для выборки из 20 значений
%3.2 nptp = [X(2), X(n-2)];%непараметрические толерантные пределы K=3; %следовательно непараметрическим толерантным пределам мы %имеем право взять 1, n-2 и n-1 и отбросить %3.3 kp = 2.3637;%параметрический толерантный множитель ptp = [xm1-kp*xsigma1, xm1+kp*xsigma1];%параметрические толерантные пределы %Согласно таблице "Минимально необходимый объем выборки %для нахождения непараметрических толерантных пределов, %накрывающих с доверительной вероятностью Q %интерквантильный промежуток вероятностной меры 0,95.
%4 alf = 0.05;%уровень значимости D = sqrt(-(log(alf/2))/(2*n))-1/(6*n);%критическое значение для критерия Колмогорова-Смирнова omega = 1/(12*n); for i = 1:n,
ff(i) = normpdf(X(i),m1,mC2.^(1/2)); %плотность распределения вероятности F(i) = normcdf(X(i),m1,mC2.^(1/2)); %функция распределения вероятности omega = omega+(F(i)-(2*i-1)/(2*n))^2;%критерий "омега-квадрат" Мизеса end;
plot(X,ff,'r');%построение плотности распределения вероятности plot(X,F,'r');%построение функции распределения вероятности
f1 = (1:201)/201; f2 = (0:200)/201; d1 = max(abs(F-f1)); d2 = max(abs(F-f2));
Dp = max([d1,d2]);%максимальная разница между %гипотетической функцией распределения и выборочной функцией %распределения для оценки по критерию Колмогорова-Смирнова
|