Posted on

آزمون نرمال بودن داده ها

برای بررسی نرمال بودن داده ها می توان نمودار چندک-چندک را رسم کرد. برای رسم این نمودار در R :

qqnorm(x)
qqline(x)

برای انجام آزمون جهت بررسی نرمال بودن داده ها آزمون شاپیرو-ویلک و آزمون کلموگروف-اسمیرنوف را می توان انجام داد. دستور این دو آزمون در R به صورت زیر تعریف می شود:

shapiro.test(x)
ks.test(x , “pnorm”)

در آزمون کلموگروف اسمیرنف علاوه بر توزیع نرمال می توان تابع توزیع پیوسته دیگری چون گاما را نیز بررسی کرد.

مثال-

x<-c(5,25,10,0,3,12,14,12,32,8,4,20,14,18,16,10,1,22,5,23,9)
qqnorm(x)
qqline(x)


shapiro.test(x)

Shapiro-Wilk normality test

data: x
W = 0.96623, p-value = 0.649

با توجه به مقدار p-value دلیلی بر رد فرض صفر نداریم. باید توجه کرد که در این آزمون فرض صفر نرمال بودن توزیع داده هاست که در این جا این فرض رد نشده و داده ها از توزیع نرمال پیروی می کنند.

ks.test(x , “pnorm”)

One-sample Kolmogorov-Smirnov test

data: x
D = 0.90341, p-value = 2.554e-15
alternative hypothesis: two-sided

در آزمون کولموگروف اسمیرنوف فرض صفر عدم پیروی از داده ها از توزیع مورد نظر – در اینجا توزیع نرمال- است. بنابر این رد شدن فرض صفر با توجه به مقدار p-value نرمال بودن داده ها را نشان می دهد. فرض نرمال نبودن داده ها رد شده پس داده ها نرمال اند.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *