آزمون کولموگروف-اسمیرنوف (KS)

آزمون کولموگروف-اسمیرنوف (Kolmogorov-Smirnov) یک آزمون آماری ناپارامتریک است که برای بررسی توزیع داده‌ها استفاده می‌شود. بیشتر پژوهشگران برای انتخاب آزمون آماری مناسب بویژه در آمار کاربردی مدیریت از این روش استفاده می‌کنند. نظر به اهمیت موضوع در این مقاله، کاربردها، محدودیت‌ها، روش انجام آزمون با نرم‌افزار SPSS و شیوه تحلیل «آزمون کولموگروف-اسمیرنوف» تشریح خواهد شد.

آشنایی با آزمون کولموگروف-اسمیرنوف (KS)

این آزمون نوعی سنجش فاصله میان توزیع تجربی داده‌ها و یک توزیع نظری )مانند توزیع نرمال( است. معیار اصلی در این آزمون، بیشترین فاصله میان تابع توزیع تجمعی مشاهده‌شده و تابع توزیع تجمعی نظری است. هرچه این فاصله بزرگ‌تر باشد احتمال غیرنرمال بودن داده‌ها بیشتر می‌شود.

به بیان آماری، آزمون کوموگروف-اسمیرنوف نوعی آزمون نیکوئی برازش برای مقایسه یک توزیع نظری با توزیع مشاهده شده است.

بیشتر پژوهشگران داخلی از آزمون کولموگروف-اسمیرنوف برای آزمون نرمال بودن داده‌ها استفاده می‌کنند. همچنین از این آزمون می‌توان برای بررسی توزیع یکنواخت، نمایی و پواسون نیز استفاده کرد. با این وجود استفاده از این آزمون محدودیت‌هایی نیز به همراه دارد که پژوهشگران باید از آن آگاه باشند.

تحلیل آماری پایان‌نامه و رساله دکتری

راهنمای تحلیل آماری پایان‌نامه و رساله دکتری مدیریت:

  • تحلیل داده‌های آماری با روش‌های کمی
  • تحلیل و کدگذاری مصاحبه با روش‌های کیفی
  • تحلیل آماری پایان‌نامه کارشناسی ارشد
  • تجزیه‌وتحلیل روش‌های آمیخته رساله دکتری
مشاوره تحلیل آماری
تحلیل آماری پایان‌نامه

آزمون کولموگروف-اسمیرنوف در SPSS

برای استفاده از آزمون کولموگروف-اسمیرنف مانند آزمون من-ویتنی فرمان زیر را اجرا کنید:

Analyze→ Nonparametric Tests →Leagcy Dialogs→۱-Sample K-S…

در کادر ظاهر شده گزینه Kolmogorov-smirnov را فعال کنید.

آزمون کولموگروف-اسمیرنوف

آزمون کولموگروف-اسمیرنوف

البته این آزمون کاربردهای دیگری نیز دارد که عبارتند از:

  • برای مقایسه توزیع مشاهده شده با توزیع نرمال گزینه Normal را فعال کنید.
  • جهت مقایسه توزیع مشاهده شده با توزیع یکنواخت گزینه Uniform را فعال کنید.
  • برای مقایسه توزیع مشاهده شده با توزیع پواسون گزینه Poisson را فعال کنید.
  • برای مقایسه توزیع مشاهده شده با توزیع نمائی گزینه Exponential را فعال کنید.

تفسیر آزمون کولموگروف-اسمیرنوف

هنگام بررسی یکنواخت بودن دادهها، فرض صفر مبتنی بر اینکه توزیع داده‌ها یکنواخت است را در سطح خطای ۰.۰۵ تست می‌شود. اگر مقدار معناداری بزرگتر یا مساوی سطح خطا (۵%) بدست آید، در این صورت دلیلی برای رد فرض صفر وجود نخواهد داشت. به عبارت دیگر توزیع داده‌ها یکنواخت خواهد بود.

هنگام بررسی نرمال بودن داده‌ها ما فرض صفر مبتنی بر اینکه توزیع داده‌ها نرمال است را در سطح خطای ۵% تست می‌کنیم. برای آزمون نرمالیته فرض‌های آماری به صورت زیر تنظیم می‌شود:

H0 : توزیع داده‌های مربوط به هر یک از متغیرها نرمال است

H1 : توزیع داده‌های مربوط به هر یک از متغیرها نرمال نیست

بنابراین اگر آماره آزمون بزرگتر مساوی ۰.۰۵ بدست آید، در این صورت دلیلی برای رد فرض صفر وجود نخواهد داشت. به عبارت دیگر توزیع داده‌ها نرمال است.

آزمون کولموگروف-اسمیرنوف برای پرسشنامه

آیا می‌توان از آزمون کولموگروف-اسمیرنوف برای بررسی نرمال بودن داده‌های پرسشنامه طیف لیکرت استفاده کرد؟

اجازه دهید پاسخ را ابتدا بدهم: خیر. داده‌های طیف لیکرت در مقیاس ترتیبی تهیه می‌شوند. داده‌هایی که مقیاس اندازه‌گیری آنها ترتیبی باشد برای آزمون KS مناسب نیستند. همه مشاهدات در متغیرهای نمونه‌برداری شده باید در هر مشاهده مستقل از مشاهده دیگر باشد. هر مشاهده فقط در یکی از مقوله‌های مرتب شده قرار گیرد. این شرایط در داده‌هایی که با طیف لیکرت اندازه‌گیری می‌شوند وجود ندارد. بنابراین نمی‌توان از آزمون کولموگروف-اسمیرنوف برای بررسی نرمال بوده داده‌های پرسشنامه طیف لیکرت استفاده کرد (فرجی، ۱۳۸۵ : ۲۱۸).

آیا حجم نمونه برای آزمون کولموگروف-اسمیرنوف محدودیتی دارد؟

حجم نمونه در آزمون KS محدودیتی ندارد و این آزمون برخلاف آزمون خی-دو با هر تعدادی از نمونه قابل انجام است. شرایط آزمون KS مانند شرایط آزمون تک متغیری خی-دو است. با این تفاوت که مقوله‌های متغیر مورد بررسی باید دارای ترتیب معینی باشند بطوریکه هر مشاهده ضمن استقلال از سایر مشاهدات باید تنها در یکی از مقوله‌ها قرار گیرد (فرجی، ۱۳۸۵ : ۲۱۹).

برخلاف آنچه در برخی مقاله‌ها به آن استناد می‌شود آزمون KS فقط برای داده‌های کوچک (کمتر از ۳۰ تا) کاربرد ندارد. البته نتایج این آزمون برای داده‌های کوچک طیف لیکرت معمولاً با نتایج چولگی و کشیدگی داده‌ها همراستا است. اما برای داده‌های زیاد نتایج این آزمون با نتایج چولگی و کشیدگی و همینطور خط نرمال در نمودار هیستوگرام همخوانی ندارد.

آشنایی با آندری کولموگروف و نیکولای اسمیرنوف

آندری کولموگروف (Andrey Kolmogorov)

کولموگروف یکی از مهم‌ترین ریاضی‌دانان سده بیستم است و نقش اساسی در پایه‌گذاری نظریه مدرن احتمال داشته است. او چارچوب دقیق و axiom-based برای احتمال ارائه کرد و بسیاری از مفاهیم بنیادی این حوزه بر پایه کارهای او شکل گرفت. فعالیت‌های علمی او تنها محدود به احتمال نبود و در حوزه‌های پردامنه‌ای مانند نظریه اطلاعات، فرآیندهای تصادفی، و آنالیز ریاضی نیز اثرگذاری عمیق داشت.

نیکولای اسمیرنوف (Nikolai Smirnov)

اسمیرنوف ریاضی‌دانی برجسته در حوزه آمار و به‌ویژه آزمون‌های ناپارامتریک بود. او در بررسی توزیع‌های آماری، روش‌های سنجش تطابق توزیع‌ها و تحلیل داده‌های تجربی سهم مهمی داشت. بسیاری از روش‌های مقایسه توزیع‌ها، از جمله آزمون معروف کولموگروف–اسمیرنوف که حاصل کار مشترک او با کولموگروف است، بر پایه پژوهش‌های او گسترش یافت. آشنایی با او به دانشجویان نشان می‌دهد که چگونه بنیان‌های آزمون‌های آماری بر کار پژوهشگران پیشین استوار شده است.

سخن پایانی

آزمون کولموگروف-اسمیرنوف ابزاری مهم و کاربردی برای سنجش نرمال بودن داده‌هاست. استفاده درست از آن، دقت تحلیل آماری را افزایش می‌دهد و مانع برداشت‌های نادرست در پژوهش می‌شود. اگر در پژوهش خود نیاز دارید پیش‌فرض نرمال بودن را بررسی کنید، این آزمون یکی از بهترین گزینه‌هاست. برای آگاهی بیشتر در این زمینه انواع مقیاس اندازه‌گیری متغیرها را مطالعه کنید. در نهایت باید عنوان کرد اگر از پرسشنامه‌ای با طیف لیکرت استفاده می‌کنید بهتر است از چولگی و کشیدگی داده‌ها برای بررسی نرمال بودن استفاده نمایید.

فهرست منابع

حبیبی، آرش؛ سرآبادانی، مونا. (۱۴۰۱). آموزش کاربردی SPSS. تهران: نارون‌دانش.

فرجی، نصرالله. (۱۳۸۵). آمار توصیفی و استنباطی. تهران: پوران پژوهش.

سوالات متداول

آیا می‌توان از آزمون کولموگروف–اسمیرنوف برای بررسی نرمال بودن داده‌های پرسشنامه طیف لیکرت استفاده کرد؟

داده‌های لیکرت ماهیت رتبه‌ای دارند و فاصله‌های مساوی میان گزینه‌ها تضمین‌شده نیست. بنابراین استفاده از آزمون‌های نرمال‌سنجی برای این نوع داده‌ها از نظر نظری توصیه نمی‌شود. با این حال، بسیاری از پژوهش‌های مدیریتی در صورت داشتن حجم نمونه بالا و تجمیع چند گویه، داده‌ها را تقریباً پیوسته فرض می‌کنند. اگر داده‌ها تک‌گویه یا با توزیع شدیداً نامتعادل باشند، بهتر است از روش‌های ناپارامتریک استفاده کنید.

تفاوت آزمون کولموگروف–اسمیرنوف با آزمون شاپیرو–ویلک چیست؟

شاپیرو–ویلک برای سنجش نرمال بودن طراحی شده و برای نمونه‌های کوچک دقت بیشتری دارد. کولموگروف–اسمیرنوف فقط براساس فاصله میان توزیع تجربی و توزیع نظری تصمیم می‌گیرد و نسبت به نقطه‌های پرت حساس است. در عمل، شاپیرو–ویلک معمولاً انتخاب مناسب‌تری برای نرمال‌سنجی است، به‌ویژه اگر حجم نمونه کم باشد.

اگر نتیجه آزمون کولموگروف–اسمیرنوف نشان دهد داده‌ها نرمال نیستند، چه باید کرد؟

ابتدا نمودارها و شاخص‌های توصیفی را بررسی کنید تا مشخص شود انحراف شدید است یا نه. در صورت انحراف زیاد، می‌توانید از تبدیل داده‌ها (مانند لگاریتم یا ریشه دوم) یا روش‌های ناپارامتریک استفاده کنید. اگر انحراف اندک باشد و حجم نمونه بالا، معمولاً تحلیل‌های پارامتریک همچنان پایدار خواهند بود.

آیا حجم نمونه بر نتیجه آزمون کولموگروف–اسمیرنوف تأثیر دارد؟

بله. هرچه حجم نمونه بزرگ‌تر باشد، احتمال رد شدن فرض نرمال بودن بیشتر است، حتی اگر انحراف توزیع اندک باشد. به همین دلیل در نمونه‌های بزرگ توصیه می‌شود فقط براساس سطح معناداری تصمیم نگیرید و نمودارهای چگالی یا احتمال–احتمال را نیز بسنجید.