آزمون شاپیرو-ویلک

آزمون شاپیرو-ویلک یک روش آمار ناپارامتریک است که برای بررسی نرمال بودن داده‌ها استفاده می‌شود و کاربردی مشابه آزمون کولموگروف-اسمیرنوف دارد. از نتایج این آزمون می‌توان برای انتخاب آزمون‌های آماری یعنی آزمون‌های پارامتریک و ناپارامتریک بهره گرفت. نظر به اهمیت موضوع در این مقاله «آزمون شاپیرو-ویلک» تشریح خواهد شد.

آشنایی با آزمون شاپیرو-ویلک

آزمون شاپیرو-ویلک یک آزمون آماری برای بررسی نرمال بودن توزیع داده‌ها است. در آمار مدیریت و علوم اجتماعی، این آزمون به‌طور گسترده برای بررسی فرضیه نرمال بودن پیش از انجام تحلیل‌های پارامتریک استفاده می‌شود.

پس از بررسی عادی یا نرمال بودن چولگی و کشیدگی توزیع داده‌ها، می‌توان از این آزمون استفاده کرد. هنگام بررسی نرمال بودن داده‌ها ما فرض صفر مبتنی بر اینکه توزیع داده‌ها نرمال است را در سطح خطای ۵% تست می‌کنیم.

بنابراین اگر آماره آزمون بزرگتر مساوی ۰.۰۵ بدست آید، در این صورت دلیلی برای رد فرض صفر مبتنی بر اینکه داده نرمال است، وجود نخواهد داشت. به عبارت دیگر توزیع داده‌ها نرمال خواهد بود.

تحلیل آماری پایان‌نامه و رساله دکتری

راهنمای تحلیل آماری پایان‌نامه و رساله دکتری مدیریت:

  • تحلیل داده‌های آماری با روش‌های کمی
  • تحلیل و کدگذاری مصاحبه با روش‌های کیفی
  • تحلیل آماری پایان‌نامه کارشناسی ارشد
  • تجزیه‌وتحلیل روش‌های آمیخته رساله دکتری
مشاوره تحلیل آماری
تحلیل آماری پایان‌نامه

آزمون شاپیرو-ویلک در SPSS

جهت انجام این دو آزمون فرمان زیر را اجرا کنید:

Analyze/Descriptive Statistics/Explore

در کادر باز شده متغیرهای موردنظر را وارد لیست Dependent list کنید و سایر جاها را خالی بگذارید.

آزمون شاپیرو-ویلک

آزمون شاپیرو-ویلک

دکمه Plots را با آرامش و بسیار آرام بفشارید.

در کادر Plots گزینه Normality plots with tests را تیک دار کنید.

آزمون شاپیرو و یلک

تفسیر آزمون شاپیرو و یلک

با این عمل خروجی شامل جدولی تحت عنوان Tests of Normality است که به شما دو مقدار سطح معناداری را برای هر کدام از متغیر‌ها به طور مجزا می‌دهد. این مقادیر در تشخیص نرمال بودن داده‌ها تعیین کننده است.

چنانچه سطح معناداری در آزمون Shapiro-Wilk یا آزمون کولموگروف-اسمیرنوف که در این جدول با sig. نمایش داده می‌شود بیشتر از ۰.۰۵ باشد می‌توان داده‌ها را با اطمینان بالایی نرمال فرض کرد. در غیر این صورت نمی‌توان گفت که داده‌ها توزیع‌شان نرمال است.

مقایسه شاپیرو-ویلک و کولموگروف-اسمیرنوف

شاپیرو-ویلک بیشتر برای بررسی نرمال بودن داده‌ها استفاده می‌شود و حساسیت بالاتری نسبت به انحراف‌های کوچک از نرمال دارد، بنابراین برای نمونه‌های کوچک تا متوسط (معمولاً کمتر از ۵۰ تا حدود ۲۰۰۰) مناسب است. آماره آن W نام دارد و هرچه به ۱ نزدیک‌تر باشد، داده‌ها نرمال‌تر هستند.

کولموگروف-اسمیرنوف برای مقایسه توزیع نمونه با یک توزیع مرجع مانند نرمال به کار می‌رود و حساسیت آن در میانه توزیع کمتر است. این آزمون بیشتر برای نمونه‌های بزرگ کاربرد دارد و آماره آن D بر اساس بیشترین فاصله تجمعی بین توزیع نمونه و مرجع محاسبه می‌شود.

در عمل، شاپیرو-ویلک در پژوهش‌های مدیریتی و اجتماعی کاربرد گسترده‌تری دارد، زیرا نمونه‌ها اغلب کوچک تا متوسط هستند و نیاز به حساسیت بیشتر برای شناسایی انحراف‌های جزئی از نرمال بودن وجود دارد. شناخت توزیع داده‌ها پیش‌نیاز انتخاب آزمون‌های مناسب و اعتبار تحلیل‌های آماری است.

آشنایی با ساموئل شاپیرو و مارتین ویلک

ساموئل شاپیرو (Samuel Shapiro)

شاپیرو یک آمارشناس آمریکایی بود که در نیمه دوم سده بیستم در زمینه روش‌های ناپارامتریک و آزمون‌های نرمال‌سنجی فعالیت داشت. او در صنعت و پژوهش‌های کاربردی کار می‌کرد و یکی از دغدغه‌های اصلی‌اش طراحی آزمونی بود که در نمونه‌های کوچک عملکرد دقیق‌تری از روش‌های موجود داشته باشد. نتیجه این تلاش‌ها، همکاری با ویلک و ارائه آزمونی شد که امروز به‌عنوان یکی از معتبرترین روش‌های سنجش نرمال بودن داده‌ها شناخته می‌شود.

مارتین ویلک (Martin Wilk)

ویلک آمارشناس کانادایی–آمریکایی و از پژوهشگران اثرگذار در آمار کاربردی بود. او سابقه فعالیت در دانشگاه، صنعت و نهادهای ملی مانند اداره آمار کانادا را داشت. علاقه اصلی او طراحی روش‌های پایا برای تحلیل توزیع‌ها و داده‌های تجربی بود. همکاری مشترک او با شاپیرو به ساخت آزمون شاپیرو–ویلک انجامید؛ آزمونی که به‌دلیل قدرت تشخیص بالا، به‌ویژه در نمونه‌های کوچک، در بیشتر رشته‌ها از جمله مدیریت و علوم رفتاری استفاده می‌شود.

سخن پایانی

آزمون شاپیرو-ویلک و کولموگروف-اسمیرنوف ابزارهایی برای سنجش نرمال بودن داده‌ها هستند، اما شاپیرو-ویلک به دلیل حساسیت بالاتر و مناسب بودن برای نمونه‌های کوچک، در تحلیل‌های مدیریتی و اجتماعی کاربرد گسترده‌تری دارد. شناخت توزیع داده‌ها پیش‌نیاز تصمیم‌گیری‌های آماری و انتخاب آزمون‌های مناسب است و باعث اعتبار بیشتر نتایج پژوهش و تحلیل داده‌ها می‌شود.

منبع: حبیبی، آرش؛ سرآبادانی، مونا. (۱۴۰۱). آموزش کاربردی SPSS. تهران: نارون.

سوالات متداول

آزمون شاپیرو-ویلک چه تفاوتی با آزمون کولموگروف-اسمیرنوف (KS) دارد؟

از نظر هدف، هر دو آزمون برای بررسی نرمال بودن داده‌ها به کار می‌روند و اساساً یک هدف آماری دارند. با این حال، تفاوت اصلی آنها در حساسیت و اندازه نمونه است. شاپیرو-ویلک حساسیت بیشتری نسبت به انحراف‌های کوچک از توزیع نرمال دارد و برای نمونه‌های کوچک تا متوسط مناسب‌تر است، در حالی که کولموگروف-اسمیرنوف بیشتر برای نمونه‌های بزرگ کاربرد دارد و در میانه توزیع حساسیت کمتری دارد. بنابراین انتخاب آزمون باید با توجه به حجم داده و میزان حساسیت مورد نیاز انجام شود.

آیا نتایج آزمون شاپیرو-ویلک با آزمون کولموگروف-اسمیرنوف همیشه یکسان است؟

نتایج این دو آزمون لزوماً یکسان نیست، زیرا هر آزمون از روش محاسباتی متفاوتی برای مقایسه داده‌ها با توزیع نرمال استفاده می‌کند. با این حال، تجربه پژوهشی نشان می‌دهد که در اغلب موارد، نتایج آنها مشابه است و هر دو آزمون در تشخیص نرمال بودن یا نبودن داده‌ها عملکرد قابل قبولی دارند. بنابراین تفاوت‌ها معمولاً جزئی بوده و در تحلیل‌های عملی، اختلاف زیادی ایجاد نمی‌کند.

کدام یک از این آزمون‌ها برای بررسی نرمال بودن داده‌ها بهتر است؟

هیچ منبع علمی به صراحت برتری یکی نسبت به دیگری را اعلام نکرده است و هر دو روش از نظر آماری معتبر هستند. اما نکته مهم این است که استفاده هم‌زمان از دو آزمون با هدف یکسان توصیه نمی‌شود، زیرا می‌تواند منجر به سردرگمی در تفسیر نتایج شود. پژوهشگران معمولاً یکی از دو آزمون را بر اساس حجم نمونه و حساسیت مورد انتظار انتخاب می‌کنند و آن را به عنوان معیار بررسی نرمال بودن داده‌ها در تحلیل‌های آماری خود قرار می‌دهند.

آیا می‌توان از آزمون شاپیرو-ویلک برای داده‌های پرسشنامه‌ای استفاده کرد؟

خیر، آزمون شاپیرو-ویلک برای داده‌های ترتیبی مانند طیف لیکرت مناسب نیست، زیرا این داده‌ها فاقد فاصله‌های برابر بین مقادیر هستند و فرض نرمال بودن در آنها قابل اعمال نیست. منابع علمی مرتبط توصیه می‌کنند که برای داده‌های ترتیبی از روش‌های غیرپارامتریک یا تحلیل‌های مبتنی بر رتبه استفاده شود، و آزمون‌های نرمال بودن را تنها برای داده‌های فاصله‌ای یا نسبتی به کار ببریم.