رابطه متغیرهای اسمی
رابطه متغیرهای اسمی با توجه به تعداد طبقات هر متغیر اسمی و جهتگیری پژوهشگر، میتواند با روشهای گوناگون آماری مورد آزمون قرار گیرد. متغیرهای اسمی متغیرهایی هستند که در سطح اسمی اندازهگیری میشوند و رتبهبندی ذاتی ندارند. نمونههایی از متغیرهای اسمی که معمولاً در مطالعات علوم اجتماعی مورد ارزیابی قرار میگیرند عبارتند از جنسیت، سن، تصحیلات و سابقهکاری. مهمترین روشهای بررسی رابطه متغیرهای اسمی در نرمافزار SPSS در این آموزش ارائه شده است.
روشهای برآورد رابطه متغیرهای اسمی
مقیاس اسمی (Nominal Scale) برای اندازهگیری متغیرهای مقولهای به کار میرود. این مقیاس شامل حداقل دو مقوله متمایز است که هیچگونه تقدم یا تأخر در آن وجود ندارد. به عبارت دیگر میان مقولههای مقیاس اسمی نمیتوان ترتیب خاصی درنظر گرفت. مثلاً برای متغیر جنسیت، دو مقوله نمیتوان ترتیب ویژهای منظور داشت. برای مطالعه بیشتر آموزش مقیاس اندازهگیری متغیرها را مطالعه کنید.
برای بررسی ارتباط میان متغیرهای اسمی چهار نوع ضریب همبستگی قابل بکارگیری است:
- ضریب همبستگی پیوستگی (Contingency coefficicent)
- ضریب فی و ضریب V کرامر (Phi and Cramer’s V)
- ضریب لمبدا (Lambda)
- ضریب غیر قطعی (Uncertainy coefficient)
برخی نیز با استناد به جدول متقاطع به تحلیل روابط میان متغیرهای اسمی میپردازند. هر یک از این روشها در این آموزش تشریح شده است.
- در نرم افزار SPSS وجود دارد که در ادامه به اختصار توضیح داده میشوند.
جدول متقاطع برای برررسی رابطه متغیرهای اسمی
جدول متقاطع (Crosstab) نشان میدهد که آیا قرار گرفتن در یک دسته از متغیر مستقل باعث میشود که یک مورد در دسته خاصی از متغیر وابسته قرار گیرد یا خیر. این به پژوهشگران اجازه میدهد تا ارتباط بین دو متغیر مقولهای را بررسی کنند. برای نمونه با استفاده از چنین جدولی میتوان رابطه بین جنسیت و تحصیلات را مورد سنجش قرار داد.
الگوهای ارتباط را میتوان به سادگی با مقایسه فراوانیهای مشاهده شده در ردیفهای جدول و مقایسه آن با فراوانیهای مورد انتظار برآورد شده بررسی کرد.
خی-دو
استفاده از آزمون خی-دو استقلال به پژوهشگران امکان میدهد ارزیابی کنند که آیا رابطه مشاهده شده بین متغیرهای اسمی در یک نمونه خاص نیز احتمالاً در جامعه یافت میشود یا خیر. با این حال، اگر حجم نمونه کافی نباشد، این آزمایش ممکن است مناسب نباشد.
چندین معیار نیز وجود دارد که به پژوهشگران اجازه میدهد تا قدرت ارتباط بین دو متغیر اسمی را ارزیابی کنند. چنین معیارهایی شبیه ضریب همبستگی هستند، زیرا دارای محدودههای خاصی هستند که در آن قرار میگیرند و بنابراین یک روش استاندارد برای صحبت در مورد قدرت ارتباط بین دو متغیر اسمی ارائه میدهند.
هر یک از معیارهای زیر از مقدار Chi-Square محاسبه شده برای جدول جدول بندی مورد علاقه استفاده میکند. ضریب احتمالی به صورت زیر محاسبه میشود:
CC = √ X2 / X2 + N
این اندازه گیری بین ۰ و ۱ است و مقادیر نزدیک به ۱ نشان دهنده ارتباط قوی تر بین متغیرها است. CC به اندازه جدول بسیار حساس است و بنابراین باید با احتیاط تفسیر شود.
یک قانون کلی برای تفسیر قدرت روابط این است:
کمتر از ۰.۱۰ = ضعیف
بین ۰.۱۱ تا ۰.۳۰ = متوسط
بزرگتر از .۳۱ = قوی
ضریب فی کرامر
اگر فرمول ضریب همبستگی پیرسون را بر روی متغیرهای دو مقولهای به کار ببریم، به ضریبی که از این روش به دست میآید، ضریب همبستگی فی گفته شود. برای بررسی ارتباط میان دو متغیر اسمی که هر کدام دارای دو سطح هستند ضریب همبستگی فی کرامر مناسب است. برای نمونه برای بررسی رابطه بین جنسیت و ترک خدمت کارکنان در یک بازه زمانی مشخص از این آزمون استفاده کرد.
معیار ارتباطی که برای جداول ۲×۲ استفاده میشود ضریب فی است:
φ = √ X2 / N
باز هم، اندازه گیری بین ۰ و ۱ با مقادیر بالاتر به معنای ارتباط قوی تر است.
ضریب وی کرامر (Cramer’s V)
وقتی جدول جدول متقاطع بزرگتر از ۲×۲ باشد، Cramer’s V بهترین انتخاب است:
V = √ X2 / N (k-1)
در اینجا، N اندازه نمونه و k کوچکتر از تعداد سطرها یا ستونها است (بنابراین برای یک جدول ۳×۴ ۳ خواهد بود).
لامبدا
این شاخص یک ضریبی از ارتباط میان دو متغیر اسمی است که به کاهش نسبی خطا در پیش بینی متغیر وابسته برحسب متغیر مستقل اشاره دارد.
ضریب لاندای ۱ نشاندهنده آن است که متغیر مستقل به طور کامل متغیر وابسته را پیشبینی میکند.
ضریب لاندای صفر نشاندهنده آن است که متغیر مستقل هیچ کمکی به پیشبینی متغیر وابسته نمیکند.
برخلاف معیارهای مبتنی بر Chi-Square فوق، لامبدا یک اندازهگیری کاهش نسبتی در خطا (PRE) است که به عنوان مقدار واریانس محاسبه شده در پیش بینی متغیر وابسته که میتواند توسط متغیر مستقل نسبت داده شود، تفسیر میشود.
راه دیگری برای گفتن این است: اگر مقدار مورد را در متغیر مستقل بدانیم چقدر بهتر است حدس بزنیم که هر مورد در کدام دسته از متغیر وابسته قرار میگیرد؟ بسیار شبیه به مربع R در رگرسیون (که همچنین یک اندازه گیری PRE است)، لامبدا اغلب به عنوان یک درصد نشان داده میشود. لامبدا یک اندازه گیری جهت دار است که بر اساس آن که کدام متغیر به عنوان متغیر مستقل در نظر گرفته میشود، محاسبه متفاوت است.
تمامی معیارهای مرتبط با بالا با کلیک بر روی دکمه Statistics هنگام درخواست جدول بندی متقاطع در SPSS در دسترس هستند. لامبدا در هر دو جهت محاسبه میشود و هر متغیر را مستقل در نظر میگیرد. سه معیار دیگر متقارن هستند، به این معنی که مهم نیست که کدام متغیر مستقل در نظر گرفته شود
مفروضات:
حجم نمونه مناسب برای هر یک از دسته بندیهای مورد تجزیه و تحلیل.
متغیرها باید دسته بندی شوند.
اگر صفر در جدول بندی متقاطع وجود داشته باشد، هیچ ارتباطی نمی تواند ارزیابی شود.
جمعبندی بررسی رابطه متغیرهای اسمی
رابطه متغیرهای اسمی مانند جنسیت، سن، تحصیلات و مواردی مانند آن میتواند با آزمون خی-دو، ضریب فی و وی کرامر و لامبدا بررسی شود. بهترین روش در این زمینه وجود ندارد و یا دستکم منبع روشنی برای اینکه بهترین روش کدام است وجود ندارد. بهنظر میرسد انتخاب بهترین روش به تشخیص پژوهشگر بستگی دارد و باید با توجه به موضوع انتخاب شود.
نگارنده: پشتیبانی پارسمدیر | آمار کاربردی مدیریت | ۱۰ دی ۰۲
بسیاری از دانشجویان و حتی برخی از اساتید گرامی به دلیل تشتت آراء و نبود اتفاق نظر و تفاوت روشهای تعیین رابطه میان متغیرهای اسمی، در چگونگی بکارگیری آزمون های آماری متناسب با متغیرهای اسمی دچار سردرگمی و تردید هستند. بهنظرم باید از جداول متقاطع (کراستب) برای این منظور استفاده شود که بسیار گویا و ساده است.