ضریب تعیین (تشخیص)

ضریب تعیین (Coefficient Of Determination) قدرت توضیح دهندگی مدل را نشان می‌دهد. ضریب تعیین نشان می‌دهد که چند درصد از تغییرات متغیر وابسته توسط متغیرهای مستقل توضیح داده می‌شود. تغییرات کل متغیر وابسته برابر است با تغییرات توضیح داده شده توسط رگرسیون بعلاوه تغییرات توضیح داده نشده. این شاخص یکی از شاخص‌های برازش مدل است که قدرت پیش‌بینی متغیر وابسته (ملاک) براساس متغیرهای مستقل (پیش‌بین) را نشان می‌دهد. مقدار این شاخص بین صفر تا یک می‌باشد و اگر از ۰/۶ بیشتر باشد نشان می‌دهد متغیرهای مستقل تا حد زیادی توانسته‌اند تغییرات متغیر وابسته را تبیین کنند.

ضریب تشخیص در معادلات رگرسیونی با علامت R2 نشان داده می‌شود و بیانگر میزان احتمال هم‌بستگی میان دو دسته داده در آینده می‌باشد. این ضریب در واقع نتایج تقریبی پارامتر موردنظر در آینده را بر اساس مدل ریاضی تعریف شده که منطبق بر داده‌های موجود است، بیان می‌دارد. در واقع معیاری است از این که خط رگرسیون، چقدر خوب خوانده‌ها را معرفی می‌کند. اگر خط رگرسیون از تمام نقاط بگذرد توانائی معرفی همه متغیرها را دارد و هرچه از نقاط دورتر باشد نشان دهنده توانائی کمتر است. در این مقاله روش استفاده از این شاخص در رگرسیون، حداقل مربعات جزئی و مدل معادلات ساختاری توضیح داده شده است.

فرمول محاسبه ضریب تعیین (تشخیص) از نظر آماری

با توجه به اینکه

SST: مجموع توان دوم خطاها زمانی که از متغیر‌های مستقل (X ها) استفاده نشود.

SSE: مجموع توان دوم خطاها زمانی که از متغیر‌های مستقل (X ها) استفاده شود.

پارامتر SSR را مجموع توان دوم رگرسیون نامید و کاهش در مجموع توان دوم خطا‌ها به خاطر استفاده از متغیر‌های مستقل (x ها) را نشان می‌دهد. هر چه SSR بزرگتر باشد بهتر است و اگر SSR = 0 باشد رابطه رگرسیونی اصلا کاربرد نداشته است.

SSR = SST – SSE

می دانیم SSR کاهش تغییر پذیری (خطا) به خاطر استفاده از متغیرهای مستقل است. نسبت این کاهش را با R2 نشان داده و ضریب تعیین می‌نامیم.

R2 = SSR/SST

بنابراین مقادیری که R2 می‌تواند اختیار کند بین صفر و یک می‌باشد:

اگر R2 = 1 باشد آن گاه SSR=SST یا به عبارتی SSE = 0 یعنی زمانی که از متغیرهای مستقل استفاده کنید هیچ خطای وجود ندارد که این بهترین حالت ممکن است.

اگر R2 = 0 باشد آن گاه SSR=0 یا به عبارتی SSE = SSR یعنی استفاده از متغیر‌های مستقل هیچ تاثیری بر برآورد خط رگرسیونی ندارد.

محاسبه ضریب تـعیین در SPSS

برای این منظور از رگرسیون خطی استفاده می‌شود.

از منوی Analyze گزینه Regression فرمان Linear را اجرا کنید.

متغیر وابسته تعهد را به کادر Dependent وارد کنید. در تکنیک رگرسیون خطی فقط می‌توان یک متغیر را به کادر Dependent وارد کنید.

متغیر یا متغیرهای مستقل را به کادر Independent وارد کنید.

با تایید این کار چندین جدول در خروجی ظاهر خواهد شد.

برای مشاهده ضریب تعیین از جدول Model Summary استفاده کنید.

جدول ضریب تعیین در SPSS

جدول ضریب تعیین در SPSS

براساس نتایح این جدول متغیرهای پیش بین توانسته‌اند ۲۸% از تغییرات در متغیر وابسته را تبیین کنند.

تفاوت ضریب تعیین و ضریب تعیین تعدیل‌شده

ضریب تعیین فرض می‌کند که هر متغیر مستقل  مشاهده  شده در مدل، تغییرات موجود در متغیر وابسته را تبیین می‌کند. بنابراین درصد نشان داده شده توسط این شاخص با فرض تاثیر همه متغیرهای مستقل بر متغیر وابسته می‌باشد. در صورتی که  درصد نشان داده شده  توسط R2 تعدیل شده فقط حاصل از تاثیر واقعی متغیرهای مستقل مدل بر وابسته ( نه همه متغیرهای مستقل) است. تفاوت دیگراین است که مناسب بودن متغیرها برای مدل توسط R2 حتی با وجود مقدار بالا قابل مشخص نیست در صورتی که می‌توان به مقدار براورد شده ضریب تعیین تعدیل شده اعتماد کرد.

ضریب تعیین تعدیل‌شده

ضریب تعیین تعدیل‌شده

در این رابطه N تعداد کل مشاهدات، P تعداد متغیرهای پیش‌بین و R2 ضریب تعیین است. این شاخص نیز در جدول خلاصه مدل در خروجی رگرسیون قابل مشاهده است.

آیا ضریب تعیین معیار مناسبی برای تبیین میزان تاثیر متغیر مستقل بر متغیر وابسته است؟

خیر. چون با افزایش مشاهدات و هم چنین با افزایش متغیرهای مستقل میزان R2 افزایش می‌یابد این افزایش ممکن است کاذب باشد.

برای رفع این مشکل به R2 تعدیل شده نیاز داریم. مقدار تعدیل شده میزان R2 را با توجه به متغیرهای مستقل اضافه شده به خط رگرسیون و با توجه به عرض از مبداهای جدید، تعدیل و اصلاح می‌کند. هرچه تفاوت بین R2 و R2 تعدیل شده کمتر باشدنشان می‌دهد که متغیرهای مستقل که به مدل اضافه شده‌اند به درستی انتخاب شده‌اند.

محاسبه ضریب تعیین در PLS

ضریب تعیین یکی از پنج معیار اصلی برازش مدل در روش حداقل مربعات جزئی است. این شاخص بیانگر میزان تغییرات هر یک از متغیرهای وابسته مدل است که به وسیله متغیرهای مستقل تبیین می‌شود. گفتنی است که مقدار R2 تنها برای متغیرهای درون‌زای مدل ارائه می‌شود و در مورد سازه‌های برون‌زا مقدار آن برابر صفر است. هرچه مقدار R2 مربوط به سازه‌های درون‌زای مدل بیشتر باشد، نشان از برازش بهتر مدل است.

چین (۱۹۹۸) سه مقدار ۰/۱۹، ۰/۳۳ و ۰/۶۷ را به عنوان مقدار ملاک برای مقادیر ضعیف، متوسط و قوی بودن برازش بخش ساختاری مدل به وسیله معیار R2 تعریف کرده است. همچنین در نرم‌افزار نسخه شماره ۳ این نرم‌افزار هم ضریب تعیین و هم ضریب تعیین تعدیل‌شده محاسبه می‌گردد. برای مطالعه بیشتر به بحث شاخص‌های برازش حداقل مجذورات جزئی رجوع کنید.

منبع: حبیبی، آرش؛ سرآبادانی، مونا. (۱۴۰۱). آموزش کاربردی SPSS. تهران: نارون.