حداقل مربعات جزئی

آموزش حداقل مربعات جزئی : Partial Least Squares, PLS

منبع: حداقل مربعات جزئی نوشته آرش حبیبی

تکنیک Partial Least Squares یا حداقل مربعات جزئی یک روش ناپارامتریک است که جانشین مناسبی برای مدل معادلات ساختاری می باشد. روش حداقل مربعات جزئی به حجم نمونه حساسیت کمتری دارد و نیازی به نرمال بودن داده ها ندارد. بنابراین در موارد زیر جانشین مدلسازی معادلات ساختاری می شود:

  • زمانیکه حجم نمونه کوچک باشد
  • زمانیکه داده ها نرمال نباشد

دقت کنید اگر داده ها نرمال باشد یا نمونه بزرگ باشد هم می توان از حداقل مجذورات جزیی استفاده کرد.

نرم افزارهای متعددی برای حداقل مجذورات جزئی وجود دارد که مهمترین آنها عبارتند از:

یکی از عمده‌ترین دلایل گرایش دانشجویان به استفاده از تکنیک حداقل مربعات جزئی این است که این تکنیک به فرض نرمال بودن جامعه و همچنین حجم نمونه متکی نیست. این در حالی است که برای انجام تکنیک معادلات ساختاری و نرم‌افزار لیزرل به حجم انبوهی از داده‌ها نیاز است. برای حل مسائل حداقل مربعات جزئی یا PLS می توانید از نرم افزار SmartPLS استفاده کنید. نرم افزار smartpls یک نرم افزار رایگان است که دریافت آن کمی دردسر دارد ولی در وب سایت پارس‌ مدیر نحوه دانلود آن تشریح شده است.

طراحی مدل حداقل مربعات جزیی

مانند مدل معادلات ساختاری در اینجا نیز باید با دو مفهوم متغیر پنهان و متغیر مشاهده پذیر آشنا باشد. متغیرهای پنهان همان عامل های اصلی یا سازه ها هستند که در شکل زیر با دایره نمایش داده شده اند. این متغیرها می توانند مستقل یا وابسته باشند. متغیرهای مشاهده پذیر همان گویه ها یا سوالات پرسشنامه هستند که در شکل زیر با مستطیل نمایش داده شده اند.

ساختار مدل حداقل مجذورات جزیی

ساختار مدل حداقل مجذورات جزیی

مدل درونی و مدل بیرونی

مدل حداقل مجذورات جزئی به دو دو مدل بیرونی و مدل درونی قابل تفکیک است.

مدل بیرونی : مدل بیرونی یا Outer Model روابط گویه ها (سوالات پرسشنامه) با عامل ها (متغیرهای پنهان) را نشان می دهد و معادل تحلیل عاملی تاییدی یا مدل اندازه گیری در نرم افزار لیزرل و اموس می باشد.

مدل درونی : مدل درونی یا Inner Model مشابه تحلیل مسیر و بخش ساختاری یک مدل معادلات ساختاری است. پس از آزمون مدل بیرونی لازم است تا مدل درونی که نشانگر ارتباط بین متغیرهای پنهان است، ارایه شود. با استفاده از مدل درونی می توان به بررسی فرضیه های پژوهش مدل پرداخت.

مدل درونی و مدل بیرونی

مدل درونی و مدل بیرونی

تفسیر مدل حداقل مربعات جزئی

برای شناسایی قدرت و جهت روابط میان عناصر از تخمین استاندارد استفاده می شود. این مقادیر که در شکل فوق نیز قابل مشاهده است باید بالای ۰/۳ باشند. هرچه میزان بارعاملی بیشتر باشد قدرت روابط بیشتر است.

برای بررسی معناداری باید آماره t برآورد شود. برای این منظور از خودگردان سازی (بوت استراپینگ) یا برش جک-نایف استفاده می شود. اگر مقادیر آماره تی بالای ۱/۹۶ باشد رابطه معنادار است.

شاخص های برازش مدل

در تکنیک حداقل مجذورات جزئی بر خلاف مدل معادلات ساختاری شاخص های زیادی برای برازش وجود ندارد. معمولا سه شاخص برای برازش مدل درونی استفاده می شود که عبارتند از:

برای مطالعه بیشتر به بحث نیکویی برازش حداقل مجذورات جزئی رجوع کنید.

حجم نمونه حداقل مربعات جزئی

بحث تعیین حجم نمونه PLS یکی از مباحث مهم حداقل مجذورات جزئی است. حوزه دیگری که در آن مدلسازی معادلات ساختاری مبتنی بر کوواریانس پیشنهاد می شود، شرایطی است که در آن سایز نمونه کوچک است ، برای این رویکرد حداقل سایز نمونه باید ۱۰۰ باشد (بدون توجه به خصوصیات سایر داده ها) تا بتوان از راهکارهای مشکل ساز پرهیز کرد و به سطح پذیرش قابل قبولی دست یافت. حتی بسیاری از محققین، حداقل سایز نمونه را ۲۰۰ پیشنهاد می کنند تا از نتایجی که قابل تفسیر نیستند( مانند واریانس منفی و یا همبستگی بالای ۱) پرهیز شود. 

حداقل مربعات جزئی در شرایطی که نمونه بسیار کوچک است نیز می تواند مورد استفاده قرار بگیرد. اگرچه این گونه شرایط فقط برای تحلیل قدرت آماری می تواند بکار برده شود. مونت کارلو نشان داد که این رویکرد می تواند برای حجم نمونه کمتر از ۵۰ نیز بکار رود ، اچ. ولد با استفاده از ۲۷ متغیر ، دو سازه پنهان و مجموعه داده هایی متشکل از ۱۰ نمونه دست به تحلیل زد. با این حال با در نظر گرفتن مشکل پایداری در مقیاس بزرگ، هنوز این مدل با محدودیت هایی روبروست.

جمع بندی بحث حداقل مربعات جزئی

حداقل مربعات جزئی راهکاری برای آزمون فرضیه ها است و زمانی بکار میرود که حجم نمونه محدود باشد یا داده ها نرمال نباشند. بدون اینکه فرض هایی مانند فرضهای توزیع، و یا مقیاسهای اسمی، ترتیبی، و فاصلهای برای متغیرها، وجود داشته باشند، نتایج کار قابل استفاده میباشد. البته باید این نکته را نیز در ذهن داشت که حداقل مربعات جزئی هم همانند تمامی تکنیکهای آماری، نیازمند فرضهای خاصی است. مهمترین فرضیه، تشخیص “پیش بینی کننده” است. این الزام عنوان میکند که باید بخش سیستماتیک رگرسیون خطی را از روی انتظارات موقعیتی از متغیر وابسته تعریف کرد تا بتوان بر اساس رگرسیون نتیجه گیری کرد. با این حال، مشکل ثبات و پایداری در مقیاس بزرگ همچنان وجود دارد.

با توجه به مشکل سازگاری در نمونه های بزرگ، میتوان در مورد مناسب بودن حداقل مربعات جزئی دچار تردید شد و پرسید که چرا این تکنیک نمیتواند یکی از خصوصیت های کلیدی یک مدل آماری (پایداری برآوردکننده ) را تضمین کند. پاسخ این است که این رویکرد با اصول خودش وارد وضعیتهای مختلف میشود .هدف از مدلسازی معادلات ساختاری مبتنی بر کوواریانس ، تعیین ماتریس پارامترهای مدل Φ است که ماتریس کوواریانس پیش بینی شده توسط مدل نظری Σ(Φ)احتمال بسیار نزدیکی به ماتریس کوواریانس نمونه S دارد. برای این منظور باید تابع F(S, Σ) تعریف شود. وقتی S=Σ است، این تابع ارزش صفر را به خود اختصاص میدهد سایر موارد که ارزش تابع مثبت است، تفاوت بین Σ و S افزایش مییابد. با توجه به اینکه ماتریس کوواریانس نمونه، مبتنی بر احتمال شاخص اندازهگیری شده است، تابعی که بسیار در این خصوص استفاده می شود، تابع حداکثر کردن نرمال نظری است.

دانلود اصل مقاله حداقل مربعات جزیی