رگرسیون (Regression)
رگرسیون (Regression) یک روش آماری برای سنجش تاثیرات متغیرها با در نظر گرفتن روابط همزمان آنها بر یکدیگر است. معنای لغوی رگرسیون بازگشت به گذشته است و وجه تسمیه این روش نیز استفاده از دادههای گذشته برای پیشبنی آینده است.
شکلگیری و پیدایش روشهای رگرسیونی به دهه پایانی قرن نوزدهم برمیگردد. در سال ۱۸۸۶ کارل پیرسون توانست فرمولی برای محاسبه ضریب همبستگی ارائه دهد که علاوه بر نوآورانه بودن، مسیر جدیدی را در علم آمار فراهم کرد. این فرمول مبنای شکلگیری نظریه رگرسیون (Regression) بوده است. اگر که فرمول پیرسون، همبستگی بین دو متغیر را نشان میدهد در نظریه رگرسیون تغییرپذیری متغیر وابسته به دلیل تغییرپذیری متغیر مستقل نشان داده میشود.
در پژوهشهای رگرسیون هدف پیشبینی یک یا چند متغیر وابسته (ملاک) براساس یک یا چند متغیر مستقل (پیشبین) است. در رگرسیون چندگانه هدف پیدا کردن متغیرهای پیشبینی است که تغییرات متغیر وابسته را چه به تنهائی و چه مشترکاً پیشبینی کند. ورود متغیرهای مستقل در رگرسیون به روشهای متعددی صورت میگیرد. روش همزمان، روش گام به گام و روش سلسلهمراتبی سه روش اساسی در این تکنیک است.
تحلیل مسیر (Path analysis) یکی از روشهایی است که بر پایه مفهوم رگرسیون توسط سول رایت در اویل قرن بیستم معرفی شد. این روش کاربرد ضرایب بتای استاندارد رگرسیون چند متغیری در مدلهای ساختاری است. هدف تحلیل مسیر به دست آوردن برآوردهای کمی روابط علّی ( همکنشی یکجانبه یا کواریته) بین مجموعهای از متغیرهاست. ساختن یک مدل علّی لزوماً به معنای وجود روابط علّی در بین متغیرهای مدل نیست بلکه این علیت بر اساس مفروضات همبستگی و نظر و پیشینه تحقیق استوار است.
انواع روش رگرسیون (Regression)
رگرسیون خطی ساده : پیشبینی یک متغیر وابسته براساس یک یا چند متغیر مستقل
رگرسیون چندگانه (Multiple) : پیشبینی یک یا چند متغیر وابسته براساس چندمتغیر مستقل
رگـرسیون چندگانه تک عاملی (Univariate Multiple Regression) : پیشبینی یک متغیر وابسته براساس چند متغیر مستقل
رگـرسیون چندگانه چند عاملی (Multivariate Multiple Regression): پیشبینی چند متغیر وابسته براساس چند متغیر مستقل
تحلیل رگرسیون با SPSS
از منوی Analyze گزینه Regression فرمان Linear را اجرا کنید.
متغیر وابسته تعهد را به کادر Dependent وارد کنید. در تکنیک رگرسیون خطی فقط میتوان یک متغیر را به کادر Dependent وارد کنید.
متغیر یا متغیرهای مستقل را به کادر Independent وارد کنید.
با تایید این کار چندین جدول در خروجی ظاهر خواهد شد.
برای مشاهده ضریب تعیین از جدول Model Summary استفاده کنید.
براساس نتایح این جدول متغیرهای پیش بین توانستهاند ۲۸% از تغییرات در متغیر وابسته را تبیین کنند.
میزان تاثیر براساس جدول نهایی و ضریب بتای استاندارد سنجیده میشود. براساس جدول فوق مشخص است میزان تاثیر متغیر اعتماد بر متغیر وابسته تعهد ۰/۱۹۳ است. آماره تی نیز ۱/۹۷۴ بدست آمده است ولی چون معنی داری از سطح خطا بزرگتر است بنابراین تاثیر اعتماد بر تعهد معنادار نیست. از سوی دیگر میزان تاثیر رضایت بر تعهد ۰/۴۱ بدست آمده است و آماره تی نیز ۴/۱۹۶ محاسبه شده است بنابراین رضایت بر تعهد تاثیر مثبت و معناداری دارد.
تحلیل رگرسیون در اکسل
نخست افزونه Analysis ToolPak را فعال کنید. برای این منظور آموزش فعال کردن افزونه Analysis ToolPak را مطالعه کنید. این افزوه در خود نرمافزار اکسل وجود دارد و نیازی به نصب برنامه خاصی ندارد.
از زبانه Data در بخش Analysis روی Data Analysis کلیک کنید.
در کادری که باز میشود گزینه Regression را انتخاب کنید.
با کلیک روی فلش Y Range محدوده متغیر وابسته را انتخاب کنید.
با کلیک روی فلش X Range محدوده متغیر(های) مستقل را انتخاب کنید.
اگر مایل هستید مقادیر باقیمانده و خطا نیز گزارش شود تیک Residuals را فعال کنید.
برای مشاهده نمودار نرمال تیک Normal Probabilitis Plot را فعال کنید.
در پایان روی دکمه Ok کلیک کنید تا نتیجه مشاهده شود.
برای محاسبه شیب خط از تابع Slope (Y,X) استفاده کنید.
پیش فرضهای آزمون رگرسیون
برای انجام تحلیل رگرسیون باید از موارد زیر مطمئن شوید:
- حجم نمونه در رگرسیون
- آزمون صادفی بودن داده ها
- آزمون نرمال بودن داده ها
- آزمون دروبین-واتسون
- آزمون همخطی
برای مطالعه بیشتر بحث تفاوت رگرسیون و همبستگی را مطالعه کنید.
خلاصه و جمعبندی
هدف روش رگرسیون (Regression) پیشبینی یک یا چند سازه وابسته یا ملاک براساس یک یا چند سازه مستقل یا پیشبین است. در این روش تاثیر همزمان متغیرهای پیشبین بر یک متغیر وابسته مورد بررسی قرار میگیرد. به دیگر سخن در این روش برخلاف روش همبستگی فقط به روابط دوبهدو توجه نمیشود و همه متغیرها باهم مورد تحلیل قرار میگیرند. از این روش برای تحلیل مسیر نیز استفاده میشود. با رشد روشهای آماری و پیدایش حداقل مربعات جزئی و مدلهای معادلات ساختاری، استفاده از رگرسیون کمتر گردید اما هنوز هم جایگاه مهمی در تحلیل آماری دارد.
منبع: حبیبی، آرش؛ سرآبادانی، مونا. (۱۴۰۱). آموزش کاربردی SPSS. تهران: نارون.
آمار کاربردی مدیریت | ۱۰ فروردین ۹۲
سلام و روز به خیر
در خصوص هم خطی چندگانه ممکنه توضیح بفرمایید؟ اینکه در چه آزمونهایی، چرا و چطور محاسبه میشه؟
موضوع همخطی به سایت اضافه خواهد شد.
سلام
من یک سری دیتا دارم و تحلیل رگرسیون رو بدون انجام مفروضات انجام دادم. الان چیکار میتونم بکنم؟ پایان نامه تکمیل شده و فقط پیش قرض ها و ضرایب معنادارای رو ازم خواستن.
سلام
از طریق spss چطور میتونم رگرسیون چند متغیره (چند وابسته و یک مستقل) را محاسبه کنم
درود بر شما. این گزینه را ندارد، برای رگرسیونهای چندگانه از لیزرل استفاده کنید.
سلام
سطح معنی داری ۰/۰۰۰ در جدول یعنی چی؟ ۰/۰۰۵ یا ۰/۰۰۱؟ و در این صورت در سطح ۰/۰۱ معنی دار است یا سطح ۰/۰۰۱؟
درود بر شما. سطح معناداری ۰/۰۰۰ نداریم ممکن است «مقدار معناداری» بسیار کوچک و نزدیک به صفر باشد که به صورت ۰/۰۰۰ نمایش داده میشود. «سطح خطا» را میتوان ۵% یا ۱% در نظر گرفت و اگر «مقدار معناداری» از سطح خطا کمتر باشد یعنی آن رابطه یا آزمون معنادار است.
ممنونم
بله متوجه هستم اما الان در همین جدول بالا sig به صورت ۰/۰۰۰ است که قاعدتا کوچکتر از ۰/۰۱ است.
در هنگام گزارش باید ۰/۰۰۰ را به همین شکل نوشت یا ۰/۰۰۱ و ۰/۰۰۵ گزارش کرد؟
بنویسید مقدار معناداری بسیار اندک و تقریباً ۰/۰۰۰ بدست آمده است که از سطح خطای ۵% کمتر است بنابراین این فرضیه با اطمینان ۹۵% پذیرفته میشود. استفاده درست از واژگان بسیار مهم است حتما رعایت کنید.
سلام
با توجه به این مورد، آیا سطح معنی داری ۰/۰۰۰ از ۰/۰۱ کوچکتر نیست؟ پس چرا در اکثر منابع نوشته اند کوچکتر از ۰/۰۵ است؟ همچنان که شما هم ۰/۰۵ گفتید
درود بر شما. در زمینه آمار خیلی با دفت از واژگان استفاده کنید. سطح معناداری ۰/۰۰۰ نداریم؛ مقدار معناداری در سطح خطای ۵% میزان ۰/۰۰۰ بدست آمده است. چون آزمون در سطح خطای ۵% یا اطمینان ۹۵% انجام شد، بنابراین باید مقدار معناداری حاصل نیز با همان سطح خطایی که با آن آزمون انجام شده مقایسه شود.
ممنون از پاسخ شما
اما سوالم این است که مثلا در جدول بالا یعنی coefficient در ردیف سوم sig عدد ۰۰۰. نوشته شده . این عدد از ۰/۰۱ کوچکتر است یا ۰/۰۵؟
و این که براساس این جدول شما چگونه متوجه شده اید که آزمون در سطح خطای ۵% یا اطمینان ۹۵% انجام شده؟ که به این نتیجه رسیدید؟
بهطور پیشفرض آزمونها با میزان خطای ۵% انجام میشوند مگر اینکه پژوهشگری میزان خطا را دستی تغییر دهد.
بله ممنونم
و این که اگه مثلا در ضریب همبستگی در spss قصد داشته باشم سطح اطمینان را تغییر بدم باید به کدوم قسمت مراجعه کنم.
پرسش را در آموزش ضریب همبستگی مطرح کنید.
بله ممنونم
در بخش همبستگی پرسیدم
البته من در مورد رگرسیون هم همین سوال را دارم
سلام
ضمن تشکر از شما
اگه من قصد داشته باشم در رگرسیون در spss سطح اطمینان را تغییر بدم باید به کدوم قسمت مراجعه کنم.
و این که اگه به جای ۰/۰۰۰ عدد ۰/۰۰۴ بدست آمده بود آیا باز هم با اطمینان ۹۵ درصد می پذیرفتیم یا ۹۹ درصد؟
سلام
فرض کنید من ۱۵۰ سوال دارم که هر یک در حکم علت یک متغیرند، با کدام نوع رگرسیون می تونم بفهم کدوم سوال (یعنی علت) قدرت پیش بینی کنندگی بالاتری داره؟
ممنونم
درود بر شما. فرض شما از ابتدا اشتباه است چرا که نمیتوانید تاثیر بیش از ۳ الی ۵ متغیر را به صورت همزمان مورد سنجش قرار دهید.
ممنونم
سلام؛ به نظرم اول باید تحلیل عاملی اکتشافی انجام بشه و بعد عامل ها بره داخل مدل رگرسیون چندمتغیره.
باسلام و احترام. در رگرسیون خطی وقتی یکی از متغیرهای پیش بین معنادار حذف میکنم.متغیرهای که قبلا معنادار نبوده در تحلیل دوم معنادار میشود..آیا تحلیل من اشتباه هست؟ اگر دلیلش و رو بفرمایید ممنون میشم.
درود بر شما. اساساً منطق رگرسیون مبتنی بر سنجش اثرات سازهها به صورت همزمان است. بدیهی است که اگر سازهای از مدل حذف شود اثرات سایر سازهها دستخوش تغییر شود. برعکس در رویکردهای آماری نخستین مانند همبستگی پیرسون، رابطه سازهها دوبهدو بررسی میشود و حذف یا اضافه کردن سازههای دیگر تاثیری در نتایج ندارد.
با عرض سلام و خسته نباشید خدمت شما
میخواستم بئرسم برای گزارش دهی جدول رگرسیون باید به کدوم جدول ها و چه مواردی استفاده کنیم با تشکر از شما و سایت خوبتون
درود بر شما. همانگونه که در آموزش هم آمده است جدول Model Summary و جدول Coeficients اهمیت بیشتری دارند. لطفا دوباره آموزش ارائه شده را مطالعه کنید.
ببخشید ایا فرقی بین مدل های اینتر و بقیه هست یا حتما باید اینتر رو انتخاب کنیم؟
اگر از روش رگرسیون خطی ساده استفاده میکنید بهتر است روی همان Enter تنظیم شود.
استادم گفتن که خطی چند متغیره باید استفاده کنم
هرچند اصطلاح خطی چندمتغیره بیمعناست (چون همیشه چند متغیر وجود دارد) با این وجود شما از همان Enter استفاده کنید.
خیلی خیلی از راهنمای شما سئاسگذارم واقعاا سایتتون عالی هست
رگرسیون اینتر همان رگرسیون چندگانه است که متغیرها همزمان وارد می کنند و در حالت اینتر ابعاد متغیرهای مستقل را وارد می کنید همرااه با هم. خطی ساده وقتی استفاده می شود دیگر نیازی به تغییر اون منو نیست و همان حالت پیش فرض خودش اینتر وجود دارد و متغیر کل مستقل رو وارد می کنیم.
ما اینتر داریم. گام به کام و سلسه مراتبی هر کدام برای منظور خاصی استفاده می شود. و باید بر حسب فرضیه پژوهش از آنها استفاده کرد. چه رگرسیونی باشد.
سلام چرا ضریب استاندارد بتا منفی میشه در صورتی که پرسش نامه ها داده هاش معکوس نیست ؟ بنظر شما مشکل چی میتونه باشه
ضریب بتای منفی یعنی هر چه متغیر مستقل اثرش بالا باشه متغیر وابسته پایین ارزیابی می شود و بلعکس
سلام برای تعیین حجم نمونه و نمونه آماری که جامعه آن حدود ۱۰۰۰ نفر می باشند با موضوع پیش بینی رابطه تنهایی با رضایت از زندگی با نقش میانجی افسردگی و خود تاب آوری از چه فرمولی بهتره استفاده بشه .
سلام جامعه شما چه هست؟ دانش آموز- دانشجو-؟ یا نه؟ دوم این که منطقه هست؟ سازمان؟ یا محله؟
یک متغیر چند سطحی مثل سابقه شغلی به عنوان متغیر مستقل با یک متغیر وابسته نمره کل مثل تعهد شغلی. رابطه بین سابقه شغلی با تعهد سازمانی این اول باید ضریب اسپیرمن؟ سپس چند سطحی رگرسیون چندگانه؟ پاسخ؟
سلام چطور میشه با جدول رگرسیون چند متغیره درصد پیشبینی متغیر مستقل رو انجام داد.
با کدام ضریب b یا beta
با سلام رگرسیون همزمان به چه مفهومی است و چگونه محاسبه میشود؟
درود بر شما. رگرسیون همزمان نداریم، رگرسیون اثرات را بهصورت همزمان بررسی میکند.