بوت استرپ (Bootstrap)
بوت استرپ (Bootstrap) یک روش آماری است که به منظور برآورد پارامترهای جامعه آماری، از یک نمونه آماری استفاده میشود. گاهی حجم نمونه برای برآورد چنین پارامتری کم است. برای افزایش دقت و همچنین برآورد خطای برآوردگر پارامتر جامعه، از روشهای «بازنمونهگیری» (Re-sampling) استفاده میشود.
برای آشنایی بیشتر با مفهوم نمونهگیری و بازنمونهگیری بهتر است مطلب نمونهگیری و بازنمونهگیری آماری (Sampling and Re-sampling) را مطالعه کنید. هر دو روش جک نایف و بوت استرپ، در گروه محاسبات ناپارامتری قرار داشته و برای برآورد «خطای استاندارد» و «فاصله اطمینان» به کار میروند. به عبارت دیگر جهت برآورد انحراف استاندارد و فاصله اطمینان برای میانگین، میانه، نسبت و دیگر پارامترهای توزیع از روش بوت استرپینگ استفاده میشود.
البته این روش را برای برآورد خطای ضرایب رگرسیونی و همچنین انجام آزمون فرض نیز میتوان به کار گرفت. در زمانی که اندازه نمونه کوچک و دقت برآوردگرها مطرح باشد، روش بوت استرپ، میتواند خطا را بوسیله روش بازنمونهگیری محاسبه کند و فاصله اطمینان یا انحراف استاندارد مناسب و پرتوانی، ارائه دهد. به زبان ساده Bootstrap نمونهگیریای است که با تبدیل از یک نمونه به دست میآید. یا به عبارت دیگر Bootstrap نمونهگیریای است درون یک نمونه. روش Bootstrap با تکیه بر نمونه شخصی انجام میشود که اغلب آن نمونه شخصی تنها منبعی است که یک پژوهشگر برای تحقیق دارد واین براهمیت روش Bootstrap میافزاید. در مجموع دو روش اصلی برای بازنمونهگیری عبارتند از:
- بوت استرپ Bootstrap
- جک نایف Jackknife
مفهوم روش بوت استرپ (Bootstrap)
این روش در گروه روشهای آمار ناپارامتری و تکنیکهای بازنمونهگیری طبقهبندی میشود و به منظور برآورد پارامتر جامعه آماری با استفاده از نمونهگیری با جایگذاری به کار میرود. بوتاسترپ همچنین برای محاسبه فاصله اطمینان برای برآوردگر کاربرد دارد. فرض کنید میخواهید در یک مسئله یادگیری ماشین، مهارت مدل تولید شده را اندازهگیری کنید. برای این کار با استفاده از روش بوتاسترپ میتوان یک فاصله اطمینان ایجاد کرد و برای پیشبینی دادههای جدید از آن کمک گرفت. وجه تسمیه این روش به تسمه پوتین آن است که روشی برای خودگردان سازی است. به دیگر سخن وقتی شما تسمه پوتین را میکشید به راحتی جا میافتد.
همانطور که دیده شد، در روش جک نایف برای n مشاهده، n زیرنمونه به اندازه n-1 برای برآورد پارامتر جامعه آماری ایجاد شد. ولی در روش بوت استرپ زیرنمونهها، بوسیله بازنمونهگیری با جایگذاری از نمونه اصلی تولید میشوند. با توجه به اینکه تعداد نمونه اصلی برابر با n است میتوان بینهایت زیرنمونه با اندازه n با جایگذاری ایجاد کرد. در روش بوت استرپ تعداد بازنمونهگیری با Nb و تعداد مشاهدات در هر زیرنمونه نیز با nb مشخص میشود. واضح است که Nb و nb ممکن است از n بزرگتر، مساوی یا کوچکتر باشند زیرا نمونهگیری با جایگذاری است و در حقیقت حجم نمونه اصلی را میتوان بسیار بزرگ در نظر گرفت.
بوت استرپ در SPSS
روش بوت استرپ از گروه روشهای ناپارامتری و در بخش تکنیکهای باز نمونهگیری قرار میگیرد. هدف از اجرای بوت استرپ، پیدا کردن خطای (واریانس) برآوردگر با استفاده از تکرار مراحل نمونهگیری و برآوردیابی است. در هر بار تکرار براساس یک عمل بازنمونهگیری از دادهها، برآوردگر مورد نظر محاسبه میشود. تکرار این مراحل مثلا به تعداد ۱۰۰ بار، منجر به تولید ۱۰۰ مقدار مختلف برای برآوردگر میشود. میانگین این مقادیر، برای بدست آوردن امید ریاضی یا اریبی برآوردگر و واریانس یا انحراف معیار این مقدارها نیز میتواند برای پیدا کردن خطای برآوردگر به کار رود.
با توجه به مقدمهای که در مورد روش بوت استرپ گفته شد، در این قسمت به بررسی یک مثال به کمک دادههای آموزشی SPSS میپردازیم. فایل Employee data.sav در پوشه samples مربوط به مشخصات کارمندان یک شرکت است. البته میتوانید با کلیک روی اینجا این فایل را با قالب فشرده دریافت کنید. مدیریت شرکت احتیاج به بررسی تجربه کاری کارمندان در محل کار قبلی دارد. این متغیر کاملا به راست چوله است که باعث میشود، میانگین (Mean) برآوردگر خوبی برای شاخص تمرکز نباشد. بنابراین بهتر است از میانه (Median) برای نمایش نقطه تمرکز این متغیر استفاده شود. ولی متاسفانه برای میانه نمیتوان به راحتی یک فاصله اطمینان به فرم بسته پیدا کرد.
خلاصه و جمعبندی
در حل بسیاری از مسائل آماری نیاز به حجم نمونه بزرگی وجود دارد. از سوی دیگر در بسیاری موارد دسترسی به چنین نمونهای وجود ندارد. برای رفع این تعارض از روشهای بازنمونهگیری استفاده میشود. یکی از روشهای استفاده مجدد از نمونه به روش خودگردان سازی یا بوتاستراپینگ موسوم است. روش بوت استراپ یک روش علمی و آماری ارائه میکند که با استفاده از آن میتوان مسائلی که به دادههای زیاد نیاز دارند را به دادههای اندک حل کرد. یکی از عمده ترین کارکردهای آن نیز در حل مسائل حداقل مربعات جزئی میباشد. این روش بر پایه مفوضاتی بنا نها شده است که ریشه در مباحث آماری دارند. به عنوان یک پژوهشگر مدیریت نیازی به دانستن دانش زیربنایی این روش ندارید. اما باید با کارکردهای آن در حل مسائل مدیریتی آشنا شوید. در این مقاله کوشش شد تا جای روش بوتاستراپینگ برای دانشجویان مدیریت تشریح شود.
منبع: حبیبی، آرش؛ سرآبادانی، مونا. (۱۴۰۱). آموزش کاربردی SPSS. تهران: نارون.
آمار کاربردی مدیریت | ۱۸ بهمن ۹۱