بوت استرپ Bootstrap

بوت استرپ Bootstrap

بوت استرپ Bootstrap یک روش آماری است که به منظور برآورد پارامترهای جامعه آماری، از یک نمونه آماری استفاده می‌شود. گاهی حجم نمونه برای برآورد چنین پارامتری کم است. برای افزایش دقت و همچنین برآورد خطای برآوردگر پارامتر جامعه، از روش‌های «باز‌نمونه‌گیری» (Re-sampling) استفاده می‌شود. برای آشنایی بیشتر با مفهوم نمونه‌گیری و بازنمونه‌گیری بهتر است مطلب نمونه‌گیری و بازنمونه‌گیری آماری (Sampling and Re-sampling) را مطالعه کنید. هر دو روش‌ جک نایف و بوت استرپ، در گروه محاسبات ناپارامتری قرار داشته و برای برآورد «خطای استاندارد» و «فاصله اطمینان» به کار می‌روند. به عبارت دیگر جهت برآورد انحراف استاندارد و فاصله اطمینان برای میانگین، میانه، نسبت و دیگر پارامترهای توزیع از روش بوت‌ استرپینگ استفاده می‌شود.

البته این روش را برای برآورد خطای ضرایب رگرسیونی و همچنین انجام آزمون فرض نیز می‌توان به کار گرفت. در زمانی که اندازه نمونه کوچک و دقت برآوردگرها مطرح باشد، روش بوت استرپ، می‌تواند خطا را بوسیله روش باز‌نمونه‌گیری محاسبه کند و فاصله اطمینان یا انحراف استاندارد مناسب و پرتوانی، ارائه دهد. به زبان ساده Bootstrap نمونه گیری ای است که با تبدیل از یک نمونه به دست می آید. یا به عبارت دیگر Bootstrap نمونه گیری ای است درون یک نمونه. روش Bootstrap با تکیه بر نمونه شخصی انجام می شود که اغلب آن نمونه شخصی تنها منبعی است که یک پژوهشگر برای تحقیق دارد واین براهمیت روش Bootstrap می افزاید. در مجموع دو روش اصلی برای بازنمونه‌گیری عبارتند از:

  • بوت استرپ Bootstrap
  • جک نایف Jackknife

مفهوم روش بوت استرپ

این روش در گروه روش‌های آمار ناپارامتری و تکنیک‌های بازنمونه‌گیری طبقه‌بندی می‌شود و به منظور برآورد پارامتر جامعه آماری با استفاده از نمونه‌گیری با جایگذاری به کار می‌رود. بوت‌استرپ همچنین برای محاسبه فاصله اطمینان برای برآوردگر کاربرد دارد. فرض کنید می‌خواهید در یک مسئله یادگیری ماشین، مهارت مدل تولید شده را اندازه‌گیری کنید. برای این کار با استفاده از روش بوت‌استرپ می‌توان یک فاصله اطمینان ایجاد کرد و برای پیش‌بینی داده‌های جدید از آن کمک گرفت. وجه تسمیه این روش به تسمه پوتین آن است که روشی برای خودگردان سازی است. به دیگر سخن وقتی شما تسمه پوتین را می‌کشید به راحتی جا می‌افتد.

تسمه پوتین (بوت‌استراپ)

تسمه پوتین (بوت‌استراپ)

همانطور که دیده شد، در روش جک نایف برای n‌ مشاهده، n زیرنمونه‌ به اندازه n-1 برای برآورد پارامتر جامعه آماری ایجاد شد. ولی در روش بوت استرپ زیرنمونه‌ها، بوسیله بازنمونه‌گیری با جایگذاری از نمونه اصلی تولید می‌شوند. با توجه به اینکه تعداد نمونه اصلی برابر  با n است می‌توان بی‌نهایت زیرنمونه با اندازه n با جایگذاری ایجاد کرد. در روش بوت استرپ تعداد بازنمونه‌گیری با Nb و تعداد مشاهدات در هر زیرنمونه نیز با nb مشخص می‌شود. واضح است که Nb و nb ممکن است از n بزرگتر، مساوی یا کوچکتر باشند زیرا نمونه‌گیری با جایگذاری است و در حقیقت حجم نمونه اصلی را می‌توان بسیار بزرگ در نظر گرفت.

بوت استرپ در SPSS

روش بوت استرپ از گروه روش‌های ناپارامتری و در بخش تکنیک‌های باز نمونه‌گیری قرار می‌گیرد. هدف از اجرای بوت استرپ، پیدا کردن خطای (واریانس) برآوردگر با استفاده از تکرار مراحل نمونه‌گیری و برآوردیابی است. در هر بار تکرار براساس یک عمل باز‌نمونه‌گیری از داده‌ها، برآوردگر مورد نظر محاسبه می‌شود. تکرار این مراحل مثلا به تعداد ۱۰۰ بار، منجر به تولید ۱۰۰ مقدار مختلف برای برآوردگر می‌شود. میانگین این مقادیر، برای بدست آوردن امید ریاضی یا اریبی برآوردگر و واریانس یا انحراف معیار این مقدارها نیز می‌تواند برای پیدا کردن خطای برآوردگر به کار رود.

با توجه به مقدمه‌ای که در مورد روش بوت استرپ گفته شد، در این قسمت به بررسی یک مثال به کمک داده‌های آموزشی SPSS می‌پردازیم. فایل Employee data.sav در پوشه samples مربوط به مشخصات کارمندان یک شرکت است. البته می‌توانید با کلیک روی اینجا این فایل را با قالب فشرده دریافت کنید. مدیریت شرکت احتیاج به بررسی تجربه کاری کارمندان در محل کار قبلی دارد. این متغیر کاملا به راست چوله است که باعث می‌شود، میانگین (Mean) برآوردگر خوبی برای شاخص تمرکز نباشد. بنابراین بهتر است از میانه (Median) برای نمایش نقطه تمرکز این متغیر استفاده شود. ولی متاسفانه برای میانه نمی‌توان به راحتی یک فاصله اطمینان به فرم بسته پیدا کرد.

خلاصه و جمع‌بندی

در حل بسیاری از مسائل آماری نیاز به حجم نمونه بزرگی وجود دارد. از سوی دیگر در بسیاری موارد دسترسی به چنین نمونه‌ای وجود ندارد. برای رفع این تعارض از روش‌های بازنمونه‌گیری استفاده می‌شود. یکی از روش‌های استفاده مجدد از نمونه به روش خودگردان سازی یا بوت‌استراپینگ موسوم است. روش بوت استراپ یک روش علمی و آماری ارائه می‌کند که با استفاده از آن می‌توان مسائلی که به داده‌های زیاد نیاز دارند را به داده‌های اندک حل کرد. یکی از عمده ترین کارکردهای آن نیز در حل مسائل حداقل مربعات جزئی می‌باشد. این روش بر پایه مفوضاتی بنا نها شده است که ریشه در مباحث آماری دارند. به عنوان یک پژوهشگر مدیریت نیازی به دانستن دانش زیربنایی این روش ندارید. اما باید با کارکردهای آن در حل مسائل مدیریتی آشنا شوید. در این مقاله کوشش شد تا جای روش بوت‌استراپینگ برای دانشجویان مدیریت تشریح شود.