اریبی (بایاس)

اریبی، تورش یا بایاس (Bias) به انحراف سیستماتیک برآورد‌های انجام شده از یک صفت از مقدار واقعی آن گفته‌می شود. این موضوع یکی از مباحث آمار کاربردی در مدیریت است. سیستماتیک به این معنی که برآوردها یا همواره کمتر از واقعیت و یا بیشتر از آن هستند.

اریبی بیشتر ناشی از قوی نبودن روش نمونه برداری و نقص در فرمول‌های محاسباتی آن است. به عنوان مثال روش شش درختی ممکن است حجم و سطح مقطع توده را همواره کمتر از واقعیت نشان دهد. اریبی در اثر نقص در دستگاه‌های اندازه‌گیری نیز امکان دارد به وجود بیاید. گاهی تبدیل داده‌ها نیز ممکن است باعث ایجاد اریبی در مقادیر پیش‌بینی شده به وسیله مدل بشود. مورد اخیر گاه در تحلیل‌های زمین آماری دیده می‌شود. این مفهومی کلیدی برای بهبود توان آزمون در تحلیل آماری است.

در نظریه آمار و احتمال، برآوردگرها (Estimators) نقش اساسی و مهمی ایفا می‌کنند. هر برآوردگر برای پارامتر جامعه، تابعی از نمونه تصادفی است که به عنوان حدسی نزدیک به یقین برای پارامتر مجهول جامعه، در نظر گرفته می‌شود. با مشخص شدن مقادیر نمونه‌گیری تصادفی می‌توان به کمک برآوردگر، مقدار پارامتر را به صورت تقریبی و البته احتمالی، مشخص کرد. در این نوشتار به یکی از خصوصیات جالب برآوردگرها به نام اُریبی و نااُریبی می‌پردازیم. در این بین برآوردگر اریب و نااریب برای بعضی از پارامترهای جامعه نیز طی مثال‌هایی معرفی خواهند شد. همچنین مفهوم میانه-نااریب به عنوان یک معیار برای نمایش خصوصیات دلخواه برآوردگرها نیز مورد بحث قرار خواهد گرفت.

برآوردگر اریب و نااریب

اریبی (Bias) که در فارسی گاهی آن را «تورِشی» نیز می‌نامند، ابزار و معیاری برای نشان دادن میزان نزدیکی پارامتر جامعه به برآوردگر آن پارامتر است. از آنجایی که براساس هر نمونه تصادفی، برآوردگر مربوط به پارامتر مقدار متفاوتی خواهد داشت، انتظار داریم که با تکرار نمونه‌گیری‌ها، متوسط مقدار برآوردگرهای حاصل، با پارامتر واقعی جامعه تقریبا برابر شود. در این حالت میزان اریبی برآوردگر (فاصله آن از مقدار واقعی پارامتر) باید با مقدار صفر برابر باشد. چنین برآوردگری را یک برآوردگر «نااریب» (Unbiased) می‌گویند. در حقیقت وجود چنین خاصیتی برآوردگرهای پارامتر را به دو کلاس برآوردگر اریب و نااریب تفکیک می‌کند.

همانطور که گفته شد، اریبی برآوردگر را به واسط محاسبه میانگین یا متوسط مقدار آن برای نمونه‌های تصادفی مختلف، مشخص کردیم. ولی ممکن است به جای استفاده از میانگین مقادیر از میانه آن‌ها استفاده شود. در این صورت اگر میانه مقادیر برآوردگر در این نمونه‌ها با پارامتر واقعی جامعه برابر باشد، برآوردگر را «میانه-نااریب» (Median-Unbiased) می‌گویند.

ممکن است عضوی از کلاس یا خانواده برآوردگرهای نااریب نسبت به یک برآوردگر خارج از این کلاس، دارای واریانس بیشتری یا در حقیقت دقت کمتری باشد. در نتیجه همیشه وجود خاصیت نااریبی دلیلی بر برتری برآوردگرها نیست. در نتیجه باید نااریبی را فقط به عنوان یکی از خصوصیات بهینه مربوط به برآوردگر، مورد توجه قرار داد. «حداقل بودن واریانس»، «سازگاری»  و «ناوردایی» از دیگر مشخصاتی هستند که به منظور پیدا کردن برآوردگر مناسب برای پارامتر نامعلوم جامعه مورد استفاده قرار می‌گیرند.

اریبی و سوگیری در تحقیقات کیفی

یکی از روش‌های عملی برای‌ اندیشیدن‌ در مورد بحث روایی، توجه به خطاها و سوگیری‌ها اسـت. تـحقیق، خواه‌ کیفی‌ یا کمّی، یک فـعالیت انـسانی اسـت‌ و بـنابراین مـمکن است‌ مانند‌ سـایر فـعالیت‌های انسان دارای اشتباه‌ یا‌ خطا باشد. برخی از منتقدان تحقیق کیفی معتقدند که سوگیری در این تحقیقات‌ بیشتر‌ اسـت، زیـرا تـحقیقات کیفی نسبت‌ به‌ تحقیقات‌ کمّی ساختارمندی کـمتری‌ دارنـد‌ و مـحققان کـیفی آنـچه‌ را‌ کـه می‌خواهند می‌یابند و سپس آنها را در نتایج‌شان شرح می‌دهند.

برخی از منابع‌ بالقوه‌ سوگیری در تحقیق عبارتند از:

  • تأثیر‌ پژوهشگران بر‌ پاسخگویان‌ و ارائه‌کنندگان اطلاعات؛
  • سوگیری‌های‌ انتخاب؛ شامل انتخاب زمان‌ها، مکان‌ها، حوادث و افراد؛
  • قابلیت دسترسی بـه منابع یا انواع‌ مختلف‌ داده‌ها برای پژوهشگران مختلف؛
  • مشابهت‌ و میل‌ طبیعی‌ پژوهشگران‌ به انواع خاصی‌ از‌ افراد، طرح‌ها، داده‌ها، تئوری‌ها و مفاهیم؛
  • توانایی پژوهشگران؛ شامل دانش و مهارت هایشان؛
  • ترجیحات‌ و تعهدات‌ ارزشی پژوهشگران؛
  • قابلیت‌های شخصی پژوهشگران؛ بـرای‌ مـثال:‌ ظرفیت‌ شان‌ برای‌ تمرکز،‌ بردباری و تحمل ابهام.

در حالیکه شناسایی منابع سوگیری آسان است اما امکان ایجاد قوانین و رویه‌های مشخص روش شناختی برای رفع سیستماتیک سوگیری، بسیار کم است،‌ بنابراین ما نـیاز داریـم تا به فرآیندهای شخصی و اجتماعی که می‌توانند سوگیری‌های پژوهشگران را کاهش داده و کیفیت تحقیق را حفظ کنند، توجه نمائیم.

یک‌ استراتژی کلیدی برای درک سوگیری‌های مـحقق، بـازتاب پذیری است. بگونه‌ای که مـحقق فـعالانه سوگیری‌ها و تمایلات خویش را مورد بررسی قرار می‌دهد و از آنها آگاه می‌گردد و در‌ جهت‌ نظارت و کنترل آنها گام بر می‌دارد.

خلاصه و جمع‌بندی

علاوه بر بحث برآوردگر اریب و نااریب، اصطلاح دیگری با عنوان برآوردگر میانه-نااریب نیز برای بعضی از برآوردگرها به کار گرفته می‌شود. تعریف و به کارگیری اصطلاح میانه-نااریب (Median-Unbiased) اولین بار توسط «جورج براون» (George Brown) آمارشناسی آمریکایی و استاد دانشگاه ایوا (Iowa State University) در سال ۱۹۴۷ مطرح شد. او برآوردگر میانه-نااریب را به صورت زیر تعریف کرد. این موضوع در مقابل مفهوم برآوردگر اریب و نااریب قرار گرفت. خوشبختانه در مواقعی که برآوردگر نااریب و حتی برآوردگر حداکثر درستنمایی وجود ندارند، می‌توان برآوردگر میانه-نااریب را بدست آورد. روش‌هایی مختلف برای ایجاد برآوردگرهای میانه-نااریب وجود دارد که در نوشتارهای دیگر فرادرس به آن‌ها اشاره خواهیم کرد.

در این نوشتار با مفهوم برآوردگر اریب و نااریب به عنوان ابزاری برای بررسی اریبی در تحقیقات کمی آشنا شدید. همانطور که خواندید، پیدا کردن بهترین برآوردگر از همه جنبه‌ها، کاری مشکل و شاید ناشدنی باشد. به همین دلیل در کلاسی از برآوردگرها که دارای خاصیت جالب یا بهینه‌ای هستند به دنبال بهترین برآوردگر هستیم. اغلب پژوهشگران کیفی در طرح تحقیق شان بـخش مـجزایی تحت عنوان «سوگیری‌های مـحقق» در نـظرمی‌گیرند و در این بخش، سوابق و پیش زمینه‌های شخصی‌شان و اینکه چگونه ممکن است بر تحقیق اثر بگذارند و چه استراتژی‌هایی برای مورد‌ ملاحظه‌ قرار دادن مشکلات ناشی‌ از‌ آنها استفاده خواهند کرد، را مطرح می‌کنند. عـلاوه بـر این پژوهشگران می‌توانند با بهره‌گیری از بازنگری داده‌ها و نتایج توسط مشارکت‌کنندگان و همکاران در جهت شناسایی سوگیری‌ها و رفع آنها‌ اقدام‌ نمایند.