آزمونهای تعقیبی (Post-hoc) روشهای آماری هستند که برای تفسیر معناداری تفاوت میانگین طبقات در تحلیل واریانس استفاده میشوند. این آزمونها زمانی استفاده میشوند که آزمون اصلی فقط وجود تفاوت را نشان میدهد، اما محل آن را مشخص نمیکند. این مقاله با معرفی آزمونهای تعقیبی به پژوهشگران کمک میکند تا آزمون مناسب را در تحلیل آماری پژوهش انتخاب کنند.
تعریف آزمونهای تعقیبی (Post hoc)
آزمونهای تعقیبی (Post Hoc Tests) مجموعهای از آزمونهای آماری هستند که پس از معنادار شدن آزمونهای کلی مانند تحلیل واریانس (ANOVA) بهکار میروند تا مشخص شود تفاوت تفاوت معنادار دقیقاً بین کدام گروهها وجود دارد.
اهمیت آزمونهای تعقیبی در کنترل خطای نوع اول نهفته است؛ زیرا انجام مقایسههای دوتایی متعدد بدون تصحیح آماری میتواند منجر به نتایج گمراهکننده شود. آزمونهای تعقیبی با اعمال اصلاحات آماری مناسب، امکان مقایسه منصفانه و معتبر میان گروهها را فراهم میکنند و دقت تفسیر نتایج را افزایش میدهند.
در واقع نتایج تحلیل واریانس نشان میدهد آیا اختلاف میانگین طبقات معنادار است یا خیر. اما این نتایج نشان نمیدهد کدام طبقات باهم تفاوت دارند. در تحلیل واریانس برای مقایسه گروهها در آزمونهای تحلیل واریانس همچنین تحلیل واریانس نیز به شیوههای متعددی انجام میشود. تحلیل واریانس یک راهه، تحلیل واریانس چند راهه، تحلیل واریانس با اندازههای تکراری یک عاملی و جند عاملی، تحلیل واریانس چند متغیری و … از این جمله هستند.
تحلیل آماری پایاننامه و رساله دکتری
راهنمای تحلیل آماری پایاننامه و رساله دکتری مدیریت:
- تحلیل دادههای آماری با روشهای کمی
- تحلیل و کدگذاری مصاحبه با روشهای کیفی
- تحلیل آماری پایاننامه کارشناسی ارشد
- تجزیهوتحلیل روشهای آمیخته رساله دکتری
انواع آزمونهای تعقیبی
شماره زیادی از آزمونهای تعقیبی وجود داند. برای نمونه میتوان به آزمون توکی، شفه و تیدان اشاره کرد. آزمون HSD و LSD مشهورترین آزمونهای تعقیبی در تحلیل واربانس هستند. بیشتر این آزمونها با نرمافزار SPSS قابل انجام هستند:
همچنین روشهای گوناگون دیگری نیز برای بررسی اختلاف میانگین گروهها در تحلیل واریانس وجود دارد که برخی از مهمترین آنها عبارتند از:
آزمون توکی (HSD)
توکی (Tukey) به سال ۱۹۵۳ یک روش مقایسه چندگانه را بر مبنای آماره دامنه استیودنت پیشنهاد کرد. در روش وی از آزمون توکی، خروجی نرمافزار برای تعیین مقدار بحرانی تمام مقایسههای جفت میانگینها استفاده میشود. بنابراین آزمون توکی در صورتی دو میانگین را دارای تفاوت معنی دار اعلام میکند که قدرمطلق اختلاف نمونه ی آنها بیش از آزمون توکی، خروجی نرمافزار باشد.
این آزمون که به HSD معروف است بعد از رد فرض صفر در آنالیز واریانس، به مقایسه ی همه ی تفاوتها میپردازد. اگر در آزمون F تفاوت معناداری بین میانگینهای گروهها ثابت شود، با آزمون توکی تفاوت معنادار مابین هر دو گروه بررسی میشود.
آزمون تفاوت معنادار راستین برگردان honestly significant difference است که به اختصار HSD نامیده میشود. این روش برای مقایسه دو به دو میانگین گروهها استفاده میشود. آزمون توکی مقدار خطای کلی برای مجموعه مقایسههای دو به دو را کنترل میکند. این آزمون به طور متوسطی سخت گیر است و از طرفاغلب مولفان توصیه میشود.
آزمون توکی ب (Tukey s-b) حالت بیابینی از آزمون توکی و بونفرونی میباشد.
آزمون حداقل تفاوت معنی دار فیشر (LSD)
این آزمون یکی از قدیمی ترین و قوی ترین آزمونها برای مقایسه پس از تجربه است. درصورتی که تعداد میانگینها از سه تا بیشتر نباشد، بهتر است از این آزمون استفاده شود. اما اگر میانگینهای مورد مقایسه بیش از سه مورد باشد، بهتر است سایر آزمونها مورد استفاده قرار گیرد. آزمون حداقل تفاوت معنی دار (LSD) بسیار مشابه آزمون تفاوت معنی دار راستین (HSD) است.
آزمون حداقل تفاوت معنی دار (LSD) استفاده شده است که از روش مرسوم تفاوت معنادار راستین HSD روش سختگیرانهتری است. دراین آزمون میخواهیم فرض H0:μi=μj را برای تمام i≠j آزمون نمائیم. چنانچه اختلاف میانگین بین دو گروه (تیمار) بیش از مقدار ثابت LSD باشد، به معنی اختلاف معنی دار بین دو گروه است. برای اجرای این آزمون توجه به دو نکته دارای اهمیت است؛ اول آنکه این آزمون بهتر است زمانی استفاده شود که مقدار آماره F در جدول آنالیز واریانس معنی دار شده باشد و دوم تعداد گروهها زیاد نباشد.
آزمون حداقل تفاوت معنادار برگردان Least significant difference که به اختصار LSD نامیده میشود. این آزمون برای مقایسه دو به دو میانگین گروهها به کار میرود. آزمون LSD خیلی ساده گیر (most liberal) است (یعنی توان بالایی دارد و احتمال زیادی دارد که مرتکب خطای نوع یک شود). بیشتر پژوهشگران در استفاده از این آزمون احتیاط میکنند، اما هنوز تمایل برای استفاده از این آزمون توسط برخی دیگر وجود دارد.
آزمون دانکن (Duncan)
در این آزمون، که به آزمون چند دامنهای دانکن نیز معروف است، چنان چه قدر مطلق اختلاف میانگینهای مورد مقایسه بزرگ تر یا مساوی rα(sx) باشد، اختلاف بین میانگینهای مورد مقایسه معنیدار است. در این آزمون برای مقایسه هر جفت میانگین، مقدار rα(sx) خاص آن مقایسه محاسبه میشود.
بیشتر تصمیمگیری در مورد این که کدامیک از آزمونهای معرفی شده ارجحیت دارد، کار دشواری است و بسته به نظر تحلیلگر آماری مربوطه دارد، لیکن کارمر و اسوانسن در مطالعهای که در مورد تعدادی از روشهای مقایسهای چندگانه انجام دادند اعلام کردند که روش حداقل اختلاف معنی دار روش بسیار مؤثری برای نشان دادن اختلافهای واقعی میانگینها میباشد. مشروط بر این که تنها پس از معنی دار بودن آزمون f تجزیه واریانس استفاده شود. آنها همچنین قابلیت شناسایی مناسب تفاوتهای واقعی را با استفاده از آزمون چند دامنهای دانکن گزارش کردند.
آزمون دانکن برای مقایسههای دو به دو (مانند آزمون SNK، REGWF و REGWQ میباشد) به کار میرود. این آزمون به طور متوسطی سادهگیرانه است اما خطای نوع یک را در قالب آزمایش، و نه با تعدیل در مقایسهها، کنترل میکند.
بعدها والر و دانکن این روش را توسعه دادند. آزمون والر-دانکن (Waller-Duncan) به پژوهشگر این اجازه را میدهد تا نسبت خطاینوع یک بر خطای نوع دو را در مقایسهها دخالت دهد.
آزمون دانت (Dunnett)
زمانی که در پژوهش یک گروه کنترل وجود دارد و هدف مقایسه گروه هایآزمایشی با گروه کنترل است. از آزمون دانت برای مقایسه دو به دو میانگین گروهها با گروه کنترل استفادهمی شود.اما زمانی که واریانس متغیر وابسته در گروهها برابر نباشد (تجانس واریانسها برقرار نباشد) از آزمون های تعقیبی زیر برای مقایسهها بین گروهی استفاده میشود.
آزمون تامبن Tambane’s-T2) T2) : از این آزمون برای مقایسههای دو به دو استفاده میشود و آزمون سختگیری است.
آزمون دانت تی-سه T3 (Dunnett s T3) و آزمون دانت سی (Dunnett s C) : این آزمونها بر پایه توزیع t-student،مقایسهها را انجام میدهند و آزمونهای میانه روی هستند.
در نهایت روش گیمز-هول (Games-Howell) برای مقایسههای دو به دو به کار میرود و آزمون سادهگیری است.
آزمون شفه (Scheffe test)
این آزمون به پژوهشگر امکان میدهد تا تمام حالتهای مختلف مقایسه یک به یک میانگینها و همچنین تمام ترکیبهای چندتایی مقایسه میانگینها را انجام دهد .در آزمون شفه، برای کنترل میزان احتمال خطای نوع اول، معیار تصمیمگیری در مورد فرضیه صفر یعنی مقدار بحرانی جهت تشخیص معنی دار بودن افزایش مییابد.
آزمون شفه برای مقایسه دو به دو میانگینها به کار میرود و خیلی سختگیر (most conservative) است. یعنی توان آزمون پایین و احتمال کمی در ارتکاب به خطای نوع I دارد. روش شفه در زمانی که هدف سنجش فرضیات نظری نامعلوم باشد که نیاز به دقت است، پر کاربردترین آزمون تعقیبی خواهد بود.
آزمون نیومن-کولز (The Newman-Keuls test)
این آزمون برای مقایسههای دو به دو به کار میرود. آزمون نیومن کولز آزمون میانه روی است اما تمایل به متورم شدن خطای نوع I را دارد و از طرف برخی مولفان توصیه نمی شود. این آزمون پس از اینکه آزمون Anova فرض صفر را رد کند، مقایسههای جفتی میان گروهها را انجام میدهد.
فرض کنید که گروههایی داریم که در آنها m1 < m2 < m3 ممکن است که برخی از آزمونها مقایسههای جفتی را برای موارد زیر نیز انجام دهند: یعنی گروه اول و سوم خیلی با هم متفاوت نیستند اما در عوض گروه اول و دوم تفاوت معنا داری با هم دارند.
آزمون نیومن-کولز، دقیقا برای پرهیز از چنین اتفاقی طراحی شده است. بخوص وقتی که آزمون اعلام کند که mi و mj که (mi < mj) تفاوت معناداری با هم ندارند آن گاه هر جفت از میانگینهای ml و mn که mi ml mn mj از روش نیومن کلز معنا دار نخواهند بود. نتیجه ی این آزمون به صورت یک سری از گروههای دوتایی خواهد بود که در هرکدام از آنها آن دسته از گروهها که میانگینهایشان بنا بر سطح معناداری α تفاوت معناداری از هم دارند، قرار گرفتند.
دیگر آزمونهای تعقیبی
آزمون بونفرونی (Bonferoni)
به این آزمون همچنین آزمون دان نیز گفته میشود. از این روش برای مقایسه دو به دو میانگینها به کار میرود. این روش به طور متوسطی (moderately) سخت گیر است. اگرچه این آزمون اغلب در ادبیات پژوهشی به کار میرود اما روشی است که با افزایش تعداد مقایسهها تمایل بزرگتر نشان دادن تفاوتها دارد.
آزمون سیداک (Sidak)
به این آزمون گاهی اوقات نیز سیداک-بونفرونی گفته میشود. از این روش برای مقایسههای دو به دو به کار میرود و سخت گیر تر از آزمون بونفرونی است. این آزمون یک آزمون تعقیبی میانه روی (نه ساده گیر است و نه سخت گیر) است.
آزمون REGWF و REGWQ
این آزمونها برای مقایسههای دو به دو به کار میروند. هر دو اینآزمونها از طریق مولفانی که از آزمون نیومن کولز استفاده میکنند، پیشنهاد میشود.
آزمون هاکبرگز GT2 (Hochbergs GT2)
این روش شبیه آزمون توکی است، امابه صورت ویژه برای آزمایش هایی طراحی شده است که اندازه نمونه در گروهها نا برابر باشد.
آزمون گابریل (Gabriel)
آزمون گابریل نسخه ی ساده گیرتر آزمون هاکبرگز-GT2 میباشد.
سخن پایانی آزمونهای تعقیبی
در جمعبندی میتوان گفت آزمونهای تعقیبی نقش تکمیلی و ضروری در تفسیر نتایج آزمونهای کلی مانند ANOVA ایفا میکنند و به پژوهشگر امکان میدهند محل دقیق تفاوتهای معنادار بین گروهها را شناسایی کند. استفاده آگاهانه از این آزمونها، با توجه به مفروضات آماری و هدف پژوهش، از افزایش خطای آماری جلوگیری کرده و اعتبار نتایج را ارتقا میدهد. در نهایت، انتخاب صحیح آزمون تعقیبی مناسب، گامی مهم برای تحلیل دقیقتر دادهها و ارائه تفسیرهای علمی معتبر در پژوهشهای مدیریتی و علوم اجتماعی محسوب میشود.
منبع: حبیبی، آرش؛ سرآبادانی، مونا. آموزش کاربردی SPSS. تهران: ناروندانش.
سوالات متداول
خیر، هرچند بیشترین کاربرد آنها پس از ANOVA است، اما در سایر تحلیلهای مقایسهای نیز استفاده میشوند. بهطور خاص، هر جا مقایسه چند گروه مطرح باشد و نیاز به شناسایی تفاوتهای دوتایی وجود داشته باشد، آزمونهای تعقیبی نقش مهمی ایفا میکنند.
هیچ آزمون تعقیبی «بهترین مطلق» وجود ندارد. اگر واریانسها همگن باشند، آزمون توکی گزینهای مناسب است، اما در صورت نقض همگنی واریانسها، آزمونهایی مانند گیمز–هاول (Games-Howell) توصیه میشوند. بنابراین انتخاب آزمون باید آگاهانه و مبتنی بر دادهها باشد.
آزمونهای تعقیبی در میزان سختگیری آماری با یکدیگر تفاوت دارند. برخی مانند توکی (Tukey) متعادل و رایجاند، در حالی که آزمونهایی مانند بونفرونی (Bonferroni) محافظهکارانهتر هستند. انتخاب آزمون مناسب به هدف پژوهش و شرایط دادهها بستگی دارد.
