آزمون‌های تعقیبی

آزمون‌های تعقیبی (Post-hoc) روش‌های آماری هستند که برای تفسیر معناداری تفاوت میانگین طبقات در تحلیل واریانس استفاده می‌شوند. در واقع نتایج تحلیل واریانس نشان می‌دهد آیا اختلاف میانگین طبقات معنادار است یا خیر. اما این نتایج نشان نمی‌دهد کدام طبقات باهم تفاوت دارند. شماره زیادی از آزمون‌های تعقیبی وجود داند. برای نمونه می‌توان به آزمون توکی، شفه و تی دان اشاره کرد. در تحلیل واریانس برای مقایسه گروه‌ها در آزمون‌های تحلیل واریانس همچنین تحلیل واریانس نیز به شیوه‌های متعددی انجام می‌شود. تحلیل واریانس یک راهه، تحلیل واریانس چند راهه، تحلیل واریانس با اندازه‌های تکراری یک عاملی و جند عاملی، تحلیل واریانس چند متغیری و … از این جمله هستند.

پرسش کلیدی آن است که از چه آزمون تعقیبی استفاده شود که مناسب پژوهش مورد مطالعه باشد؟ پاسخ این پرسش اغلب برای پژوهشگران روشن نیست. پژوهشگران نمی دانند که با توجه به اهداف پژوهشی شان از چه آزمون تعقیبی برای مقایسه پش تجربی گروه‌ها استفاده کنند. در این مقاله بر آزمون‌های تعقیبی آمده است. این آموزش به پژوهشگران کمک کند تا آزمون تعقیبی مناسب را در تحلیل آماری پژوهش انتخاب کنند.

آشنایی با آزمون‌های تعقیبی

آزمون HSD و LSD مشهورترین آزمون‌های تعقیبی در تحلیل واربانس هستند. همچنین روش‌های گوناگون دیگری نیز برای بررسی اختلاف میانگین گروه‌ها در تحلیل واریانس وجود دارد که برخی از مهم‌ترین آنها عبارتند از:

آزمون توکی (HSD)

توکی (Tukey) به سال ۱۹۵۳ یک روش مقایسه چندگانه را بر مبنای آماره دامنه استیودنت پیشنهاد کرد. در روش وی از آزمون توکی، خروجی نرم‌افزار برای تعیین مقدار بحرانی تمام مقایسه‌های جفت میانگین‌ها استفاده می‌شود. بنابراین آزمون توکی در صورتی دو میانگین را دارای تفاوت معنی دار اعلام می‌کند که قدرمطلق اختلاف نمونه ی آن‌ها بیش از آزمون توکی، خروجی نرم‌افزار باشد. این آزمون که به HSD معروف است بعد از رد فرض صفر در آنالیز واریانس، به مقایسه ی همه ی تفاوت‌ها می‌پردازد. اگر در آزمون F تفاوت معناداری بین میانگین‌های گروهها ثابت شود، با آزمون توکی تفاوت معنادار مابین هر دو گروه بررسی می‌شود.

آزمون تفاوت معنادار راستین برگردان honestly significant difference است که به اختصار HSD نامیده می‌شود. این روش برای مقایسه دو به دو میانگین گروه‌ها استفاده می‌شود. آزمون توکی مقدار خطای کلی برای مجموعه مقایسه‌های دو به دو را کنترل می‌کند. این آزمون به طور متوسطی سخت گیر است و از طرفاغلب مولفان توصیه می‌شود.

آزمون توکی ب (Tukey s-b) حالت بیابینی از آزمون توکی و بونفرونی می‌باشد.

آزمون حداقل تفاوت معنی دار فیشر (LSD)

این آزمون یکی از قدیمی ترین و قوی ترین آزمون‌ها برای مقایسه پس از تجربه است. درصورتی که تعداد میانگین‌ها از سه تا بیشتر نباشد، بهتر است از این آزمون استفاده شود. اما اگر میانگین‌های مورد مقایسه بیش از سه مورد باشد، بهتر است سایر آزمون‌ها مورد استفاده قرار گیرد. آزمون حداقل تفاوت معنی دار (LSD) بسیار مشابه آزمون تفاوت معنی دار راستین (HSD) است.

آزمون حداقل تفاوت معنی دار (LSD) استفاده شده است که از روش مرسوم تفاوت معنادار راستین HSD روش سخت‌گیرانه‌تری است. دراین آزمون می‌خواهیم فرض H0:μi=μj را برای تمام i≠j آزمون نمائیم. چنانچه اختلاف میانگین بین دو گروه (تیمار) بیش از مقدار ثابت LSD باشد، به معنی اختلاف معنی دار بین دو گروه است. برای اجرای این آزمون توجه به دو نکته دارای اهمیت است؛ اول آنکه این آزمون بهتر است زمانی استفاده شود که مقدار آماره F در جدول آنالیز واریانس معنی دار شده باشد و دوم تعداد گروه‌ها زیاد نباشد.

آزمون حداقل تفاوت معنادار برگردان Least significant difference که به اختصار LSD نامیده می‌شود. این آزمون برای مقایسه دو به دو میانگین گروه‌ها به کار می‌رود. آزمون LSD خیلی ساده گیر (most liberal) است (یعنی توان بالایی دارد و احتمال زیادی دارد که مرتکب خطای نوع یک شود). بیشتر پژوهشگران در استفاده از این آزمون احتیاط می‌کنند، اما هنوز تمایل برای استفاده از این آزمون توسط برخی دیگر وجود دارد.

آزمون دانکن (Duncan)

در این آزمون، که به آزمون چند دامنه‌ای دانکن نیز معروف است، چنان چه قدر مطلق اختلاف میانگین‌های مورد مقایسه بزرگ تر یا مساوی rα(sx) باشد، اختلاف بین میانگین‌های مورد مقایسه معنی‌دار است. در این آزمون برای مقایسه هر جفت میانگین، مقدار rα(sx) خاص آن مقایسه محاسبه می‌شود.

بیشتر تصمیم‌گیری در مورد این که کدامیک از آزمون‌های معرفی شده ارجحیت دارد، کار دشواری است و بسته به نظر تحلیلگر آماری مربوطه دارد، لیکن کارمر و اسوانسن در مطالعه‌ای که در مورد تعدادی از روش‌های مقایسه‌ای چندگانه انجام دادند اعلام کردند که روش حداقل اختلاف معنی دار روش بسیار مؤثری برای نشان دادن اختلاف‌های واقعی میانگین‌ها می‌باشد. مشروط بر این که تنها پس از معنی دار بودن آزمون f تجزیه واریانس استفاده شود. آن‌ها همچنین قابلیت شناسایی مناسب تفاوت‌های واقعی را با استفاده از آزمون چند دامنه‌ای دانکن گزارش کردند.

آزمون دانکن برای مقایسه‌های دو به دو (مانند آزمون SNK، REGWF و REGWQ می‌باشد) به کار می‌رود. این آزمون به طور متوسطی ساده‌گیرانه است اما خطای نوع یک را در قالب آزمایش، و نه با تعدیل در مقایسه‌ها، کنترل می‌کند.

بعدها والر و دانکن این روش را توسعه دادند. آزمون والر-دانکن (Waller-Duncan) به پژوهشگر این اجازه را می‌دهد تا نسبت خطاینوع یک بر خطای نوع دو را در مقایسه‌ها دخالت دهد.

آزمون دانت (Dunnett)

زمانی که در پژوهش یک گروه کنترل وجود دارد و هدف مقایسه گروه هایآزمایشی با گروه کنترل است. از آزمون دانت برای مقایسه دو به دو میانگین گروه‌ها با گروه کنترل استفادهمی شود.اما زمانی که واریانس متغیر وابسته در گروه‌ها برابر نباشد (تجانس واریانس‌ها برقرار نباشد) از آزمون های تعقیبی زیر برای مقایسه‌ها بین گروهی استفاده می‌شود.

آزمون تامبن Tambane’s-T2) T2) : از این آزمون برای مقایسه‌های دو به دو استفاده می‌شود و آزمون سخت‌گیری است.

آزمون دانت تی-سه T3 (Dunnett s T3) و آزمون دانت سی (Dunnett s C) : این آزمون‌ها بر پایه توزیع t-student،مقایسه‌ها را انجام می‌دهند و آزمون‌های میانه روی هستند.

در نهایت روش گیمز-هول (Games-Howell) برای مقایسه‌های دو به دو به کار می‌رود و آزمون ساده‌گیری است.

آزمون شفه (Scheffe test)

این آزمون به پژوهشگر امکان می‌دهد تا تمام حالت‌های مختلف مقایسه یک به یک میانگین‌ها و همچنین تمام ترکیب‌های چندتایی مقایسه میانگین‌ها را انجام دهد .در آزمون شفه، برای کنترل میزان احتمال خطای نوع اول، معیار تصمیم‌گیری در مورد فرضیه صفر یعنی مقدار بحرانی جهت تشخیص معنی دار بودن افزایش می‌یابد.

آزمون شفه برای مقایسه دو به دو میانگین‌ها به کار می‌رود و خیلی سخت‌گیر (most conservative) است. یعنی توان آزمون پایین و احتمال کمی در ارتکاب به خطای نوع I دارد. روش شفه در زمانی که هدف سنجش فرضیات نظری نامعلوم باشد که نیاز به دقت است، پر کاربردترین آزمون تعقیبی خواهد بود.

آزمون نیومن-کولز (The Newman-Keuls test)

این آزمون برای مقایسه‌های دو به دو به کار می‌رود. آزمون نیومن کولز آزمون میانه روی است اما تمایل به متورم شدن خطای نوع I را دارد و از طرف برخی مولفان توصیه نمی شود. این آزمون پس از اینکه آزمون Anova فرض صفر را رد کند، مقایسه‌های جفتی میان گروهها را انجام می‌دهد. فرض کنید که گروه‌هایی داریم که در آنها m1 < m2 < m3 ممکن است که برخی از آزمونها مقایسه‌های جفتی را برای موارد زیر نیز انجام دهند: یعنی گروه اول و سوم خیلی با هم متفاوت نیستند اما در عوض گروه اول و دوم تفاوت معنا داری با هم دارند.

آزمون نیومن-کولز، دقیقا برای پرهیز از چنین اتفاقی طراحی شده است. بخوص وقتی که آزمون اعلام کند که mi و mj که (mi < mj) تفاوت معناداری با هم ندارند آن گاه هر جفت از میانگین‌های ml و mn که mi ml mn mj از روش نیومن کلز معنا دار نخواهند بود. نتیجه ی این آزمون به صورت یک سری از گروه‌های دوتایی خواهد بود که در هرکدام از آنها آن دسته از گروهها که میانگین هایشان بنا بر سطح معناداری α تفاوت معناداری از هم دارند، قرار گرفته اند.

دیگر آزمون‌های تعقیبی

آزمون بونفرونی (Bonferoni)

به این آزمون همچنین آزمون دان نیز گفته می‌شود. از این روش برای مقایسه دو به دو میانگین‌ها به کار می‌رود. این روش به طور متوسطی (moderately) سخت گیر است. اگرچه این آزمون اغلب در ادبیات پژوهشی به کار می‌رود اما روشی است که با افزایش تعداد مقایسه‌ها تمایل بزرگتر نشان دادن تفاوت‌ها دارد.

آزمون سیداک (Sidak)

به این آزمون گاهی اوقات نیز سیداک-بونفرونی گفته می‌شود. از این روش برای مقایسه‌های دو به دو به کار می‌رود و سخت گیر تر از آزمون بونفرونی است. این آزمون یک آزمون تعقیبی میانه روی (نه ساده گیر است و نه سخت گیر) است.

آزمون REGWF و REGWQ

این آزمون‌ها برای مقایسه‌های دو به دو به کار می‌روند. هر دو اینآزمون‌ها از طریق مولفانی که از آزمون نیومن کولز استفاده می‌کنند، پیشنهاد می‌شود.

آزمون هاکبرگز GT2 (Hochbergs GT2)

این روش شبیه آزمون توکی است، امابه صورت ویژه برای آزمایش هایی طراحی شده است که اندازه نمونه در گروه‌ها نا برابر باشد.

آزمون گابریل (Gabriel)

آزمون گابریل نسخه ی ساده گیرتر آزمون هاکبرگز-GT2 می‌باشد.

سخن پایانی آزمون‌های تعقیبی

آزمون هایی که در بالا نام برده شدند برای مقایسه میانگین گروه‌ها به کار برده می‌شوند. یعنی زمانیکه بخواهیم چند گروه را از نظر یک متغیر مقایسه کنیم. به این نوع مقایسه ها، مقایسه‌های بین گروهیگفته می‌شود. اما زمانی که هدف مقایسه درون گروهی یک متغیر باشد یعنی بخواهیم چند آزمون تکراریکه از یک متغیر در یک گروه به دست آمده است را با هم مقایسه کنیم، دیگر نمی توان از این آزمون‌ها استفادهنمود. برای مقایسه میانگین‌های درون گروهی سه آزمون تعقیبی LSD، بونفرونی و سیداک تعدیل شده اند کهآن‌ها را اینگونه نام گذاری می‌کنند: LSD تعدیل یافته، بونفرونی تعدیل یافته و سیداک تعدیل یافته. این آزمون هایتعدیل یافته پایه‌ای شبیه به آزمون تعدیل نشده خودشان دارند.

منبع: حبیبی، آرش؛ سرآبادانی، مونا. (۱۴۰۱). آموزش کاربردی SPSS. تهران: نارون.

زهره
با سلام. من ANOVA’ گرفته ام و معنی دار شده است. اما آزمون تعقیبی که می گیرم معنی دار نمی شود. یک با ر Dunnet t3 گرفتم و یک بار Games-Howell هیچ کدام معنی دار نمی شود. اشکال کار کجاست؟؟؟
محمد
سلام
میخام آمار و روش تحقیقم رو تقویت کنم
و روش آماری را برای پژوهش های مختلف را بتونم تشخیص بدهم
کتاب خاصی وجود داارد
یوسفی
سلام. من وقتی داده های دو گروه را با تی تست ارزیابی میکنم معنی دار هستند ولی وقتی سه گروه باشند و با anova بررسی میکنم معنی دار نیت میتونم در مقاله هر دو تست را عنوان کنم؟
ساناز
شما کدام روش را برای بررسی اختلاف نتایج تحلیل واریانس پیشنهاد می‌کنید؟ بهترین ازمون تعقیبی کدام است؟ سپاس فراوان
زهرا
سلام و ادب.میخواستم یک شاخص رو در ۱۵ منطقه بررسی کنم.توزیع شاخص در مناطق غیرنرماله و واریانسش همسانه. شما چه آزمونی رو برای بررسی تفاوت در مناطق پیشنهاد میدید؟ و همینطور چه آزمون تعقیبی رو؟ ممنونم.
کریملو
سلام
تفاوت آزمون شاپیرو و LSD چیست

با تشکر
لاله
سلام و خدا قوت
من از آنالیز آنوا استفاده کردم نتیجه تست لون و آنوا کمتر از ۰.۰۵ شد واریانسها همگن نبود بهمین خاطر از دانت تری استفاده کردم اما تفاوت معناداری بین هیچکدام از گروهها دیده نشد چرا؟
Mha
با سلام لططفا جوابداین سوال بهم بدین ممنون
به نظر میرسد بین جنسیت و وضعیت اشتغال افراد رابطه وجود دارد.
از جه ازمونی استفادهومیشود؟خی دو،وی کرامر،ضریب وابستگی یا لاندا
و چرا؟
محمد
باسلام من بخاطر نرمال نبودن توزیعم مجبورم که از آزمون کراسکال والیس استفاده کنم اما نیازدارم که اثر تعاملی متغیرهاموروی هم بسنجم که این آزمون این قابلیت رو نداره چه آزمونی پیشنهاد میکنید؟ باتشکرفراوان
لیلی
سلام. من بین سه متغییر مستقل برای مقایسه دو به دو میانگین ها ازمون شفه گرفتم. نتیجه برای هر دو مقایسه دو p مقدار داده است. مثلا بین متغییر ۱و ۲ sig 0/00 0/06 داده است نمی دانم کدام را باید لحاظ کنم.
فرزانه
سلام. من برابری میانگین سنی رو در پنج گروه وضعیت با انوا آزمون کردم و معنیدار بود و توکی هم معنی دار بود اما متوجه شدم که متغیر سن نرمال نیست. چون نسبت چولگیش ۱.۶ و نسبت کشیدگیش -۴. میشه اغماض کرد؟
maysam
درود در صورتی که داده ها نرمال نباشند از چه آزمون ناپارامتری که معادل آزمون تعقیبی باشند بایستی استفاده کرد؟
رهرا
سلام من دو درمان با سه متغیر مقایسه کردم و از آزمون تعقیبی بن فرونی استفاده کردم.الان در قسمت چکیده که میخواهم بنویسم کدام درمان برای کدام متغیر مناسب است.تفاوت میانگین مخففش به انگلیسی چی میشه