آزمونهای تعقیبی
آزمونهای تعقیبی (Post-hoc) روشهای آماری هستند که برای تفسیر معناداری تفاوت میانگین طبقات در تحلیل واریانس استفاده میشوند. در واقع نتایج تحلیل واریانس نشان میدهد آیا اختلاف میانگین طبقات معنادار است یا خیر. اما این نتایج نشان نمیدهد کدام طبقات باهم تفاوت دارند. شماره زیادی از آزمونهای تعقیبی وجود داند. برای نمونه میتوان به آزمون توکی، شفه و تی دان اشاره کرد. در تحلیل واریانس برای مقایسه گروهها در آزمونهای تحلیل واریانس همچنین تحلیل واریانس نیز به شیوههای متعددی انجام میشود. تحلیل واریانس یک راهه، تحلیل واریانس چند راهه، تحلیل واریانس با اندازههای تکراری یک عاملی و جند عاملی، تحلیل واریانس چند متغیری و … از این جمله هستند.
پرسش کلیدی آن است که از چه آزمون تعقیبی استفاده شود که مناسب پژوهش مورد مطالعه باشد؟ پاسخ این پرسش اغلب برای پژوهشگران روشن نیست. پژوهشگران نمی دانند که با توجه به اهداف پژوهشی شان از چه آزمون تعقیبی برای مقایسه پش تجربی گروهها استفاده کنند. در این مقاله بر آزمونهای تعقیبی آمده است. این آموزش به پژوهشگران کمک کند تا آزمون تعقیبی مناسب را در تحلیل آماری پژوهش انتخاب کنند.
آشنایی با آزمونهای تعقیبی
آزمون HSD و LSD مشهورترین آزمونهای تعقیبی در تحلیل واربانس هستند. همچنین روشهای گوناگون دیگری نیز برای بررسی اختلاف میانگین گروهها در تحلیل واریانس وجود دارد که برخی از مهمترین آنها عبارتند از:
آزمون توکی (HSD)
توکی (Tukey) به سال ۱۹۵۳ یک روش مقایسه چندگانه را بر مبنای آماره دامنه استیودنت پیشنهاد کرد. در روش وی از آزمون توکی، خروجی نرمافزار برای تعیین مقدار بحرانی تمام مقایسههای جفت میانگینها استفاده میشود. بنابراین آزمون توکی در صورتی دو میانگین را دارای تفاوت معنی دار اعلام میکند که قدرمطلق اختلاف نمونه ی آنها بیش از آزمون توکی، خروجی نرمافزار باشد. این آزمون که به HSD معروف است بعد از رد فرض صفر در آنالیز واریانس، به مقایسه ی همه ی تفاوتها میپردازد. اگر در آزمون F تفاوت معناداری بین میانگینهای گروهها ثابت شود، با آزمون توکی تفاوت معنادار مابین هر دو گروه بررسی میشود.
آزمون تفاوت معنادار راستین برگردان honestly significant difference است که به اختصار HSD نامیده میشود. این روش برای مقایسه دو به دو میانگین گروهها استفاده میشود. آزمون توکی مقدار خطای کلی برای مجموعه مقایسههای دو به دو را کنترل میکند. این آزمون به طور متوسطی سخت گیر است و از طرفاغلب مولفان توصیه میشود.
آزمون توکی ب (Tukey s-b) حالت بیابینی از آزمون توکی و بونفرونی میباشد.
آزمون حداقل تفاوت معنی دار فیشر (LSD)
این آزمون یکی از قدیمی ترین و قوی ترین آزمونها برای مقایسه پس از تجربه است. درصورتی که تعداد میانگینها از سه تا بیشتر نباشد، بهتر است از این آزمون استفاده شود. اما اگر میانگینهای مورد مقایسه بیش از سه مورد باشد، بهتر است سایر آزمونها مورد استفاده قرار گیرد. آزمون حداقل تفاوت معنی دار (LSD) بسیار مشابه آزمون تفاوت معنی دار راستین (HSD) است.
آزمون حداقل تفاوت معنی دار (LSD) استفاده شده است که از روش مرسوم تفاوت معنادار راستین HSD روش سختگیرانهتری است. دراین آزمون میخواهیم فرض H0:μi=μj را برای تمام i≠j آزمون نمائیم. چنانچه اختلاف میانگین بین دو گروه (تیمار) بیش از مقدار ثابت LSD باشد، به معنی اختلاف معنی دار بین دو گروه است. برای اجرای این آزمون توجه به دو نکته دارای اهمیت است؛ اول آنکه این آزمون بهتر است زمانی استفاده شود که مقدار آماره F در جدول آنالیز واریانس معنی دار شده باشد و دوم تعداد گروهها زیاد نباشد.
آزمون حداقل تفاوت معنادار برگردان Least significant difference که به اختصار LSD نامیده میشود. این آزمون برای مقایسه دو به دو میانگین گروهها به کار میرود. آزمون LSD خیلی ساده گیر (most liberal) است (یعنی توان بالایی دارد و احتمال زیادی دارد که مرتکب خطای نوع یک شود). بیشتر پژوهشگران در استفاده از این آزمون احتیاط میکنند، اما هنوز تمایل برای استفاده از این آزمون توسط برخی دیگر وجود دارد.
آزمون دانکن (Duncan)
در این آزمون، که به آزمون چند دامنهای دانکن نیز معروف است، چنان چه قدر مطلق اختلاف میانگینهای مورد مقایسه بزرگ تر یا مساوی rα(sx) باشد، اختلاف بین میانگینهای مورد مقایسه معنیدار است. در این آزمون برای مقایسه هر جفت میانگین، مقدار rα(sx) خاص آن مقایسه محاسبه میشود.
بیشتر تصمیمگیری در مورد این که کدامیک از آزمونهای معرفی شده ارجحیت دارد، کار دشواری است و بسته به نظر تحلیلگر آماری مربوطه دارد، لیکن کارمر و اسوانسن در مطالعهای که در مورد تعدادی از روشهای مقایسهای چندگانه انجام دادند اعلام کردند که روش حداقل اختلاف معنی دار روش بسیار مؤثری برای نشان دادن اختلافهای واقعی میانگینها میباشد. مشروط بر این که تنها پس از معنی دار بودن آزمون f تجزیه واریانس استفاده شود. آنها همچنین قابلیت شناسایی مناسب تفاوتهای واقعی را با استفاده از آزمون چند دامنهای دانکن گزارش کردند.
آزمون دانکن برای مقایسههای دو به دو (مانند آزمون SNK، REGWF و REGWQ میباشد) به کار میرود. این آزمون به طور متوسطی سادهگیرانه است اما خطای نوع یک را در قالب آزمایش، و نه با تعدیل در مقایسهها، کنترل میکند.
بعدها والر و دانکن این روش را توسعه دادند. آزمون والر-دانکن (Waller-Duncan) به پژوهشگر این اجازه را میدهد تا نسبت خطاینوع یک بر خطای نوع دو را در مقایسهها دخالت دهد.
آزمون دانت (Dunnett)
زمانی که در پژوهش یک گروه کنترل وجود دارد و هدف مقایسه گروه هایآزمایشی با گروه کنترل است. از آزمون دانت برای مقایسه دو به دو میانگین گروهها با گروه کنترل استفادهمی شود.اما زمانی که واریانس متغیر وابسته در گروهها برابر نباشد (تجانس واریانسها برقرار نباشد) از آزمون های تعقیبی زیر برای مقایسهها بین گروهی استفاده میشود.
آزمون تامبن Tambane’s-T2) T2) : از این آزمون برای مقایسههای دو به دو استفاده میشود و آزمون سختگیری است.
آزمون دانت تی-سه T3 (Dunnett s T3) و آزمون دانت سی (Dunnett s C) : این آزمونها بر پایه توزیع t-student،مقایسهها را انجام میدهند و آزمونهای میانه روی هستند.
در نهایت روش گیمز-هول (Games-Howell) برای مقایسههای دو به دو به کار میرود و آزمون سادهگیری است.
آزمون شفه (Scheffe test)
این آزمون به پژوهشگر امکان میدهد تا تمام حالتهای مختلف مقایسه یک به یک میانگینها و همچنین تمام ترکیبهای چندتایی مقایسه میانگینها را انجام دهد .در آزمون شفه، برای کنترل میزان احتمال خطای نوع اول، معیار تصمیمگیری در مورد فرضیه صفر یعنی مقدار بحرانی جهت تشخیص معنی دار بودن افزایش مییابد.
آزمون شفه برای مقایسه دو به دو میانگینها به کار میرود و خیلی سختگیر (most conservative) است. یعنی توان آزمون پایین و احتمال کمی در ارتکاب به خطای نوع I دارد. روش شفه در زمانی که هدف سنجش فرضیات نظری نامعلوم باشد که نیاز به دقت است، پر کاربردترین آزمون تعقیبی خواهد بود.
آزمون نیومن-کولز (The Newman-Keuls test)
این آزمون برای مقایسههای دو به دو به کار میرود. آزمون نیومن کولز آزمون میانه روی است اما تمایل به متورم شدن خطای نوع I را دارد و از طرف برخی مولفان توصیه نمی شود. این آزمون پس از اینکه آزمون Anova فرض صفر را رد کند، مقایسههای جفتی میان گروهها را انجام میدهد. فرض کنید که گروههایی داریم که در آنها m1 < m2 < m3 ممکن است که برخی از آزمونها مقایسههای جفتی را برای موارد زیر نیز انجام دهند: یعنی گروه اول و سوم خیلی با هم متفاوت نیستند اما در عوض گروه اول و دوم تفاوت معنا داری با هم دارند.
آزمون نیومن-کولز، دقیقا برای پرهیز از چنین اتفاقی طراحی شده است. بخوص وقتی که آزمون اعلام کند که mi و mj که (mi < mj) تفاوت معناداری با هم ندارند آن گاه هر جفت از میانگینهای ml و mn که mi ml mn mj از روش نیومن کلز معنا دار نخواهند بود. نتیجه ی این آزمون به صورت یک سری از گروههای دوتایی خواهد بود که در هرکدام از آنها آن دسته از گروهها که میانگین هایشان بنا بر سطح معناداری α تفاوت معناداری از هم دارند، قرار گرفته اند.
دیگر آزمونهای تعقیبی
آزمون بونفرونی (Bonferoni)
به این آزمون همچنین آزمون دان نیز گفته میشود. از این روش برای مقایسه دو به دو میانگینها به کار میرود. این روش به طور متوسطی (moderately) سخت گیر است. اگرچه این آزمون اغلب در ادبیات پژوهشی به کار میرود اما روشی است که با افزایش تعداد مقایسهها تمایل بزرگتر نشان دادن تفاوتها دارد.
آزمون سیداک (Sidak)
به این آزمون گاهی اوقات نیز سیداک-بونفرونی گفته میشود. از این روش برای مقایسههای دو به دو به کار میرود و سخت گیر تر از آزمون بونفرونی است. این آزمون یک آزمون تعقیبی میانه روی (نه ساده گیر است و نه سخت گیر) است.
آزمون REGWF و REGWQ
این آزمونها برای مقایسههای دو به دو به کار میروند. هر دو اینآزمونها از طریق مولفانی که از آزمون نیومن کولز استفاده میکنند، پیشنهاد میشود.
آزمون هاکبرگز GT2 (Hochbergs GT2)
این روش شبیه آزمون توکی است، امابه صورت ویژه برای آزمایش هایی طراحی شده است که اندازه نمونه در گروهها نا برابر باشد.
آزمون گابریل (Gabriel)
آزمون گابریل نسخه ی ساده گیرتر آزمون هاکبرگز-GT2 میباشد.
سخن پایانی آزمونهای تعقیبی
آزمون هایی که در بالا نام برده شدند برای مقایسه میانگین گروهها به کار برده میشوند. یعنی زمانیکه بخواهیم چند گروه را از نظر یک متغیر مقایسه کنیم. به این نوع مقایسه ها، مقایسههای بین گروهیگفته میشود. اما زمانی که هدف مقایسه درون گروهی یک متغیر باشد یعنی بخواهیم چند آزمون تکراریکه از یک متغیر در یک گروه به دست آمده است را با هم مقایسه کنیم، دیگر نمی توان از این آزمونها استفادهنمود. برای مقایسه میانگینهای درون گروهی سه آزمون تعقیبی LSD، بونفرونی و سیداک تعدیل شده اند کهآنها را اینگونه نام گذاری میکنند: LSD تعدیل یافته، بونفرونی تعدیل یافته و سیداک تعدیل یافته. این آزمون هایتعدیل یافته پایهای شبیه به آزمون تعدیل نشده خودشان دارند.
منبع: حبیبی، آرش؛ سرآبادانی، مونا. (۱۴۰۱). آموزش کاربردی SPSS. تهران: نارون.
نگارنده: پشتیبانی پارسمدیر | آمار کاربردی مدیریت | ۱۵ فروردین ۹۲
با سلام. من ANOVA’ گرفته ام و معنی دار شده است. اما آزمون تعقیبی که می گیرم معنی دار نمی شود. یک با ر Dunnet t3 گرفتم و یک بار Games-Howell هیچ کدام معنی دار نمی شود. اشکال کار کجاست؟؟؟
درود بر شما. از آزمون توکی (HSD) استفاده کنید. حداقل یکی از زوجها اختلاف میانگین خواهند داشت.
جدا سپاسگزارم. فکر نمی کردم پاسخ دهید!
زنده باشید. این سایت برای حل مشکلات پژوهشگران راهاندازی شده است.
سلام
میخام آمار و روش تحقیقم رو تقویت کنم
و روش آماری را برای پژوهش های مختلف را بتونم تشخیص بدهم
کتاب خاصی وجود داارد
درود بر شما. کتاب آموزش کاربردی SPSS با همین هدف نوشته شده است.
سلام. من وقتی داده های دو گروه را با تی تست ارزیابی میکنم معنی دار هستند ولی وقتی سه گروه باشند و با anova بررسی میکنم معنی دار نیت میتونم در مقاله هر دو تست را عنوان کنم؟
درود بر شما. بهتر است فقط از آنوا استفاده کنید، به خاطر داشته باشید پژوهش شما پیرامون راستیآزمایی آزمونهای آماری نیست بنابراین بیهوده خودتان را به چالش نکشید.
سلام میتونم بجای توکی از LSD استفاده کنم چون اینطور مثل حالت t-test معنی دار میشند.
بله، روش LSD روشی سختگیرانهتر است و آستانه پذیرش برای معنادار شدن تفاوت در آن بزرگتر است.
شما کدام روش را برای بررسی اختلاف نتایج تحلیل واریانس پیشنهاد میکنید؟ بهترین ازمون تعقیبی کدام است؟ سپاس فراوان
بهترین روشی وجود ندارد ضمن اینکه بیشتر روشها نتایج مشابهی بدست میدهند. با این وجود روش HSD و LSD بیشتر استفاده میشوند اما سندی مبتنی بر اینکه روشهای بهتری هستند ندارم.
سلام و ادب.میخواستم یک شاخص رو در ۱۵ منطقه بررسی کنم.توزیع شاخص در مناطق غیرنرماله و واریانسش همسانه. شما چه آزمونی رو برای بررسی تفاوت در مناطق پیشنهاد میدید؟ و همینطور چه آزمون تعقیبی رو؟ ممنونم.
درود بر شما. از آزمون کروسکال-والیس استفاده کنید. نیازی به آزمون تعقیبی نیست.
سلام و ادب. تشکر از پاسخگوییتون. میتونم علت عدم نیاز به استفاده از آزمونهای تعقیبی رو بدونم؟ برای قیدکردنش در پایان نامه میخواستم.
بحث عدم نیاز نیست؛ مساله این است که آزمونهای تعقیبی ناپارامتریک نداریم یا دستکم من نمیشناسم. چرا فکر میکنید دادههای شما نرمال نیست؟ از چه آزمونی استفاده کردید؟
سلام و سپاس از پاسخگوییتون. بنده از آزمون کولموگروف-اسمیرنوف استفاده کردم که sig=0.002 بدست اومد.
بهتر است نسبت چولگی و کشیدگی را برای بررسی نرمال بودن دادهها برآورد کنید. آموزش نرمال بودن دادهها را مطالعه بفرمایید.
تشکر از شما. ببخشید شما کار تحلیل پایان نامه (فصل ۴) هم انجام میدید؟ برای پرس و جو با شماره های داخل سایت میشه تماس گرفت؟
نتیجه آزمون کروسکال-والیس هم این شد که فرض صفر رد شد. و تفاوت معناداری در شاخص بین حداقل یک جفت از مناطق وجود داره.
سلام
تفاوت آزمون شاپیرو و LSD چیست
با تشکر
درود بر شما. آزمون شاپیرو-ویلک برای نرمال بودن دادهها استفاده میشود.
سلام و خدا قوت
من از آنالیز آنوا استفاده کردم نتیجه تست لون و آنوا کمتر از ۰.۰۵ شد واریانسها همگن نبود بهمین خاطر از دانت تری استفاده کردم اما تفاوت معناداری بین هیچکدام از گروهها دیده نشد چرا؟
درود بر شما. یک بار اختلاف میانگینها را با آزمون توکی مورد بررسی قرار دهید.
درود بر شما سپاسگزارم.
آیا با وجود ناهمگنی واریانس میتونم از توکی استفاده کنم؟ و جدول توکی را گزارش کنم؟ من تعداد برگ،ساقه ورشد طولی را اندازه گیری کردم و دادهها را در سه ستون وارد کردم دو ستون نرمالند و ستون تعداد ساقه نرمال نیست میشه دو ستون را با آنوا و ستون غیرنرمال را با کروسکال والیس بسنجم؟
البته در علوم تجربی با تردید صحبت میکنم.
۱- اگر دادهها نرمال نباشد بهتر است کلاً از روشهای ناپارامتریک استفاده کنید و تا جاییکه من میدانم کروسکال-والیس آزمون تعقیبی ندارد.
۲- آزمون توکی قابل استفاده است و به ناهمگنی واریانس حساس نیست.
سپاس فراوان از شما
برایتان شادی و برکت آرزو میکنم.
ارادتمندم
با سلام لططفا جوابداین سوال بهم بدین ممنون
به نظر میرسد بین جنسیت و وضعیت اشتغال افراد رابطه وجود دارد.
از جه ازمونی استفادهومیشود؟خی دو،وی کرامر،ضریب وابستگی یا لاندا
و چرا؟
درود. به احترام شما آموزش رابطه میان متغیرهای اسمی به سایت افزوده شد.
باسلام من بخاطر نرمال نبودن توزیعم مجبورم که از آزمون کراسکال والیس استفاده کنم اما نیازدارم که اثر تعاملی متغیرهاموروی هم بسنجم که این آزمون این قابلیت رو نداره چه آزمونی پیشنهاد میکنید؟ باتشکرفراوان
درود بر شما. از آزمون بونفرینی (Dunn) استفاده کنید چون یک روش ناپارامتریک است. این آزمون از مسیر آزمون ANOVA قابل دسترسی است اما زیرمجموعه آزمون ANOVA نیست بنابراین میتوانید از نتایج آن برای تفسیر تفاوت گروهها در آزمون کروسکال و والیس بهره بگیرید.
خیلی ممنون از لطفتون و سرعت پاسخ گوییتون🙏🙏🙏
با عرض سلام ببخشید آزمونهای پست هاک مخصوص متغیرهای با بیشتر از ۳حالت هستن متغیرهای من ۲حالتین و برای همین ارور میده میشه لطفا راهنمایی بفرمایید؟
روشن است، برای این منظور اصلا نباید از آزمون کروسکالوالیس استفاده کنید باید از آزمون منویتنی استفاده کنید.
سلام. من بین سه متغییر مستقل برای مقایسه دو به دو میانگین ها ازمون شفه گرفتم. نتیجه برای هر دو مقایسه دو p مقدار داده است. مثلا بین متغییر ۱و ۲ sig 0/00 0/06 داده است نمی دانم کدام را باید لحاظ کنم.
درود بر شما. برای هر زوج مقایسه یک مقدار معناداری گزارش میشود. برداشت شما نادرست بهنظر میرسد، یک بار از آمون توکی استفاده کنید و نتیجه را گزارش کنید.
سلام. سپاسگزارم که پاسخ دادید بله برداشت من از جواب اشتباه بود.
سلام. من برابری میانگین سنی رو در پنج گروه وضعیت با انوا آزمون کردم و معنیدار بود و توکی هم معنی دار بود اما متوجه شدم که متغیر سن نرمال نیست. چون نسبت چولگیش ۱.۶ و نسبت کشیدگیش -۴. میشه اغماض کرد؟
درود در صورتی که داده ها نرمال نباشند از چه آزمون ناپارامتری که معادل آزمون تعقیبی باشند بایستی استفاده کرد؟
سلام من دو درمان با سه متغیر مقایسه کردم و از آزمون تعقیبی بن فرونی استفاده کردم.الان در قسمت چکیده که میخواهم بنویسم کدام درمان برای کدام متغیر مناسب است.تفاوت میانگین مخففش به انگلیسی چی میشه
درود بر شما
Mean Difference / Difference in Means (MD)