آزمون کولموگروف-اسمیرنوف (KS)
آزمون کولموگروف-اسمیرنوف (Kolmogorov-Smirnov) یک آزمون آماری ناپارامتریک است که برای بررسی توزیع دادهها استفاده میشود. به بیان آماری، آزمون کوموگروف-اسمیرنوف نوعی آزمون نیکوئی برازش برای مقایسه یک توزیع نظری با توزیع مشاهده شده است.
بیشتر پژوهشگران داخلی از آزمون کولموگروف-اسمیرنوف برای آزمون نرمال بودن دادهها استفاده میکنند. همچنین از این آزمون میتوان برای بررسی توزیع یکنواخت، نمایی و پواسون نیز استفاده کرد. با این وجود استفاده از این آزمون محدودیتهایی نیز به همراه دارد که پژوهشگران باید از آن آگاه باشند. نظر به اهمیت موضوع در ادامه به شیوه انجام آزمون با نرمافزار SPSS و پرسشهای پژوهشگران پرداخته میشود.
آزمون کولموگروف-اسمیرنوف برای پرسشنامه
آیا میتوان از آزمون کولموگروف-اسمیرنوف برای بررسی نرمال بودن دادههای پرسشنامه طیف لیکرت استفاده کرد؟
اجازه دهید پاسخ را ابتدا بدهم: خیر. دادههای طیف لیکرت در مقیاس ترتیبی تهیه میشوند. دادههایی که مقیاس اندازهگیری آنها ترتیبی باشد برای آزمون KS مناسب نیستند. همه مشاهدات در متغیرهای نمونهبرداری شده باید در هر مشاهده مستقل از مشاهده دیگر باشد. هر مشاهده فقط در یکی از مقولههای مرتب شده قرار گیرد. این شرایط در دادههایی که با طیف لیکرت اندازهگیری میشوند وجود ندارد. بنابراین نمیتوان از آزمون کولموگروف-اسمیرنوف برای بررسی نرمال بوده دادههای پرسشنامه طیف لیکرت استفاده کرد (فرجی، ۱۳۸۵ : ۲۱۸).
آیا حجم نمونه برای آزمون کولموگروف-اسمیرنوف محدودیتی دارد؟
حجم نمونه در آزمون KS محدودیتی ندارد و این آزمون برخلاف آزمون خی-دو با هر تعدادی از نمونه قابل انجام است. شرایط آزمون KS مانند شرایط آزمون تک متغیری خی-دو است. با این تفاوت که مقولههای متغیر مورد بررسی باید دارای ترتیب معینی باشند بطوریکه هر مشاهده ضمن استقلال از سایر مشاهدات باید تنها در یکی از مقولهها قرار گیرد (فرجی، ۱۳۸۵ : ۲۱۹).
برخلاف آنچه در برخی مقالهها به آن استناد میشود آزمون KS فقط برای دادههای کوچک (کمتر از ۳۰ تا) کاربرد ندارد. البته نتایج این آزمون برای دادههای کوچک طیف لیکرت معمولاً با نتایج چولگی و کشیدگی دادهها همراستا است. اما برای دادههای زیاد نتایج این آزمون با نتایج چولگی و کشیدگی و همینطور خط نرمال در نمودار هیستوگرام همخوانی ندارد.
آزمون کولموگروف-اسمیرنوف در SPSS
برای استفاده از آزمون کولموگروف-اسمیرنف مانند آزمون من-ویتنی فرمان زیر را اجرا کنید:
Analyze→ Nonparametric Tests →Leagcy Dialogs→۱-Sample K-S…
در کادر ظاهر شده گزینه Kolmogorov-smirnov را فعال کنید. یکی از مهمترین کاربردهای این آزمون سنجش نرمال بودن دادهها است که در فصل گذشته بیان شد. البته کاربردهای دیگری نیز وجود دارد که عبارتند از:
برای مقایسه توزیع مشاهده شده با توزیع نرمال گزینه Normal را فعال کنید.
جهت مقایسه توزیع مشاهده شده با توزیع یکنواخت گزینه Uniform را فعال کنید.
برای مقایسه توزیع مشاهده شده با توزیع پواسون گزینه Poisson را فعال کنید.
برای مقایسه توزیع مشاهده شده با توزیع نمائی گزینه Exponential را فعال کنید.
تفسیر آزمون کولموگروف-اسمیرنوف
هنگام بررسی یکنواخت بودن دادهها، فرض صفر مبتنی بر اینکه توزیع دادهها یکنواخت است را در سطح خطای ۰.۰۵ تست میشود. اگر مقدار معناداری بزرگتر یا مساوی سطح خطا (۵%) بدست آید، در این صورت دلیلی برای رد فرض صفر وجود نخواهد داشت. به عبارت دیگر توزیع دادهها یکنواخت خواهد بود.
هنگام بررسی نرمال بودن دادهها ما فرض صفر مبتنی بر اینکه توزیع دادهها نرمال است را در سطح خطای ۵% تست میکنیم. برای آزمون نرمالیته فرضهای آماری به صورت زیر تنظیم میشود:
H0 : توزیع دادههای مربوط به هر یک از متغیرها نرمال است
H1 : توزیع دادههای مربوط به هر یک از متغیرها نرمال نیست
بنابراین اگر آماره آزمون بزرگتر مساوی ۰.۰۵ بدست آید، در این صورت دلیلی برای رد فرض صفر وجود نخواهد داشت. به عبارت دیگر توزیع دادهها نرمال است.
خلاصه و جمعبندی
آزمون کولموگروف-اسمیرنوف که به آزمون KS نیز موسوم است برای بررسی نرمال بودن دادهها استفاده میشود. شاید کولموگروف و اسمیرنوف خودشان هم تصور نمیکردند روزی این آزمون به چنین دردسر بزرگی برای دانشجویان ایرانی تبدیل شود. بزرگترین پرسش همه دانشجویان مدیریت و علوم اجتماعی آن است که آیا میتوان از این روش برای بررسی نرمال بودن دادههای پرسشنامه طیف لیکرت استفاده کرد؟ پاسخ منفی است زیرا طیف لیکرت یک مقیاس ترتیبی است. این آزمون برای دادههای اسمی و ترتیبی مناسب نیست. در واقع بیشتر برای دادههای نسبی و فاصلهای مناسب است. برای آگاهی بیشتر در این زمینه انواع مقیاس اندازهگیری متغیرها را مطالعه کنید.
یک پرسش کلیدی دیگر مقایسه این آزمون با روش پیشنهادی شاپیرو و ویلک است. هر دو آزمون با هدف بررسی نرمال بودن دادهها استفاده میشوند. در بیشتر موارد نیز نتایج هر دو آزمون مشابه هم بدست میآید ولی گاهی ممکن است تناقض در نتایج وجود داشته باشد. این اتفاق بدیهیو طبیعی است. به عنوان یک پژوهشگر هرگز از آزمونهای موازی که هدف یکسانی دارند استفاده نکنید. وظیف شما مقایسه و تشخیص برتری آزمونها نیست. یک روش را انتخاب کرده و براساس نتایج همان روش، پژوهش خود را ادامه دهید. در نهایت باید عنوان کرد اگر از پرسشنامهای با طیف لیکرت استفاده میکنید بهتر است از چولگی و کشیدگی دادهها برای بررسی نرمال بودن استفاده نمایید.
فهرست منابع
منبع: حبیبی، آرش؛ سرآبادانی، مونا. (۱۴۰۱). آموزش کاربردی SPSS. تهران: نارون.
فرجی، نصرالله. (۱۳۸۵). آمار توصیفی و استنباطی. تهران: پوران پژوهش.
آمار کاربردی مدیریت | ۰۹ فروردین ۹۲
با سلام خدمت شما
من می خوام مطمئن بشم که داده هام از توزیع نمایی پیروی می کنند. آیا روش زیر درست هست؟ در ضمن تعداد داده های من حداقل ۳۰ تا می باشد.
Analyze/Nonparametric tests/ Legacy dialogs/ 1-sample K-S
متغیر مورد نظر رو به سمت راست منتقل می کنیم و تیک Exponential را می زنیم و ok را می زنیم.
در صورتیکه عدد Kolmogorov-Smirnov Z در جدول از ۰.۰۵ بیشتر باشد داده ها توزیع نمایی دارند.
این کار درست است؟
حجت را تمام کردید. روش تشخیص توزیع نمایی، توزیع یکنواخت و توزیع نرمال در SPSS همینگونه است.
با سلام من از آزمون کولموگروف استفاده کردم برای تمام متغیرهایم مقدار آماره آزمون برابر صفر شد چطور باید دادهامو نرمال کنم؟
اگر دادهها را با پرسشنامه طیف لیکرت گردآوری کردهاید، آزمون KS مناسب نیست. بهتر است چولگی و کشیدگی دادهها را بررسی کنید. یا از منحنی نرمال در نمودار هیستوگرام استفاده کنید. در نهایت نیز نمودار qq پلات راهکار مناسبی است.
با سلام. بکاربردن آزمون K-S برای طیف لیکرت مشکلی ندارد.اگر طیف لیکرت را ترتیبی بدانیم پس حق استفاده از هیچ آزمون پارامتری مانند t و حتی معادلات ساختاری نداریم. چون یا واریانس محورند یا کوواریانس محور. مگر می شود از میانگین، واریانس و کوواریانس برای داده های ترتیبی استفاده کرد؟ پس فرجی (۱۳۸۵) اشتباهه
ماجرا این است که درست است طیف لیکرت ترتیبی است ولی چون می خواهیم میانگین و سایر شاخص های آماری نظرات مخاطبین را معین کنیم با یک درجه اقماض آن را به صورت بازه پیوسته ۱ تا ۵ در نظر می گیریم. از آن گذشته با کامپیوت کردن سوالات، متغیرهای تحقیق در بازه پیوشته ۱ تا ۵ قرار می گیرند.
درصورتیکه عدد z تو آزمون بزرگتر از ۰.۰۵ باشه نتایج نرمال است و یا اینکه در صورتیکه عدد سطح معنی داری یا sig بزرگتر از ۰.۰۵ باشه.
اگر آماره آزمون (Test Statistic) یعنی z یا t از ۱.۹۶ بزرگتر باشد مقدار معناداری (Sig) حتما از سطح خطا کمتر است و دادهها نرمال نیستند.
با سلام
من می خوام فرضیه ام که استفاده از یک روش برای کار پروژه ای است و از نظرسنجی افراد که پرسشنامه ام را پر کرده اند، تحلیل بگیرم. یعنی فرضیه ام این بود که از نظر افراد این روش درست است.
این مسیر رو رفتم:
Analyze >nanpar…> lega> 1-sample
پرسشنامه ام طیف لیکرت بود ۵تایی
حالا sig برابر ۰.۰۰۰ شده، یعنی فرضیه ام درست بوده؟
آزمون مورد نظر شما تی-تک نمونه است که باید از منوی Analayze گزینه Compare Means گزینه One Sample t-Tset را انتخاب کنید. به بحث آزمون میانگین جامعه رجوع کنید.
با سلام و احترام
پژوهش بنده تاثیر اجرای یک طرح هست بر شاخصهای احصا شده….طرح در سال ۹۳ اجرایی شده و من برای هر شاخص عدد دارم بین سالهای ۹۱ تا ۹۶…سه سال قبل و بعد طرح…..آیا استفاده از ازمون t مستقل مناسبه و آیا برای ورد داده ها در نرم افزار باید قبلش نرمالیته صورت بگیره؟ ممنون
به بحث آزمون میانگین جامعه رجوع کنید. اگر پاسخ را پیدا نکردید در زیر همان بحث پرسش خود را مطرح کنید.
با سلام خدمت شما
من یک سوال در مورد نمونه آماری ام دارم. جمعیت جامعه ۱۲۰۰ نفر است و من طبق جدول مورگان ۲۹۱ نمونه باید داشته باشم. سوالم این است که آیا فرقی بین استفاده از کوکران یا مورگان هست؟ و تعداد نمونه من با همین شرایط درست است؟
ممنون پاسختون خواهم بود
سوال را در بحث مرتبط یعنی جدول مورگان مطرح کنید.
سلام
من در جایی خوانده بودم برای آزمون های زیر ۵۰ تا داده بهتره برای نرمال بودن از آزمون شایپرو استفاده کنیم. الان مقاله ام در دست داوری هست. و الان در سایت شما دیدم برای زیر ۳۰ داده ksاستفاده می شه. یعنی من کارم اشتباه بود؟ چون داده هام ۱۰ تا بود.
آزمون شاپیرو-ویلک و آزمون کولموگروف-اسمیرنوف کاربرد و نتایج مشابهی دارند. محدودیت نمونه وجود ندارد فقط به یاد داشته باشید اگر دادهها به صورت طیف لیکرت است این دو آزمون مناسب نیستند.
سلام
ممنونم از سایت خوبتون
من داده هام ۲۵۰ نفر هستند. از آزمون کلموگراف استفاده کردم و داده هام نرمال نبودند برای همین از آزمون اسپیرمن برای همبستگی و از علامت تک نمونه برای فرض تحقیق و آزمون فریدمن برای اولویت بندی متغیرهام استفاده کردم. روند کارم درست بود؟
اگر دادهها را با پرسشنامه طیف لیکرت گردآوری کردهاید، آزمون KS مناسب نیست. محدودیت نمونه وجود ندارد اما برای بررسی نرمال بودن از روشهای دیگری مانند چولگی و کشیدگی استفاده کنید.
با عرض و خسته نباشید . در این آزمون که انجام دادم دوتا از متغیرها نرمال و دوتا غیر نرمال شدند. در این صورت باید از چ ازمونی استفاده کنم ؟ (ضمن اینکه حجم نمونه ۱۴۶ نفر هستند ). تشکر
برای انجام آزمونهای پارامتریک باید تمامی دادهها نرمال باشند. محاسبه چولگی و کشیدگی معیار بهتری برای بررسی نرمال بودن داده ها است.
با عرض سلام پایانامه من در مورد بررسی موانع و محدودیتهای مسوولیتپذیری زنان برای تصدی پستهای مدیریتی است الان موندم از چه آزمون هایی استفاده کنم
این پرسش در زمینه آزمون کولموگروف-اسمیرنوف نیست.
سلام وقت بخیر، متفاوت شدن نتایج سطح معنی در دو آزمون تی تست و کلموگروف اسمیرنف، طبیعی هست؟من نتایج با تی تست بالای ۰.۰۵ هست و با k-s کمتر از ۰.۰۵. ممنون میشم راهنماییم بفرمایید
این دو آزمون هیچ ارتباطی باهم ندارند. شما را به مطالعه بیشتر در زمینه کاربردهای آزمون های آماری دعوت میکنم.
من تازه دارم یاد میگیرم مطالعه هم میکنم. فقط یک راهنمایی کوچیک میخواستم. ولی نمیدونم برای پیدا کردن سطح معنی داری اول باید تی تست رو بزنم یا k-s؟
برای هر آزمونی در آمار استنباطی باید مقدار معناداری محاسبه شود. معناداری معمولا در سطح خطای ۵% (اطمینان ۹۵%) انجام میشود. نتایج معناداری آزمونها هم ربطی به هم ندارد. بهتر است هر آزمونی که باید استفاده کنید را جداگانه مطالعه کرده و به جای سوالات ترکیبی، سوالات خود پیرامون هر آزمون را زیر آموزش مرتبط با همان آزمون مطرح کنید.
سلام موضوع من بررسی رابطه ی بین رهبری توزیعی مدیران با کیفیت زندگی کاری معلمان است و فرضیه های من مولفه های رهبری توزیعی را میسنجد در ازمون کولموگروف اسمیرنوف من باید متغیر مستقل و وابسته را فقط وارد کنم؟ یا مولفه ها را هم باید وارد کنم وقتی رهبری توزیعی و کیفیت زندگی کاری را وارد می کنم داد بالای ۵ صدم است ولی مولفه ها سه صفر می شود. داده های من ۱۸۱ نفر است
پرسش تکراری است. لطفا دیدگاهها و پرسش و پاسخهای پیشین را مطالعه کنید. بارها بحث شده است.
با سلام
من برای بررسی نرمال بودن داده هام که ۵۴ مورد بوده است از آزمون کولموگروف اسمیرنوف استفاده کرده ام، مقدار معنی داری من ۰/۰۰۰ به دست آمده در حالیکه آماره z، ۰/۴۲۸ به دست آمده است. الان داور مقاله ناهمخوانی این دو مورد را بیان نموده اند. لطفا بنده را راهنمایی بفرمایید. ممنونم
طبیعی است که وقتی معنی داری کوچکتر از سطح خطا باشد آماره z بدون تردید بالای ۱/۹۶ بدست خواهد آمد. ایراد از مقادیر ارائه شده در جدول شما است و حق با داور است. در مقادیر شما تناقض وجود دارد.
چرا این اتفاق افتاده؟ از نظر آماری امکان ندارد چنین اتفاقی رخ دهد بنابراین یا اشتباه تایپی کردهاید یا اینکه خروجی واقعی نداشتید و عددسازی کرده اید که داور فهمیده
راه حل چیست؟ اگر ایراد سهوی بوده که به سادگی دوباره آزمون کنید و نتایج واقعی را گزارش کنید. اگر عددسازی کرده اید این بار دقت بیشتری به خرج دهید.
با سلام. برای بررسی نرمال بودن ازمون ks زدم سطح معنی دار ۰.۰۰۰ میاد ولی کشیدگی و چولگی بین -۲ و ۲ هست.تعداد داده ها هم بیشتر از ۳۰ تا هست. ایا برای ازمون از ازمون پارامتری استفاده کنم یا ناپارامتری؟
پژوهشگر گرانقدر به این پرسش هم در متن و هم در بیش از ده کامنت پیشین پاسخ داده شده است.
با سلام. در تفسیر ازمون کولموگروف اسمیرنوف مقدار sig همان سطح معناداری است؟ و اماره z چیست؟ ایا همان مقدار کشیدپی است؟ من این دو را متوجه نمیشم. در تفسیر ازمون. ممنون میشم راهنمایی بفرمایید.
کلمه sig مخفف significant است که در فارسی معناداری ترجمه میشود. آماره z هم آماره آزمون است و باید با مقدار بحرانی ۱/۹۶ مقایسه شود.
سلام متاسفانه من هم همین مشکل ناهمخوان بودن zوsigرادارم در حالیکه نمیتونم بفهمم مشکل از کجاست.
دقت کنید اگر sig از ۰/۰۵ کمتر باشد بدون تردید قدرمطلق z از ۱/۹۶ بیشتر خواهد بود. اگر sig از ۰/۰۵ بیشتر باشد بدون تردید z بین -۱/۹۶ تا ۱/۹۶ خواهد بود.
سلام،خیلی ممنونم از سایت خوبتون
حجم کل نمونه من ۹۰ تا هست در سه گروه ۳۰ تایی. برای انجام تست نرمال بودن داده ها باید کل نمونه رو در نظر بگیرم یا برای هر سه گروه رو به طور مجاز تست نرمال بودن انجام بدم؟ با سپاس فروان
اگر به صورت جداگانه آزمون کنید بهتر است در غیر اینصورت به طور حتم نتایج غیرنرمال خواهد بود.
سلام
اگر حجم نمونه بالا بود نمیتوان از تقریب نرمال استفاده کرد. این راهکار کاملا غلط است. وقتی توزیع داده ها بسیار چوله است که بخصوص در داده های علوم رفتاری زیاد دیده میشود حتی با حجم نمونه زیاد مجاز نیستیم از تقریب نرمال استفاده کنیم.
باید از روش های مبتنی بر میانه و چندکها در گزارش توصیفی و تحلیلی استفاده شود.
مانند آزمونهای من ویتنی و کروسکال والیس
رگرسیون میانه و یا رگرسیون چندک
با احترام
البته گفته شد آزمون KS نسبت به حجم نمونه حساس نیست و برای هر تعداد داده قابل استفاده است. اگرچه این آزمون برای دادههای طیف لیکرت با هر تعدادی که باشد مناسب نیست.
پاسخ شما هم درج شد تا پژوهشگران علاقهمند از این راهنمایی هم استفاده کنند.
بسیار عالی گفتین مریم خانم
زیاد بودن تعداد داده ها تغییری در توزیع انها بوجود نمی اورد. طبق قضیه حد مرکزی برای داده های بیشتر از ۳۰ توزیع میانگین داده ها نرمال خواهد بود نه خود داده ها.
سلام
برای ازمون نرمال بودن داده های دو گروه ازمایشی و گواه با سه متغیر وابسته، ایا باید برای محاسبه نرمال بودن داده ها، نمرات دو گروه گواه و ازمایش رو جداگانه وارد کرد؟ و هر بار فقط یکی از متغیرهای وابسته را وارد کرد؟ و سوال دیگر اینکه نمرات پیش و پس ازمون هر دو باید وارد شوند؟ به چه صورت؟ یعنی در یک ستون یا خیر؟ ممنون از راهنمایی تون
به نظر میرسد باید نرمال بودن تمامی دادهها بررسی شود.
سلام. من هفته دیگه دفاع دارم. جواب فوری لازم دارم. ممنون میشم بهم ایمیل بدین.
برای آزمون ks همون کولموگروف، باید پیش آزمون معنادار بشه یا پس آزمون؟
روش پژوهشم آزمایشیه و نمیدونم نتیجه ks رو برای پیش آزمون باید ملاک قرار بدم یا پس آزمون. لطفا جواب فوری . ممنون
روی هر دسته داده که بخواهید آزمونی انجام دهید باید نرمال بودن آن دادهها بررسی شود. فرقی ندارد هم که پیش آزمون باشد، پس آزمون باشد یا هر چیز دیگری.
سلام من به تازگی مباحث دو آزمون کولموگروف و شاپیروویلک رو میخونم و متوجه تفاوت شان نشدم ( از یه استاد آمار شنیدم که تفاوت هایی دارند)و اینکه تاثیر حجم نمونه بر روی آنها به چه صورت است؟ ممنون میشم راهنمایی بفرمایید
به طور مشخص این دو روش باهم تفاوت دارند ولی هدف هر دو روش بررسی نرمال بودن دادهها است. یک قاعده کلی در آمار پیرامون حجم نمونه وجود دارد: هرچه حجم نمونه بیشتر باشد دقت نتایج آزمونها بیشتر میشود. برای مطالعه بیشتر در مورد این دو آزمون به کتابهای آمار مراجعه کنید.
سلام حجم نمونه من ۴۴تاست وختی ازمون کولموگروف اسمیرنوف میگیرم کوچکتر از ۰.۰۵ در میاد باید چکار کنم؟
باید از روشهای ناپارامتریک استفاده کنید.
با سلام. حجم نمونه ام ۱۷۴تاست.از آزمون کولموگروف اسمیرنوف استفاده کردم. ۴ تا متغیرم زیر ۰.۰۵ و ۱ متغیر بالای ۰.۰۵ شد. (۵ تا متغیر غیر نرمل و ۱ متغیر نرمال). باید از PLS یا AMOS استفاده کنم؟
روشهای ناپارامتریک مانند حداقل مربعات جزئی
سلام، تفاوت amart pls با pls nv در چی هست، لطفا اگه میشه توضیح بدید
سلام حدول توزیع بحرانیksرو از کدوم لینک سرج کنم
سلام
ممنون از شما بابت علم بالا و وقتی که میگذارید. قابل ستایش هست. باز هم ممنونم
ارادتمندم
با سلام و عرض ادب
من سه دسته نمونه دارم دو دسته بیمار و یک دسته سالم. در هر دسته ۱۸ نمونه.. در صورتی که توزیع داده ها نرمال باشد باید از امار پارامتریم استفاده کنم؟ یا به دلیل کم بودن داده ها از امار
درود بر شما. در هر صورت باید نرمال بودن دادهها را بررسی کنید. فقط تاکید میشود این آزمون برای دادههای طیف لیکرت مناسب نیست.
سلام مهندس
سلام، هنگام استفاده از داده های پرسشنامه طیف لیکرت معمولا سوالات برای هر نمونه با هم جمع می شوند و نمره کلی هر متغیر بدست می آید در اینصورت با توجه به اینکه متغیر کمی فاصله ای است می توان از کولموگرو
سلام من ۲۷ تا داده دارم میخوام نشون بدم دارای توزیع توانی دو طرفه استاندارد هستند و آزمون ks در نرم افزار r رو میخوام انجام بدم
داده ها رو وارد کردم لطفا راهنمایی کنید
درود
استاد عزیز من طرح پیش ازمون پس آزمون و پیگیری با گروه کنترل دارم . با ت
برای جدا کردن گروها split انجام بدم تا نمره کنترل از آزمایش جدا شود
درود بر شما. بله، یک راهکار همین است.
سلام . ببخشید برای ازمون فرضیه ها به این صورت برای هر کدام از فرضیه ها چه دستوری باید نوشته شود؟
H0:x=y H0:x=y
H1:x>y یا H1: x<y