نمودار چندک-چندک (Q-Q Plot) یک نمودار احتمال است که امکان مقایسه دو توزیع احتمال را به شیوهای گرافیکی و ترسیمی فراهم میکند. این نمودار در کنار نمودار احتمال-احتمال یکی از روشهای آزمون نرمال دادهها است. با استفاده از نرمافزار SPSS میتوان به سادگی چنین نمودارهایی را ترسیم کرد که در این آموزش به آن پرداخته میشود.
پلات چیست و چه کاربردی در آمار دارد؟
پلات (Plot) در آمار و تحلیل دادهها به هر نوع نمودار یا نمایش بصری گفته میشود که برای نمایش الگوها، توزیع، روند و روابط میان دادهها به کار میرود. پژوهشگران از پلاتها استفاده میکنند تا رفتار دادهها را سریع، دقیق و قابل فهم مشاهده کنند؛ زیرا بسیاری از الگوها، خطاها و ناهمگنیها در شکل نمودار بهتر از اعداد دیده میشود.
پلاتها ابزار اصلی در تشخیص الگوهای پنهان، بررسی فروض آماری، کشف نقاط پرت، تحلیل نرمال بودن دادهها، و ارزیابی برازش مدلها هستند. به همین دلیل تقریباً در تمام شاخههای آمار، از تحلیل توصیفی تا مدلیابی پیشرفته، اهمیت بنیادی دارند.
- پلاتها ابزار تشخیص و تحلیل بصری دادهها هستند.
- پلات Q–Q برای آزمون نرمال بودن و تحلیل دنبالههای توزیع بهترین گزینه است.
- پلات P–P برای بررسی انحراف دادهها از مرکز توزیع مناسبتر است.
پلاتهای دیگری مثل Histogram، Box Plot، Scatter Plot، Residual Plot و Density Plot برای تحلیل توصیفی و تشخیص الگوهای پنهان بسیار کاربرد دارند.
اگر بخواهی، همین ساختار را به یک مقاله کامل، سئومحور و آماده انتشار در پارسمدیر تبدیل میکنم، همراه با لید، مثال تصویری و بخش “سخن پایانی”.
نمودار چندک-چندک (Q-Q Plot)
نمودار چندک-چندک (Q-Q Plot) به انگلیسی Quantile-Quantile برای مقایسه دو توزیع استفاده میشود. از چنین نمودارهایی میتوان برای سازگاری توزیع دادهها با یک توزیع مشخص استفاده شود. بنابراین از نمودار چندک-چندک میتوان برای بررسی نرمال بودن دادهها نیز استفاده کرد.
هدف این نمودار مقایسه چندکهای دادههای تجربی با چندکهای یک توزیع نظری مانند توزیع نرمال است. از این نمودار برای:
- بررسی نرمال بودن دادهها
- ارزیابی سازگاری دادهها با یک توزیع مشخص
- تشخیص رفتار دادهها در دنبالههای توزیع (حساسیت بالا به دمها)
- شناسایی نقاط پرت یا انحرافهای ساختاری
استفاده میشود. اگر نقاط روی خط ۴۵ درجه قرار گیرند، دادهها با توزیع نظری سازگار هستند.
شیوه رسم نمودارهای P-P و Q-Q در نرمافزار SPSS به شرح زیر است:
ابتدا فایل داده نرمافزار SPSS با فرمت sav را باز کنید.
از منوی Analyze گزینه Descriptive Statistics روی فرمان Q-Q Plots کلیک کنید.
در پنجره باز شده، متغیر مورد نظر را به قسمت Variablesمنتقل کنید. از قسمت Test Distribution توزیع موردنظر را انتخاب کنید. برای نمونه اگر میخواهید نرمال بودن دادهها را بررسی کنید، مطابق شکل بالا گزینه Normal را انتخاب کنید. در نهایت دکمه OK را کلیک کنید. در خروجی اطلاعات زیادی نمایش داده میشود که یکی از آنها نمودار احتمال-احتمال یاQ-Q plot است.
نمودار احتمال-احتمال (P-P Plot)
نمودار احتمال-احتمال (P-P Plot) به انگلیسی Probability–Probability نیز کاربردی مشابه نمودار چندک-چندک دارد اما کاربرد آن کمتر است. اگر به جای چندکهای توزیع دادهها، فراوانی نسبی تجمعی و تابع احتمال تجمعی ترسیم شود، نمودار حاصل را نمودار احتمال-احتمال گویند.
هدف این نمودار مقایسه تابع توزیع تجمعی تجربی (CDF) با تابع توزیع تجمعی نظری است. این پلات برای:
- آزمون نرمال بودن
- بررسی انحراف دادهها از مرکز توزیع
- ارزیابی میزان برازش دادهها با توزیع نظری در بخش میانی
به کار میرود. این نمودار نسبت به تغییرات میانگین و واریانس حساستر است، در حالی که Q–Q Plot نسبت به دنبالهها حساسیت بیشتری دارد.
در نمودار P-P تابع توزیع تراکمی دادههای تجربی با تابع توزیع تراکمی نرمال مقایسه میشود. در نمودار Q-Q چندکهای یک توزیع تجربی با چندکهای یک توزیع نرمال مورد مقایسه قرار میگیرد. نمودار P-P حساسیت بیشتری نسبت به انحراف از میانگین توزیع دارد ولی نمودار Q-Q از حساسیت بیشتری نسبت به انحراف از حالت نرمال در دنبالههای توزیع دارد. در هر دو نمودار خط راست بیانگر برازش کامل دادهها با توزیع نظری مورد بررسی است.
سخن پایانی
از نمودارهای چندک-چندک و احتمال-احتمال برای بررسی توزیع دادهها استفاده میشود. یکی از روشهای بررسی نرمال بودن دادهها نیز ترسیم همین نمودارها است که در SPSS به سادگی قابل انجام است. براساس نمودارهای خروجی میتوان به توزیع دادهها پی برد و در مورد استفاده از آزمونهای پارامتریک یا ناپارامتریک تصمیمگیری نمود.
منبع: حبیبی، آرش؛ سرآبادانی، مونا. (۱۴۰۱). آموزش کاربردی SPSS. تهران: ناروندانش.
