نمودار چندک-چندک (Q-Q Plot)

نمودار چندک-چندک (Q-Q Plot) یک نمودار احتمال است که امکان مقایسه دو توزیع احتمال را به شیوه‌ای گرافیکی و ترسیمی فراهم می‌کند. این نمودار در کنار نمودار احتمال-احتمال یکی از روش‌های آزمون نرمال داده‌ها است. با استفاده از نرم‌افزار SPSS می‌توان به سادگی چنین نمودارهایی را ترسیم کرد که در این آموزش به آن پرداخته می‌شود.

پلات چیست و چه کاربردی در آمار دارد؟

پلات (Plot) در آمار و تحلیل داده‌ها به هر نوع نمودار یا نمایش بصری گفته می‌شود که برای نمایش الگوها، توزیع، روند و روابط میان داده‌ها به کار می‌رود. پژوهشگران از پلات‌ها استفاده می‌کنند تا رفتار داده‌ها را سریع، دقیق و قابل فهم مشاهده کنند؛ زیرا بسیاری از الگوها، خطاها و ناهمگنی‌ها در شکل نمودار بهتر از اعداد دیده می‌شود.

پلات‌ها ابزار اصلی در تشخیص الگوهای پنهان، بررسی فروض آماری، کشف نقاط پرت، تحلیل نرمال بودن داده‌ها، و ارزیابی برازش مدل‌ها هستند. به همین دلیل تقریباً در تمام شاخه‌های آمار، از تحلیل توصیفی تا مدل‌یابی پیشرفته، اهمیت بنیادی دارند.

  • پلات‌ها ابزار تشخیص و تحلیل بصری داده‌ها هستند.
  • پلات Q–Q برای آزمون نرمال بودن و تحلیل دنباله‌های توزیع بهترین گزینه است.
  • پلات P–P برای بررسی انحراف داده‌ها از مرکز توزیع مناسب‌تر است.

پلات‌های دیگری مثل Histogram، Box Plot، Scatter Plot، Residual Plot و Density Plot برای تحلیل توصیفی و تشخیص الگوهای پنهان بسیار کاربرد دارند.
اگر بخواهی، همین ساختار را به یک مقاله کامل، سئومحور و آماده انتشار در پارس‌مدیر تبدیل می‌کنم، همراه با لید، مثال تصویری و بخش “سخن پایانی”.

نمودار چندک-چندک (Q-Q Plot)

نمودار چندک-چندک (Q-Q Plot) به انگلیسی Quantile-Quantile برای مقایسه دو توزیع استفاده می‌شود. از چنین نمودارهایی می‌توان برای سازگاری توزیع داده‌ها با یک توزیع مشخص استفاده شود. بنابراین از نمودار چندک-چندک می‌توان برای بررسی نرمال بودن داده‌ها نیز استفاده کرد.

هدف این نمودار مقایسه چندک‌های داده‌های تجربی با چندک‌های یک توزیع نظری مانند توزیع نرمال است. از این نمودار برای:

  • بررسی نرمال بودن داده‌ها
  • ارزیابی سازگاری داده‌ها با یک توزیع مشخص
  • تشخیص رفتار داده‌ها در دنباله‌های توزیع (حساسیت بالا به دم‌ها)
  • شناسایی نقاط پرت یا انحراف‌های ساختاری

استفاده می‌شود. اگر نقاط روی خط ۴۵ درجه قرار گیرند، داده‌ها با توزیع نظری سازگار هستند.

شیوه رسم نمودار‌های P-P  و Q-Q در نرم‌افزار SPSS به شرح زیر است:

ترسیم نمودار چندک-چندک (Q-Q Plot) در SPSS

ترسیم نمودار چندک-چندک (Q-Q Plot) در SPSS

ابتدا فایل داده نرم‌افزار SPSS با فرمت sav را باز کنید.

از منوی Analyze گزینه Descriptive Statistics روی فرمان Q-Q Plots کلیک کنید.

در پنجره باز شده، متغیر مورد نظر را به قسمت  Variablesمنتقل کنید. از قسمت Test Distribution توزیع موردنظر را انتخاب کنید. برای نمونه اگر می‌خواهید نرمال بودن داده‌ها را بررسی کنید، مطابق شکل بالا گزینه Normal را انتخاب کنید. در نهایت دکمه OK  را کلیک کنید.  در خروجی اطلاعات زیادی نمایش داده می‌شود که یکی از آن‌ها نمودار احتمال-احتمال یاQ-Q plot  است.

نمودار احتمال-احتمال (P-P Plot)

نمودار احتمال-احتمال (P-P Plot) به انگلیسی Probability–Probability نیز کاربردی مشابه نمودار چندک-چندک دارد اما کاربرد آن کمتر است. اگر به جای چندک‌های توزیع داده‌ها، فراوانی نسبی تجمعی و تابع احتمال تجمعی ترسیم شود، نمودار حاصل را نمودار احتمال-احتمال گویند.

هدف این نمودار مقایسه تابع توزیع تجمعی تجربی (CDF) با تابع توزیع تجمعی نظری است. این پلات برای:

  • آزمون نرمال بودن
  • بررسی انحراف داده‌ها از مرکز توزیع
  • ارزیابی میزان برازش داده‌ها با توزیع نظری در بخش میانی

به کار می‌رود. این نمودار نسبت به تغییرات میانگین و واریانس حساس‌تر است، در حالی که Q–Q Plot نسبت به دنباله‌ها حساسیت بیشتری دارد.

در نمودار P-P تابع توزیع تراکمی داده‌های تجربی با تابع توزیع تراکمی نرمال مقایسه می‌شود. در نمودار Q-Q چندک‌های یک توزیع تجربی با چندک‌های یک توزیع نرمال مورد مقایسه قرار می‌گیرد. نمودار P-P حساسیت بیشتری نسبت به انحراف از میانگین توزیع دارد ولی نمودار Q-Q از حساسیت بیشتری نسبت به انحراف از حالت نرمال در دنباله‌های توزیع دارد. در هر دو نمودار خط راست بیانگر برازش کامل داده‌ها با توزیع نظری مورد بررسی است.

سخن پایانی

از نمودارهای چندک-چندک و احتمال-احتمال برای بررسی توزیع داده‌ها استفاده می‌شود. یکی از روش‌های بررسی نرمال بودن داده‌ها نیز ترسیم همین نمودارها است که در SPSS به سادگی قابل انجام است. براساس نمودارهای خروجی می‌توان به توزیع داده‌ها پی برد و در مورد استفاده از آزمون‌های پارامتریک یا ناپارامتریک تصمیم‌گیری نمود.

منبع: حبیبی، آرش؛ سرآبادانی، مونا. (۱۴۰۱). آموزش کاربردی SPSS. تهران: نارون‌دانش.