روایی پرسشنامه

روایی پرسشنامه یا قابلیت اعتبار ابزار اندازه گیری

روایی پرسشنامه (اعتبار یا Validity) و پایایی پرسشنامه (قابلیت اعتماد یا Reliability) از موضوعات بسیار مهم در امر جمع آوری اطلاعات و مشاهدات می‌باشد که متاسفانه گاهی مورد غفلت قرار می‌گیرد.. در اینجا به شرح این دو موضوع مهم می‌پردازیم:

روایی یا قابلیت اعتبار ابزار اندازه گیری

مفهوم اعتبار (روایی) به این سوال پاسخ می‌دهد که ابزار اندازه گیری تا چه حد خصیصه مورد نظر را می سنجد. بدون آگاهی از اعتبار ابزار اندازه گیری نمی‌توان به دقت داده های حاصل از آن اطمینان داشت. ابزار اندازه گیری ممکن است برای اندازه گیری یک خصیصه ویژه دارای اعتبار باشد، در حالی که برای سنجش همان خصیصه بر روی جامعه دیگر از هیچ گونه اعتباری برخوردار نباشد. برای مثال یک آزمون ریاضی ممکن است برای سنجش توانایی ریاضی دانش آموزان پایه پنجم ابتدایی از اعتبار لازم برخوردار باشد اما برای سنجش توانایی ریاضی دانش آموزان پایه سوم راهنمایی فاقد اعبتار باشد. روش های متعددی برای تعیین اعتبار ابزار اندازه گیری وجود دارد که در این جا به اختصار در مورد هر یک توضیح داده خواهد شد؛

روایی محتوا

اعتبار محتوا نوعی اعتبار است که معمولا برای بررسی اجزای تشکیل دهنده یک ابزار اندازه گیری به کار برده می‌شود. به عنوان مثال برای یک آزمون پیشرفت تحصیلی باید اعتبار محتوای آن را مورد نظر قرار داد. اعتبار محتوای یک ابزار اندازه گیری به سوال های تشکیل دهنده آن بستگی دارد. اگر سوال های ابزار معرف وپژگی ها و مهارت های ویژه ای باشد که محقق قصد اندازه گیری آن‌ها را داشته باشد، آزمون دارای اعتبار محتوا است. برای اطمینان از اعتبار محتوا، باید در موقع ساختن ابزار (مانند طراحی پرسشنامه) چنان عمل کرد که سوال های تشکیل دهنده ابزار معرف قسمت های محتوای انتخاب شده باشد. بنابراین اعتبار محتوا ویژگی ساختاری ابزار است که همزمان با تدوین آزمون در آن تنیده می‌شود. اعتبار محتوای یک آزمون معمولا توسط افرادی متخصص در موضوع مورد مطالعه تعیین می‌شود. از این رو اعتبار محتوا به قضاوت داوران بستگی دارد. برای این منظور می‌توان از شاخص روایی محتوایی CVR یا CVI استفاده کرد.

روایی ملاکی

اعتبار ملاکی عبارتست از کارآمدی یک ابزار اندازه گیری در پیش بینی رفتار یک فرد در موقعیت های خاص. برای این منظور عملکرد هر فرد در آزمون با یک ملاک مقایسه می‌شود. به عبارت دیگر اعتبار ملاکی یک ابزار اندازه گیری عبارتست از همبستگی بین نمرات آزمون و نمره ملاک. اعتبار ملاکی بر دو نوع است:

۱- اعتبار پیش بین، ۲- اعتبار همزمان

۱-اعتبار پیش بین: در اندازه گیری های روانی- تربیتی، اعتبار پیش بین عبارتست از بررسی رابطه نمره های آزمونی که برخی ویژگی ها را می سنجد و آن چه ادعای پیش بینی آن را دارد. اعتبار پیش بین می‌تواند به وسیله رابطه عملکرد در یک آزمون با آزمون ملاک رفتاری به دست آید. به عبارت دیگر ضریب همبستگی نمره های حاصل از اجرای آزمون با نمره های متغیر ملاک، نمایانگر اعتبار پیش بین است. برای مثال در یک تحقیق، ۸۸۲ مرد و زن به یک آزمون رغبت شغلی پاسخ گفته اند. آزمونی ها ۱۲ ساله بودند و در ۱۹ سالگی مجدد مورد بررسی قرار گرفتند. ۵۱ درصد به شغلی که در آزمون انتخاب کرده بودند اشتغال داشتند. این داده ها اعبتار پیش بین این ابزار را نشان می‌دهد.

۲- اعتبار همزمان: اعتبار همزمان در مواردی به کار می‌رود که داده های حاصله از دو اندازه گیری در یک زمان در دسترس باشد. در این گونه موارد عملکرد در یک آزمون به عملکرد در آزمون دیگر مرتبط می‌گردد. این فرایند اعتبار همزمان نامیده می‌شود. اعتبار همزمان در مواردی محاسبه می‌شود که هدف جانشین کردن یک ابزار اندازه گیری به جای ابزار دیگری باشد. این امر بیشتر به علت ملاحظات مربوط به سهولت اجرای آزمون یا جانشین کردن یک آزمون کوتاهتر به جای یک آزمون طویل تر است. در این مورد نیز ضریب همبستگی بین نمره های حاصل از اجرای آزمون با نمره های بدست آمده از اجرای آزمون دیگر یا اندازه های حاصل از اندازه گیری دیگری که همزمان به عمل آمده است به عنوان میزان اعتبار اندازه گیری به کار می‌رود.

روایی سازه

اعتبار سازه یک ابزار اندازه گیری نمایانگر آن است که ابزار اندازه گیری تا چه اندازه یک سازه یا خصیصه ای را که مبنای نظری دارد می سنجد. در بررسی اعتبار سازه باید به تدوین فرضیه هایی درباره مفاهیم اندازه گیری شده، آزمودن این فرضیه ها و محاسبه همبستگی نتایج با اندازه گیری اولیه پرداخت. اگر ضریب همبستگی حاصله بالا باشد اعتبار سازه افزایش می‌یابد ولی اگر همبستگی معنی دار نباشد علت را می‌توان به عوامل زیر نسبت داد:

– جمع آوری داده ها با اشکال همراه بوده است.

– پیش بینی و فرضیه ها غلط بوده است.

– ابزار، خصیصه مورد نظر را اندازه گیری نمی‌کند.

اگر چه فرایند برقراری اعتبار سازه امر بی انتهایی است ولی محقق یا سازنده آزمون می‌تواند اعتبار سازه یک آزمون را در موقعیت های خاص نشان دهد. از جمله شیوه هایی که برای تعیین اعتبار سازه به کار می‌رود موارد زیر است:

– تفاوت های گروهی: اگر نظریه ای تفاوتی را بین گروهها (یا هیچ تفاوتی را) در نمرات آزمون پیش بینی کند، آزمونی که این تفاوت را نشان دهد (یا ندهد) دارای اعتبار سازه است. برای مثال پیش بینی می‌شود که کودکان و بزرگسالان در بلوغ اجتماعی با هم تفاوت دارند. بنابراین اگر آزمونی که برای اندازه گیری خصیصه بلوغ اجتماعی ساخته شده باشد، تفاوت معنی داری را بین کودکان و بزرگسالان نشان دهد دارای اعتبار سازه است.

– تغییرات: چنانچه نظریه ای پیش بینی کند که خصیصه مورد اندازه گیری تحت تاثیر زمان یا مداخله آزمایشی قرار می گیرد، اگر نمرات آزمون این تاثیر را نشان دهد داراری اعتبار سازه است. برای مثال اگر آزمونی مهارت های کلامی را می سنجد باید با افزایش سن آزمودنی ها نمرات افزایش یابد، یا اگر مداخله اجتماعی برای پرورش این مهارت ها صورت گرفته باشد نمرات پیش آزمون و پس آزمون باید تغییرات معنی داری را نشان دهد.

روایی یا اعتبار عاملی

اعتبار عاملی صورتی از اعتبار سازه است که از طریق تحلیل عاملی تاییدی به دست می‌آید. یک عامل، یک متغیر فرضی (سازه) است که نمرات مشاهده شده را در یک یا چند متغیر تحت تاثیر قرار می‌دهد. هر گاه تحلیل عاملی روی یک ماتریس همبستگی صورت گیرد آزمون هایی که تحت تاثیر عوامل خاصی قرار گرفته دارای بار عاملی بالا در آن عامل است.

روایی همگرا

هرگاه یک یا چند خصیصه اندازه‌گیری شوند همبستگی بین این اندازه‌گیری‌ها دو شاخص مهم روایی را فراهم می‌سازد. اگر همبستگی بین بارهای عاملی بالا باشد، پرسشنامه دارای روایی همگرا می‌باشد. این همبستگی برای اطمینان از این که آزمون آنچه را که باید سنجیده شود می‌سنجد، ضروری است. برای روایی همگرا باید میانگین واریانس استخراج شده (AVE) و پایایی ترکیبی (CR) محاسبه می‌شود.

روایی واگرا

روایی واگرا به همبستگی پایین گویه‌های یک متغیر پنهان با سایر متغیرهای پنهان اشاره دارد. براساس روش پیشنهادی فورنل و لارکر (۱۹۸۱) روایی واگرا وقتی در سطح قابل قبول است که میزان AVE برای هر سازه بیشتر از واریانس اشتراکی بین آن سازه و سازه‌های دیگر (یعنی مربع مقدار ضرایب همبستگی بین سازه‌ها) در مدل باشد. بر این اساس روایی واگرای قابل قبول یک مدل اندازه‌گیری حاکی از ان است که یک سازه در مدل تعامل بیشتری با شاخص‌های خود دارد تا با سازه‌های دیگر.

هر گاه یک یا چند خصیصه از طریق دو یا چند روش اندازه گیری شوند همبستگی بین این اندازه گیری ها دو شاخص مهم اعتبار را فراهم می آورد. اگر همبستگی بین نمرات آزمون هایی که خصیصه واحدی را اندازه گیری می‌کند بالا باشد، آزمون ها دارای اعتبار همگرا می‌باشد. چنانچه همبستگی بین آزمون هایی که خصیصه های متفاوتی را اندازه گیری می‌کند پایین باشد، آزمون ها دارای اعبتار تشخیصی یا واگرا است.