Το Τεστ Υπογεγραμμένης Κατάταξης Wilcoxon
Ιστορικό Πλαίσιο
Το τεστ υπογεγραμμένης κατάταξης Wilcoxon πήρε το όνομά του από τον Frank Wilcoxon (1892–1965). Εκτός από το συγκεκριμένο τεστ, ο ίδιος πρότεινε και το τεστ αθροίσματος για δύο ανεξάρτητα δείγματα το 1945. Αργότερα, ο Sidney Siegel (1956) ενίσχυσε τη διάδοση και την εφαρμογή του τεστ, μέσα από το βιβλίο του για τις μη παραμετρικές στατιστικές μεθόδους, το οποίο αποτέλεσε βασική πηγή αναφοράς για την ανάλυση δεδομένων στις κοινωνικές και συμπεριφορικές επιστήμες.
Θεωρητική Εισαγωγή
Το τεστ Wilcoxon είναι ένα μη παραμετρικό τεστ που χρησιμοποιείται όταν επιθυμούμε να συγκρίνουμε δύο σχετιζόμενα δείγματα, ταιριασμένα δείγματα ή μετρήσεις που έχουν ληφθεί επανειλημμένα στο ίδιο δείγμα. Σκοπός του είναι να εκτιμήσει εάν υπάρχει στατιστικά σημαντική διαφορά ανάμεσα στις μέσες τιμές ή στους διαμέσους των δύο καταστάσεων. Ο όρος «μη παραμετρικό» δεν σημαίνει άγνοια σχετικά με τον πληθυσμό, αλλά ότι δεν απαιτείται η παραδοχή πως τα δεδομένα ακολουθούν κανονική κατανομή. Για τον λόγο αυτό, το τεστ Wilcoxon χρησιμοποιείται συχνά ως εναλλακτική του t-test ζευγαριών (paired t-test) σε περιπτώσεις όπου η παραδοχή της κανονικότητας παραβιάζεται.
Χρήσεις του Τεστ
Το τεστ Wilcoxon εφαρμόζεται σε ποικίλα ερευνητικά πεδία, όταν ο ερευνητής θέλει να ελέγξει εάν υπάρχει διαφορά ανάμεσα σε δύο μετρήσεις στο ίδιο δείγμα, όπως για παράδειγμα σε μετρήσεις πριν και μετά από μια θεραπευτική παρέμβαση. Επιπλέον, μπορεί να χρησιμοποιηθεί για να ελεγχθεί αν δύο εξαρτώμενα δείγματα προέρχονται από πληθυσμούς με όμοιες κατανομές. Η εφαρμογή του είναι ιδιαίτερα χρήσιμη σε έρευνες ψυχολογίας, ιατρικής και κοινωνικών επιστημών, όπου τα δεδομένα συχνά δεν ακολουθούν την κανονική κατανομή.
Κατηγορίες
Υπάρχουν δύο κύριες κατηγορίες του τεστ Wilcoxon. Η πρώτη είναι το τεστ υπογεγραμμένης κατάταξης Wilcoxon, το οποίο συγκρίνει τις τιμές ενός δείγματος με έναν υποθετικό διάμεσο. Η δεύτερη είναι το τεστ υπογεγραμμένης κατάταξης για ζευγαρωτά δείγματα (Wilcoxon matched-pair signed-rank test), το οποίο υπολογίζει τις διαφορές μεταξύ των τιμών των ζευγαριών και στη συνέχεια τις κατατάσσει ώστε να συγκριθούν οι διάμεσοι.
Προϋποθέσεις του Τεστ
Για να είναι έγκυρα τα αποτελέσματα του τεστ Wilcoxon, πρέπει να πληρούνται ορισμένες βασικές παραδοχές. Η εξαρτημένη μεταβλητή θα πρέπει να είναι μετρημένη τουλάχιστον σε διατεταγμένη (ordinal) ή συνεχόμενη (interval ή ratio) κλίμακα. Οι δύο ομάδες που συγκρίνονται πρέπει να είναι σχετιζόμενες, δηλαδή τα ίδια άτομα να έχουν μετρηθεί δύο φορές ή να πρόκειται για ζευγαρωτά δείγματα. Τέλος, η κατανομή των διαφορών ανάμεσα στις δύο μετρήσεις πρέπει να είναι συμμετρική. Στην περίπτωση που αυτή η παραδοχή δεν πληρείται, μπορεί να εφαρμοστεί το sign test ως εναλλακτική μέθοδος.
Παράδειγμα Εφαρμογής
Χαρακτηριστικό παράδειγμα εφαρμογής του τεστ Wilcoxon είναι μια μελέτη που εξετάζει αν η βελονιστική θεραπεία μειώνει τον πόνο στη μέση. Ο ερευνητής στρατολογεί 25 άτομα και τους ζητά να αξιολογήσουν τον πόνο τους σε κλίμακα από το 1 έως το 10 πριν και μετά από τέσσερις εβδομάδες θεραπείας. Η ανάλυση έδειξε ότι έντεκα συμμετέχοντες παρουσίασαν χαμηλότερο σκορ πόνου μετά τη θεραπεία, τέσσερις είχαν υψηλότερο σκορ, ενώ δέκα δεν παρουσίασαν καμία αλλαγή. Το τεστ Wilcoxon έδωσε Z = -1.807 και p = 0.071, γεγονός που δείχνει ότι η μείωση του πόνου δεν ήταν στατιστικά σημαντική.
Διαδικασία στο SPSS
Η εφαρμογή του τεστ στο λογισμικό SPSS γίνεται μέσω της εντολής Analyze → Nonparametric Tests → Legacy Dialogs → 2 Related Samples. Στο παράθυρο που εμφανίζεται, εισάγονται οι δύο μεταβλητές που αντιπροσωπεύουν τις μετρήσεις και επιλέγεται το τεστ Wilcoxon. Το SPSS παράγει τρεις βασικούς πίνακες: τον πίνακα περιγραφικών στατιστικών, τον πίνακα με τις θετικές και αρνητικές διαφορές (Ranks) και τον πίνακα Test Statistics, όπου φαίνεται το p-value και η τιμή του στατιστικού Z. Μέσα από αυτούς τους πίνακες μπορεί να ερμηνευθεί η ύπαρξη ή μη στατιστικά σημαντικής διαφοράς ανάμεσα στις μετρήσεις.
Αναφορά Αποτελεσμάτων
Η παρουσίαση των αποτελεσμάτων σε μια έρευνα μπορεί να γίνει με τρόπο που συνδυάζει τις στατιστικές πληροφορίες και το ερευνητικό πλαίσιο. Στο παράδειγμα που αναφέρθηκε, η αναφορά μπορεί να διατυπωθεί ως εξής: «Ένα τεστ υπογεγραμμένης κατάταξης Wilcoxon έδειξε ότι η τετράβδομη θεραπεία βελονισμού δεν οδήγησε σε στατιστικά σημαντική μείωση του πόνου (Z = -1.807, p = 0.071). Η διάμεση τιμή πόνου ήταν 5.0 τόσο πριν όσο και μετά τη θεραπεία». Με αυτόν τον τρόπο, η ερμηνεία του αποτελέσματος είναι πλήρης και ενσωματώνει τόσο τα στατιστικά δεδομένα όσο και την ουσιαστική ερευνητική σημασία τους.