Ένα απλό διάγραμμα διασποράς χρησιμοποιώντας το SPSS

Εισαγωγή

Ένα απλό διάγραμμα διασποράς αποτελεί ένα από τα πιο χρήσιμα γραφήματα στην ανάλυση δεδομένων, καθώς επιτρέπει στον ερευνητή να διερευνήσει τη σχέση μεταξύ δύο συνεχών μεταβλητών. Με τη βοήθειά του μπορεί να εξεταστεί αν η σχέση ανάμεσα στις μεταβλητές είναι γραμμική, να εντοπιστούν τυχόν ακραίες τιμές (outliers) και να απεικονιστεί με οπτικό τρόπο η συσχέτιση των δεδομένων. Για παράδειγμα, εάν αναλύουμε δεδομένα που πρόκειται να χρησιμοποιηθούν για έλεγχο με τη συσχέτιση προϊόντος-στιγμής του Pearson, τη συσχέτιση τάξης του Spearman ή ακόμα και για παλινδρόμηση, η οπτική επιβεβαίωση της γραμμικότητας μέσω ενός διαγράμματος διασποράς είναι θεμελιώδης.

Σημασία του Διαγράμματος Διασποράς

Η χρησιμότητα ενός τέτοιου διαγράμματος δεν περιορίζεται μόνο στον έλεγχο γραμμικότητας. Στην πραγματικότητα, μέσω ενός απλού διαγράμματος διασποράς μπορούμε να έχουμε μια πρώτη εικόνα για τη φύση της σχέσης μεταξύ δύο μεταβλητών. Αυτό περιλαμβάνει το αν η σχέση είναι θετική ή αρνητική, αν ακολουθεί μια καμπύλη ή είναι εντελώς τυχαία. Επιπλέον, τα διαγράμματα αυτά είναι πολύτιμα για τον εντοπισμό ακραίων τιμών που μπορούν να επηρεάσουν σημαντικά τα αποτελέσματα μιας στατιστικής ανάλυσης. Για παράδειγμα, ένα πολύ υψηλό ή πολύ χαμηλό σκορ σε μία μεταβλητή μπορεί να αλλοιώσει τον συντελεστή συσχέτισης, γι’ αυτό και η έγκαιρη αναγνώρισή του είναι καθοριστική.

Παράδειγμα Χρήσης

Ένα χαρακτηριστικό παράδειγμα θα μπορούσε να αφορά την ανάλυση της σχέσης μεταξύ του μισθού των δικηγόρων και των ετών επαγγελματικής εμπειρίας τους. Σε αυτήν την περίπτωση, η εξαρτημένη μεταβλητή είναι ο μισθός, ενώ η ανεξάρτητη είναι τα χρόνια άσκησης της νομικής. Μέσω ενός απλού διαγράμματος διασποράς, μπορούμε να παρατηρήσουμε εάν υπάρχει θετική γραμμική σχέση – δηλαδή αν οι μισθοί αυξάνονται όσο αυξάνονται τα χρόνια εμπειρίας. Ένα άλλο παράδειγμα αφορά τη σχέση μεταξύ της απόστασης που μπορούν οι γυναίκες να τρέξουν σε διάστημα 30 λεπτών και του VO2max, που αποτελεί μέτρο φυσικής κατάστασης. Σε αυτήν την περίπτωση, η εξαρτημένη μεταβλητή είναι η απόσταση τρεξίματος, ενώ η ανεξάρτητη το VO2max. Το διάγραμμα θα μας δείξει εάν οι γυναίκες με υψηλότερο VO2max μπορούν όντως να διανύσουν μεγαλύτερες αποστάσεις.

Δημιουργία Διαγράμματος Διασποράς στο SPSS

Για να δημιουργήσουμε ένα απλό διάγραμμα διασποράς στο SPSS, χρησιμοποιούμε το εργαλείο Chart Builder. Η διαδικασία αυτή επιτρέπει στον χρήστη να τοποθετήσει την εξαρτημένη μεταβλητή στον κάθετο άξονα (Y) και την ανεξάρτητη στον οριζόντιο άξονα (X). Από εκεί και πέρα, το SPSS δημιουργεί το διάγραμμα, το οποίο μπορούμε να προσαρμόσουμε προσθέτοντας τίτλους, ετικέτες και γραμμές παλινδρόμησης. Είναι σημαντικό να σημειωθεί ότι από την έκδοση 25 και μετά του SPSS, ορισμένα στοιχεία του Chart Builder έχουν αλλάξει, γι’ αυτό η διαδικασία διαφοροποιείται ελαφρώς σε σχέση με τις προηγούμενες εκδόσεις.

SPSS Έκδοση 25 και Μετά

Στις νεότερες εκδόσεις του SPSS, συμπεριλαμβανομένης και της συνδρομητικής έκδοσης, η δημιουργία διαγράμματος διασποράς είναι ιδιαίτερα φιλική προς τον χρήστη. Επιλέγουμε το Graphs > Chart Builder, έπειτα διαλέγουμε το Scatter/Dot και τοποθετούμε τις μεταβλητές στους αντίστοιχους άξονες. Το πρόγραμμα εμφανίζει μια προεπισκόπηση, ώστε να γνωρίζουμε ακριβώς το αποτέλεσμα πριν την τελική δημιουργία.

SPSS Έκδοση 24 και Πριν

Στις παλαιότερες εκδόσεις, η διαδικασία είναι παρόμοια αλλά με λιγότερες δυνατότητες προεπισκόπησης και εξατομίκευσης. Παρ’ όλα αυτά, το αποτέλεσμα είναι το ίδιο: ένα διάγραμμα που μας δείχνει ξεκάθαρα την πιθανή σχέση των δύο μεταβλητών.

Συμπεράσματα

Το απλό διάγραμμα διασποράς αποτελεί βασικό εργαλείο στη στατιστική ανάλυση. Χρησιμοποιείται για να διερευνήσει τη γραμμικότητα, να εντοπίσει ακραίες τιμές και να παρέχει μια άμεση οπτική αναπαράσταση της σχέσης δύο συνεχών μεταβλητών. Στο SPSS, η διαδικασία δημιουργίας του είναι εύκολη και μπορεί να προσαρμοστεί ανάλογα με την έκδοση του προγράμματος που χρησιμοποιεί ο ερευνητής. Είτε πρόκειται για ανάλυση μισθών και εμπειρίας είτε για δεδομένα φυσικής κατάστασης, το διάγραμμα διασποράς είναι η πρώτη γραφική απεικόνιση που θα μας βοηθήσει να κατανοήσουμε καλύτερα τα δεδομένα και να προχωρήσουμε με περισσότερη ακρίβεια σε πιο προχωρημένες στατιστικές δοκιμές.