Περιγραφική Στατιστική Ανάλυση με SPSS

Εισαγωγή

Η περιγραφική στατιστική αποτελεί βασικό πυλώνα της επιστημονικής ανάλυσης δεδομένων, αφού προσφέρει τα εργαλεία που χρειάζονται για την κατανόηση και παρουσίαση των βασικών χαρακτηριστικών ενός δείγματος ή ενός πληθυσμού. Μέσω αυτής, μεγάλοι όγκοι δεδομένων μπορούν να συνοψιστούν σε απλές και κατανοητές μορφές, όπως μέτρα κεντρικής τάσης και διασποράς, πίνακες συχνοτήτων και γραφικές απεικονίσεις. Στο παράδειγμα που εξετάζεται, χρησιμοποιήθηκε το αρχείο «patient_los.sav» του λογισμικού SPSS, το οποίο περιλαμβάνει στοιχεία ασθενών που νοσηλεύτηκαν με πιθανό έμφραγμα του μυοκαρδίου. Κάθε γραμμή δεδομένων αντιστοιχεί σε έναν ασθενή και περιέχει πληροφορίες σχετικές με την ηλικία, το φύλο, το κάπνισμα, την πίεση αίματος, το κόστος νοσηλείας και άλλα χαρακτηριστικά. Μέσω της ανάλυσης αυτών των δεδομένων καθίσταται δυνατή η εξαγωγή χρήσιμων συμπερασμάτων για το δείγμα των ασθενών.

Ανάλυση Συνεχών Ποσοτικών Μεταβλητών

Στην πρώτη φάση της ανάλυσης εξετάστηκαν οι συνεχείς ποσοτικές μεταβλητές, οι οποίες είναι η ηλικία και το κόστος νοσηλείας. Για τις μεταβλητές αυτές υπολογίστηκαν διάφορα περιγραφικά μέτρα όπως ο μέσος όρος, η διάμεσος, η τυπική απόκλιση, το εύρος τιμών και οι ακραίες τιμές. Τα αποτελέσματα παρουσιάστηκαν τόσο με τη μορφή αριθμητικών πινάκων όσο και με τη μορφή ιστογραμμάτων. Στα ιστογράμματα προστέθηκε καμπύλη κανονικής κατανομής, γεγονός που διευκολύνει τον έλεγχο της κατανομής των δεδομένων και την ανίχνευση αποκλίσεων. Για παράδειγμα, αν η ηλικία των ασθενών ακολουθεί κανονική κατανομή, η καμπύλη θα εμφανίζεται συμμετρική γύρω από τον μέσο όρο, ενώ τυχόν σημαντικές αποκλίσεις θα υποδηλώνουν ανομοιογένεια ή την παρουσία ακραίων τιμών. Με τον ίδιο τρόπο, η ανάλυση του κόστους νοσηλείας μπορεί να αποκαλύψει αν υπάρχουν μεγάλες διαφοροποιήσεις που συνδέονται με παράγοντες όπως η διάρκεια παραμονής ή η σοβαρότητα της ασθένειας.

Ανάλυση Ποιοτικών Μεταβλητών

Στη συνέχεια, εξετάστηκαν οι ποιοτικές μεταβλητές όπως η κατηγορία ηλικίας, το φύλο, η αρτηριακή πίεση και η συνήθεια καπνίσματος. Για τις μεταβλητές αυτές δημιουργήθηκαν πίνακες συχνοτήτων, οι οποίοι αποτυπώνουν την κατανομή των ασθενών στις διάφορες κατηγορίες. Έτσι μπορεί εύκολα να διαπιστωθεί, για παράδειγμα, πόσοι ασθενείς είναι άνδρες και πόσες γυναίκες, σε ποιες ηλικιακές κατηγορίες κατανέμεται το δείγμα, ποιο ποσοστό εμφανίζει υψηλή αρτηριακή πίεση και ποιο ποσοστό δηλώνει καπνιστής. Η ανάλυση ενισχύθηκε με τη δημιουργία ραβδογραμμάτων που καθιστούν την ερμηνεία πιο προσιτή, αφού οι οπτικές αναπαραστάσεις διευκολύνουν την κατανόηση της κατανομής και την επισήμανση σημαντικών διαφορών ανάμεσα στις ομάδες.

Πίνακες Διπλής Εισόδου

Για την κατανόηση της σχέσης μεταξύ δύο ποιοτικών μεταβλητών δημιουργήθηκαν πίνακες διπλής εισόδου, γνωστοί και ως πίνακες crosstabs. Χαρακτηριστικό παράδειγμα αποτέλεσε η ανάλυση της σχέσης ανάμεσα στην ηλικιακή κατηγορία και το φύλο. Με αυτόν τον τρόπο φάνηκε η κατανομή ανδρών και γυναικών σε κάθε ηλικιακή ομάδα, γεγονός που επιτρέπει την ανίχνευση πιθανών διαφορών ανάμεσα στα φύλα ανάλογα με την ηλικία. Οι πίνακες αυτοί συνοδεύτηκαν από ομαδοποιημένα ραβδογράμματα, τα οποία προσφέρουν μια πιο άμεση και κατανοητή απεικόνιση της σχέσης, αναδεικνύοντας αν οι άνδρες ή οι γυναίκες εμφανίζουν υψηλότερη συχνότητα σε συγκεκριμένες ηλικιακές κατηγορίες.

Γραφήματα και Οπτικοποίηση Δεδομένων

Η οπτικοποίηση των δεδομένων αποτελεί σημαντικό κομμάτι της περιγραφικής ανάλυσης, καθώς ενισχύει την κατανόηση των αριθμητικών αποτελεσμάτων. Στο πλαίσιο της συγκεκριμένης εργασίας δημιουργήθηκαν διαγράμματα πλαισίου-απολήξεων για τη μεταβλητή ηλικία σε σχέση με το φύλο. Τα διαγράμματα αυτά επιτρέπουν τον εντοπισμό της διάμεσης τιμής, του εύρους, καθώς και των ακραίων τιμών. Με τον τρόπο αυτό αναδεικνύονται διαφορές ανάμεσα στις ομάδες και προσφέρεται μια πιο ολοκληρωμένη εικόνα της κατανομής. Επιπλέον, δημιουργήθηκαν διαγράμματα σφαλμάτων για την ίδια μεταβλητή, τα οποία απεικονίζουν τον μέσο όρο της ηλικίας ανά φύλο μαζί με τα όρια σφάλματος. Αυτές οι απεικονίσεις συμβάλλουν στη σαφέστερη κατανόηση της μεταβλητότητας των δεδομένων και επιτρέπουν την ασφαλέστερη σύγκριση ανάμεσα στις ομάδες.

Συμπεράσματα

Η ανάλυση των δεδομένων με τη χρήση της περιγραφικής στατιστικής αναδεικνύει τη χρησιμότητα αυτής της μεθοδολογίας στην ερευνητική διαδικασία. Μέσα από την περιγραφή και την οπτικοποίηση, οι ερευνητές μπορούν να αποκτήσουν μια σαφή εικόνα για το δείγμα που μελετούν. Στην περίπτωση των ασθενών με πιθανό έμφραγμα του μυοκαρδίου, η ανάλυση της ηλικίας, του φύλου, των συνηθειών και του κόστους νοσηλείας προσφέρει πολύτιμες πληροφορίες που μπορούν να χρησιμοποιηθούν τόσο για την κατανόηση των χαρακτηριστικών του πληθυσμού όσο και για τον σχεδιασμό περαιτέρω μελετών. Τα αποτελέσματα της περιγραφικής στατιστικής μπορούν να λειτουργήσουν ως εφαλτήριο για πιο σύνθετες στατιστικές τεχνικές, όπως η επαγωγική στατιστική, οι έλεγχοι υποθέσεων ή τα μοντέλα παλινδρόμησης. Τελικά, η περιγραφική ανάλυση δεν περιορίζεται μόνο στην παρουσίαση αριθμών αλλά αποτελεί αναγκαίο βήμα για την ερμηνεία των δεδομένων, την εξαγωγή συμπερασμάτων και τη λήψη τεκμηριωμένων αποφάσεων στην πράξη.