Εργαλείο Ανίχνευσης Συλλαβικής και Λεξικής Συχνότητας για την Ελληνική Γλώσσα [SyLex-GR]

Σύντομη Περιγραφή

Το εργαλείο Ανίχνευσης Συλλαβικής και Λεξικής Συχνότητας για την Ελληνική Γλώσσα αναπτύχθηκε με βάση σώμα δύο εκατομμυρίων λέξεων προερχόμενο από ελληνικά κείμενα. Μέσω ειδικού αλγόριθμου, καταγράφονται η συλλαβική ανάλυση και η θέση της λέξης στο λεξιλόγιο με βάση τη συχνότητα εμφάνισης. Παράλληλα, επιτρέπει την εύρεση λέξεων με κοινή αρχή, μέση ή τελική συλλαβή, γεγονός που καθιστά το εργαλείο πολύτιμο για γλωσσολογικές, ψυχογλωσσολογικές και διδακτικές εφαρμογές.

Σκοπός

Σκοπός του εργαλείου είναι η διευκόλυνση της γλωσσολογικής, ψυχογλωσσολογικής, νευρογλωσσολογικής και διδακτικής έρευνας, με στόχο την παροχή αξιόπιστων στοιχείων λεξικής και συλλαβικής συχνότητας που θα χρησιμοποιηθούν τόσο για την πειραματική μελέτη της ελληνικής γλώσσας όσο και για την ανάπτυξη εκπαιδευτικών λογισμικών.

Τρόπος Βαθμολόγησης

Το εργαλείο δεν περιλαμβάνει άμεση βαθμολόγηση με την παραδοσιακή έννοια του όρου, αλλά υπολογίζει και παρουσιάζει δείκτες συχνότητας, συλλαβικής θέσης και κατανομής των λέξεων βάσει των δεδομένων του κειμενικού σώματος, επιτρέποντας την εξαγωγή ποσοτικών στοιχείων προς ανάλυση.

Εγκυρότητα

Η εγκυρότητα του εργαλείου στηρίζεται στη μεγάλη έκταση και την αντιπροσωπευτικότητα του κειμενικού σώματος που χρησιμοποιήθηκε (δύο εκατομμύρια λέξεις), καθώς και στην αυτόματη και ακριβή επεξεργασία των λέξεων με τον αλγόριθμο συλλαβικής ανάλυσης. Η κατασκευή βασίστηκε σε αντίστοιχες επιστημονικές μεθοδολογίες όπως αυτές του εργαλείου BuscaPalabras.

Αξιοπιστία

Δεν αναφέρεται συγκεκριμένος δείκτης αξιοπιστίας (π.χ. Cronbach’s α), καθώς πρόκειται για υπολογιστικό εργαλείο λεξικοστατιστικής ανάλυσης και όχι ερωτηματολόγιο με υποκειμενικές κρίσεις. Ωστόσο, η αξιοπιστία του εξασφαλίζεται μέσω της συστηματικής και αυτοματοποιημένης μεθόδου αναγνώρισης και καταγραφής συχνοτήτων.

Ανάλυση και Χρήση Δεδομένων

Το εργαλείο παρέχει στους χρήστες τη δυνατότητα να αντλούν λέξεις από το σώμα δεδομένων βάσει προκαθορισμένων κριτηρίων (συλλαβική θέση, συχνότητα εμφάνισης, αρχική/τελική συλλαβή). Έτσι, μπορεί να χρησιμοποιηθεί για την επιλογή λέξεων σε πειραματικά πρωτόκολλα ή την κατασκευή λιστών λέξεων για εκπαιδευτικά προγράμματα. Τα δεδομένα είναι κατάλληλα για χρήση σε στατιστική επεξεργασία, γλωσσικά πειράματα και ανάπτυξη διδακτικών λογισμικών.

Βιβλιογραφία

Davis, C. J., & Perea, M. (2005). BuscaPalabras: A program for deriving orthographic and phonological neighborhood statistics and other psycholinguistic indices in Spanish. Behavior Research Methods, 37, 665–671.