Βάσεις Δεδομένων [Data Bases]

 

Εισαγωγή

Βάσεις δεδομένων (Data Bases) είναι οργανωμένες συλλογές σχετιζόμενων δεδομένων τις οποίες μπορούμε να επεξεργαστούμε, οργανώσουμε και αποθηκεύσουμε ώστε να διεξάγουμε δεδομένα και πληροφορίες. 

Επεξεργασία των δεδομένων είναι η διαδικασία με την οποία τροποποιούμε, οργανώνουμε, διαμορφώνουμε τα δεδομένα ή ακόμη εφαρμόζουμε αριθμητικές ή λογικές πράξεις, προκειμένου να παράγουμε κάποια πληροφορία.

Παραδείγματα Χρήσης Βάσεων Δεδομένων (Examples of Using Databases)

Οι Βάσεις Δεδομένων εφαρμόζονται καθημερινά από πολίτες, οργανισμούς και επιχειρήσεις. Μερικά παραδείγματα αυτών είναι τα παρακάτω:

  • Κρατήσεις θέσεων σε αεροπορικές εταιρείες
  • Τραπεζικές συναλλαγές
  • Διαχείριση εταιρικών δεδομένων
  • Διαχείριση γεωγραφικών δεδομένων
  • Ανάκτηση πληροφορίας στο διαδίκτυο

Πλεονεκτήματα ενός συστήματος βάσης δεδομένων έναντι των παραδοσιακών μεθόδων (Advantages of a Database System)

  • Οικονομία χώρου. Κατάργηση των παραδοσιακών αρχείων με φακέλους και έγγραφα.
  • Ταχύτητα. Το σύστημα μπορεί να ανακαλεί και να αλλάζει τα δεδομένα πιο γρήγορα.
  • Άμεση πληροφόρηση. Οι πληροφορίες είναι διαθέσιμες και ενημερωμένες κάθε στιγμή.

Συλλογή Δεδομένων (Sampling)

Συλλογή (στατιστικών) δεδομένων χαρακτηρίζεται οποιαδήποτε έρευνα και καταγραφή πληροφοριών επί συγκεκριμένου κάθε φορά στατιστικού πληθυσμού. Είναι μία από τις εξαιρετικά σημαντικές ενέργειες  που οφείλει  να διεξάγει ο ερευνητής – στατιστικός όταν επιθυμεί να μελετήσει στατιστικά ένα φαινόμενο. Πριν ξεκινήσει η στατιστική έρευνα οφείλουν οι ερευνητές να ορίσουν με σαφήνεια το σύνολο που θα μελετήσουν δηλαδή τον στατιστικό πληθυσμό καθώς και τις στατιστικές μονάδες που θα απαρτίζουν τον πληθυσμό.

Μέθοδοι Δειγματοληψίας (Sampling methods)

Η δειγματοληψία αφορά τη λήψη ενός τμήματος από κάποιο ευρύτερο σύνολο. Διακρίνονται δύο είδη δειγματοληψίας, η δειγματοληψία με πιθανότητα και η δειγματοληψία χωρίς πιθανότητα. Στην πρώτη περίπτωση, η δειγματοληψία γίνεται σύμφωνα με τους νόμους των πιθανοτήτων, είναι ελεγχόμενη ως προς τις παραμέτρους της και τα αποτελέσματα είναι γενικεύσιμα. Η δειγματοληψία χωρίς πιθανότητα γίνεται σε περιπτώσεις που δεν είναι εφικτή η δειγματοληψία με πιθανότητα ή όταν θέλουμε να γίνει γρήγορα η εφαρμογή μιας έρευνας και τα αποτελέσματα δεν είναι γενικεύσιμα.

Λογικοί Έλεγχοι στα Δεδομένα (Testing Data)

Λογικός έλεγχος στα δεδομένα (Testing Data) είναι εκείνος που γίνεται με τη χρήση λογικών συναρτήσεων. Αυτές είναι συναρτήσεις με τις οποίες μπορούμε να αποφασίσουμε αν μια πρόταση είναι αληθής ή ψευδής. Συνήθως χρησιμοποιούμε τις τιμές 1 και 0 όπου το 1 συμβολίζει το αληθές (ναι) και το 0 το ψευδές (όχι). Ο λογικός έλεγχος εφαρμόζεται κυρίως σε ποιοτικές μεταβλητές (ποιοτικά δεδομένα).

Μετά τη καταχώρηση των δεδομένων στον υπολογιστή θα πρέπει να γίνεται έλεγχος για την ανίχνευση παράλογων – παράτυπων τιμών. Οι τιμές που εμφανίζονται ως ακραίες ή λανθάνουσες θα πρέπει να ελέγχονται σχολαστικά. Η χρήση κατάλληλου λογισμικού καταχώρησης δεδομένων το οποίο υποστηρίζει αυτόματους ελέγχους διευκολύνει τη κατάσταση αυτή.

Κωδικοποίηση Μεταβλητών (Variable Coding)

Για να εισάγουμε πιο εύκολα τα δεδομένα – μεταβλητές προβαίνουμε στην κωδικοποίηση τους σε κατηγορίες. Η οργάνωση των δεδομένων πρέπει να είναι τέτοια ώστε να απλοποιείται η διαδικασία εισαγωγής τους. Η κωδικοποίηση των μεταβλητών εφαρμόζεται στην εισαγωγή δεδομένων ποιοτικής μεταβλητής όπου κάθε τιμή της ποιοτικής μεταβλητής αντιστοιχεί σε ένα κωδικό. 

Συνήθως κάθε ερώτηση του ερωτηματολογίου αποτελεί μια μεταβλητή. Το όνομα της μεταβλητής θα πρέπει να αντιπροσωπεύει το χαρακτηριστικό που περιγράφει η μεταβλητή. Σε όλες τις πιθανές τιμές μιας μεταβλητής θα πρέπει να αντιστοιχηθούν κατάλληλοι κωδικοί. Οι κωδικοί αυτοί μπορεί να είναι αριθμοί (1, 0.3 κτλ.) ή χαρακτήρες (άνδρας, μπλε κτλ.). Συνήθως όλοι οι χρησιμοποιούμενοι κωδικοί μιας έρευνας καταγράφονται σε έναν πίνακα που ονομάζεται Πίνακας Κωδικοποίησης.

Στατιστική Προσαρμογή των Δεδομένων (Data Fitting)

Στη Στατιστική Προσαρμογή Δεδομένων κατασκευάζουμε νέες βοηθητικές μεταβλητές που είναι απαραίτητες για την περαιτέρω ανάλυση. Συνήθως οι μεταβλητές αυτές επαναπροσδιορίζουν ποιοτικές μεταβλητές. Οι πιθανές τιμές τέτοιων μεταβλητών είναι τις περισσότερες φορές 0 ή 1.

Βιβλιογραφία

Chamberlin, D. D., Astrahan, M. M., Eswaran, K. P., Griffiths, P. P., Lorie, R. A., Mehl, J. W., … & Wade, B. W. (1976). SEQUEL 2: A unified approach to data definition, manipulation, and control. IBM Journal of Research and Development, 20(6), 560-575.

Chen, P. P. S. (1976). The entity-relationship model—toward a unified view of data. ACM transactions on database systems (TODS), 1(1), 9-36.

Cumming, G., & Finch, S. U. E. (2001). A primer on the understanding, use, and calculation of confidence intervals that are based on central and noncentral distributions. Educational and psychological measurement, 61(4), 532-574.

Korth, H. F., & Silberschatz, A. (1991). Database System Concepts McGraw-Hill. Inc., New York,.