Act Business Center

Act Business Center

Κυριακή 2 Νοεμβρίου 2014

Γράψε… λάθος! Ο μύθος των 6 εκατομμυρίων λέξεων

Γράφει ο Σπύρος Καρτσώνης 
Ας θυμηθούμε κατ’ αρχάς τι γράφει το κείμενο του Hellenic Quest: «Στον Η/Υ ‘‘Ίβυκο’’ αποθησαυρίσθηκαν 6 εκατομμύρια λέξεις και 78 εκατομμύρια λεκτικοί τύποι της γλώσσας μας -όταν η Αγγλική έχει συνολικώς 490.000 λέξεις και 300.000 τεχνικούς όρους, δηλ. ως γλώσσα είναι μόλις το 1/100 της δικής μας.»
Πριν προχωρήσουμε πρέπει να ξεκαθαρίσουμε τι εννοούμε όταν λέμε ‘‘λέξεις’’  και τι όταν λέμε ‘‘λεκτικούς τύπους’’.

Στην περίπτωσή μας λέξεις είναι τα λήμματα και όχι οι εμφανίσεις. Έτσι, όσες εμφανίσεις της λέξης ‘‘και’’ κι αν περιέχει αυτό το κείμενο εμείς θα μετρήσουμε μόνο μία: μία λέξη. Αν η λέξη-λήμμα κλίνεται πάλι θα μετρήσουμε μία λέξη: δηλαδή δε θα μετρήσουμε τους τέσσερις τύπους της λέξης-λήμματος ‘‘γλώσσα’’ (γλώσσα, γλώσσας, γλώσσες, γλωσσών) ως τέσσερις λέξεις. Με άλλα λόγια όταν μετράμε το μέγεθος λεξιλογίων μετράμε τα λήμματα και όχι τους τύπους.

Πάμε τώρα στους λεκτικούς τύπους. Σε κάθε λέξη-λήμμα αντιστοιχούν ένας ή, το πιθανότερο, πολλοί λεκτικοί τύποι. Ας πάρουμε για παράδειγμα τη λέξη-λήμμα ‘‘άνθρωπος’’. Στη συγκεκριμένη λέξη αντιστοιχούν στην (αρχαία) γλώσσα πάνω από δέκα λεκτικοί τύποι: οι πτώσεις του ενικού και του πληθυντικού (δεν υπολογίζουμε όσες ταυτίζονται), ο δυϊκός αριθμός και οι εναλλακτικοί τύποι της δοτικής. Αν η λέξη-λήμμα είναι ρήμα, τότε οι λεκτικοί τύποι είναι πάνω από εκατό αν υπολογίσουμε τους χρόνους, τις εγκλίσεις, τους πολλαπλασιάσουμε επί έξι (τόσα είναι τα πρόσωπα) και τους διπλασιάσουμε, αν υπάρχει και μέση φωνή. Αν η λέξη-λήμμα είναι άκλιτη θα έχει μόνο έναν λεκτικό τύπο.

Αφού ξεκαθαρίσαμε τι εννοούμε όταν λέμε ‘‘λέξη’’  και τι όταν λέμε ‘‘λεκτικό τύπο’’ ας ξαναγυρίσουμε στο κείμενο του Hellenic Quest που αναφέρει ότι «αποθησαυρίσθηκαν 6 εκατομμύρια λέξεις και 78 εκατομμύρια λεκτικοί τύποι της γλώσσας μας». Ήδη έχουμε επισημάνει ότι πρόκειται για μύθο. Ξεκίνησε περίπου το 1997, διαδόθηκε μέσω βιβλίων, άρθρων σε περιοδικά και λοιπά έντυπα, ιστοσελίδων, ακόμη και διαλέξεων, με μικρές διαφοροποιήσεις όσον αφορά τους αριθμούς, και έφτασε ως τις μέρες μας, με αποτέλεσμα να κοντεύει να καθιερωθεί ως αληθινός (αν βρει και διαβάσει κανείς τις σελίδες όλων των ανωτέρω θα δει και πράγματα φοβερά: Θα δει, για παράδειγμα, ότι η πλούσια ελληνική γλώσσα αποκλείεται να κατάγεται από την φτωχή ινδοευρωπαϊκή ή ότι χρησιμοποιείται εδώ και 28.000 χρόνια ή ακόμη και ότι για τον μεγάλο αριθμό λέξεων και λεκτικών τύπων καταγράφτηκε στο βιβλίο Γκίνες!).

Όπως οι περισσότεροι μύθοι έτσι και αυτός έχει μέσα τους έναν κόκκο αλήθειας. Το πανεπιστήμιο Ιρβάιν (Irvine) της Καλιφόρνιας έχει αποθησαυρίσει όλα σχεδόν τα κείμενα της αρχαίας ελληνικής γλώσσας και αρκετά μέχρι την Άλωση και τα διαθέτει στον ψηφιακό δίσκο TLG (Thesaurus Linguae Graecae). Όλα αυτά τα κείμενα στην έκδοση του 2000 είχαν συνολικό αριθμό λέξεων 78 εκατομμύρια (το λήμμα ‘‘άνθρωπος’’, υπό τους διαφόρους λεκτικούς τύπους του [12 συνολικά] συναντάται 135.000 φορές περίπου. Δηλαδή 1 λέξη-λήμμα, 12 λεκτικοί τύποι, 135.000 εμφανίσεις). Κάπως έτσι προέκυψαν τα 6 εκατομμύρια λέξεις: Υπολογίζοντας κατά μέσο όρο σε κάθε λέξη-λήμμα 12 με 14 λεκτικούς τύπους.

Είναι φανερό λοιπόν ότι υπάρχει μεγάλη διαφορά ανάμεσα στο συνολικό αριθμό που εμφανίζονται οι λέξεις με το συνολικό αριθμό των λεκτικών τύπων, όπως και ανάμεσα στο συνολικό αριθμό των λεκτικών τύπων με το συνολικό αριθμό των λημμάτων.
Ο συνολικός αριθμός των λημμάτων της αρχαίας ελληνικής είναι 150.000 περίπου (το λεξικό Liddell-Scott  στην τελευταία του ηλεκτρονική έκδοση περιλαμβάνει 136.292 λήμματα). Οι λεκτικοί τύποι, σύμφωνα με τον Νίκο Νικολάου, ερευνητή γλωσσολόγο του πανεπιστημίου Irvine ανέρχονται περίπου σε 1.2000.000 (βεβαίως δεν πρέπει να αδικούμε την αρχαία γλώσσα συγκρίνοντάς της με μια νέα που εμπλουτίζεται συνεχώς με νεολογισμούς και δάνεια).
Φυσικά  το TLG συνέχισε την αποθησαύριση κειμένων, προσθέτοντας όλο και περισσότερα κείμενα της βυζαντινής εποχής, αφού τα αρχαία κείμενα έχουν καλυφθεί σχεδόν στο σύνολό τους. Ο συνολικός αριθμός των λέξεων της αρχαίας και μεταγενέστερης ελληνικής γλώσσας (από τον Όμηρο έως την Άλωση) είναι 100.000.000 περίπου, ο συνολικός αριθμός των λεκτικών τύπων, συμπεριλαμβανομένων και των ‘‘αντικανονικών’’ (ανορθόγραφων ή κακογραμμένων) είναι λίγο πάνω από το 1.500.000 (αν προστεθούν και οι νεοελληνικές και διαλεκτικές παραλλαγές ο αριθμός θα μπορούσε να πλησιάσει τα 2.000.000 λέει η κ. Μαρία Παντελιά, διευθύντρια του TLG), ο δε συνολικός αριθμός λημμάτων ανέρχεται περίπου στις 215.000. Το ότι έχει σωθεί μόνο το 5% της αρχαίας γραμματείας δεν σημαίνει ότι ο αριθμός των χαμένων λέξεων είναι 20πλάσιος (εδώ λειτουργεί ο νόμος του 80/20 ή κάποιος ανάλογος, που σημαίνει ότι οι χαμένες λέξεις θα είναι πολύ λιγότερες).

Ας αφήσουμε όμως τη λογιστική γύρω από τις λέξεις και ας επικεντρωθούμε στο εξής: όταν μιλάμε για τον πλούτο μιας γλώσσας, μιλάμε για τον πλούτο των κειμένων που είναι γραμμένα στη γλώσσα αυτή. Και το μεγαλείο της αρχαίας ελληνικής δεν βρίσκεται στο μέγεθος του λεξιλογίου της, αλλά στα κείμενα που έχουν γραφεί σε αυτήν.

Διότι, ίσως να μην υπάρχουν μεγαλειώδεις γλώσσες, υπάρχουν όμως μεγαλειώδη κείμενα, που γράφονται από ανθρώπους σκεπτόμενους, ανθρώπους ευφυείς, στοχαστές, ευρηματικούς, σκαπανείς του πνεύματος και του λόγου!

kartswnhs@gmail.com

Δεν υπάρχουν σχόλια:

Δημοσίευση σχολίου

Η Γνώμη Κιλκίς- Παιονίας διευκρινίζει στους αναγνώστες της ότι θεωρεί αυτονόητο το δικαίωμα του σχολιασμού και της κριτικής έκφρασης, όταν αυτό φυσικά δεν στοχεύει στην απαξίωση, στην ύβρη και στην προσβολή ατόμων και θεσμών.

Το αναγνωστικό κοινό θα πρέπει να γνωρίζει ότι η Γνώμη, επιδιώκοντας μια υγιή και αμφίδρομη επικοινωνία, δεν δημοσιεύει ανυπόγραφα σχόλια, αλλά ούτε και σχόλια ρατσιστικού, προσβλητικού και υβριστικού περιεχομένου.

Τα ενυπόγραφα άρθρα τέλος, εκφράζουν το συντάκτη τους και δε συμπίπτουν κατ' ανάγκην με την άποψη της εφημερίδας.