Πώς είναι να είσαι Υπολογιστική Γλωσσολόγος
Η Υπολογιστική Γλωσσολόγος Δήμητρα Καλαντζή απαντάει σε ερωτήσεις του eduguide και μας δίνει μια εικόνα για το επάγγελμά της.
1. Πώς θα περιγράφατε το επάγγελμα της υπολογιστικής γλωσσολογίας σε κάποιον που δεν το γνωρίζει;
Η υπολογιστική γλωσσολογία είναι ένας διεπιστημονικός κλάδος της επιστήμης των υπολογιστών και της γλωσσολογίας, ο οποίος αντλεί στοιχεία και από άλλες επιστήμες όπως τα μαθηματικά, η ψυχολογία, η κοινωνιολογία κ.λπ. Αποτελεί αναπόσπαστο κομμάτι της καθημερινότητάς μας και τη συναντάμε παντού γύρω μας. Μερικά μόνο ενδεικτικά παραδείγματα είναι τα κινητά μας τηλέφωνα (π.χ. αυτόματη διόρθωση και πρόβλεψη κειμένου, μετατροπή ομιλίας σε κείμενο, κατανόηση φωνητικών εντολών), τα συστήματα και οι εφαρμογές GPS (φωνητική πλοήγηση), οι μηχανές αναζήτησης όπως το Google (π.χ. προβλέψεις αυτόματης συμπλήρωσης, κατανόηση ερωτήματος, ανάκτηση πληροφορίας, κατάταξη αποτελεσμάτων), οι υπηρεσίες email (π.χ. κατηγοριοποίηση email ως σπαμ, αυτόματη ταξινόμηση των email σε φακέλους, έξυπνες γρήγορες απαντήσεις), τα συστήματα ορθογραφικού και γραμματικού ελέγχου (π.χ. στο Word), τα αυτοματοποιημένα τηλεφωνικά κέντρα (όπως το 1535 για τα ραντεβού στα νοσοκομεία ή τα τηλεφωνικά κέντρα τραπεζών), τα αυτοματοποιημένα chatbot εξυπηρέτησης πελατών (σε site εταιρειών ή στο Messenger), τα συστήματα συστάσεων (π.χ. οι προτάσεις στο Netflix), οι φωνητικοί βοηθοί (όπως Alexa, Siri, Cortana), τα συστήματα αυτόματης μετάφρασης με πιο γνωστό το Google Translate και βεβαίως τα Μεγάλα Γλωσσικά Μοντέλα με τα οποία αλληλεπιδρούμε στο διαδίκτυο όπως το GPT-4o της OpenAI μέσω του ChatGPT.
Με βάση αυτή τη συνοπτική περιγραφή, μπορούμε να καταλάβουμε ότι το επάγγελμα και η καθημερινότητα ενός υπολογιστικού γλωσσολόγου διαφέρουν ανάλογα με το αντικείμενο ή και το πρότζεκτ στο οποίο εργάζεται. Θα μιλήσω, λοιπόν, αποκλειστικά με βάση τη δική μου εμπειρία. Εδώ και 4 χρόνια, εργάζομαι ως υπολογιστική γλωσσολόγος σε μια εταιρεία ανάπτυξης λογισμικού που έχει δημιουργήσει ένα εργαλείο διασφάλισης της ποιότητας στον τομέα της μετάφρασης/τοπικοποίησης. Είμαι υπεύθυνη για τη βελτίωση των λεξικών σε όλες τις γλώσσες που υποστηρίζει το εργαλείο (ευρωπαϊκές, ασιατικές, αφρικανικές, κ.λπ.). Η δουλειά μου αφορά την εξαγωγή, την αξιολόγηση και τον καθαρισμό γλωσσικών δεδομένων, καθώς και την αξιολόγηση και τον έλεγχο της απόδοσης των ορθογράφων που αναπτύσσει η εταιρεία μέσω της δημιουργίας και της διενέργειας διάφορων τεστ. Η συγκεκριμένη εργασία απαιτεί προσοχή στην λεπτομέρεια, περιέργεια και αγάπη για τη γλώσσα, την τεχνολογία και τη συνεχή μάθηση. Τα τελευταία χρόνια, για να βελτιστοποιήσω τη δουλειά μου, έχω μάθει και συνεχίζω ακόμα να παρακολουθώ μαθήματα για τη γλώσσα προγραμματισμού Python (και σχετικές βιβλιοθήκες), τις κανονικές εκφράσεις (regular expressions), την επεξεργασία φυσικής γλώσσας και τη χρήση πλατφορμών όπως το Hugging Face, την ανάλυση δεδομένων, τα Μεγάλα Γλωσσικά Μοντέλα, την Παραγωγική Τεχνητή Νοημοσύνη κ.ά.
Αν και εργάζομαι στον χώρο μόνο τα τελευταία 4 χρόνια, η πρώτη μου επαφή με την υπολογιστική γλωσσολογία έγινε όταν, ως απόφοιτη της Αγγλικής Φιλολογίας και αναζητώντας μεταπτυχιακό, έπεσε στα χέρια μου στη βιβλιοθήκη της σχολής ένα βιβλίο για τη μηχανική/αυτόματη μετάφραση. Η ιδέα ότι οι υπολογιστές μπορούν να μεταφράσουν μου έκανε ιδιαίτερη εντύπωση και στάθηκε η αφορμή για να κάνω μεταπτυχιακό στη μηχανική μετάφραση (MSc in Machine Translation στο Πανεπιστήμιο UMIST του Μάντσεστερ) αντί για την παραδοσιακή μετάφραση που πάντοτε ήθελα. Αυτό έγινε το μακρινό 2001, τότε που η αυτόματη μετάφραση ήταν ακόμα άγνωστη στους περισσότερους (δεν υπήρχε ακόμα το Google Translate) και συχνά χρειαζόταν να εξηγώ τι ακριβώς σπούδαζα. Από τότε, φρόντιζα πάντα να παρακολουθώ τις εξελίξεις στον χώρο, ιδίως όσον αφορά τη μετάφραση, και η γλωσσική τεχνολογία εξακολουθεί να με συναρπάζει σήμερα όσο και στα πρώτα βήματά μου.
2. Ποιες σπουδές μπορεί να ακολουθήσει κάποιος για να γίνει υπολογιστικός γλωσσολόγος;
Για να γίνει κάποιος υπολογιστικός γλωσσολόγος, μπορεί ανάλογα με την κλίση του να σπουδάσει σε τμήματα φιλολογίας (ελληνικής/ξενόγλωσσης) ή πληροφορικής. Στη συνέχεια, μπορεί να εγγραφεί σε κάποιο μεταπτυχιακό πρόγραμμα είτε αμιγώς πληροφορικής κατεύθυνσης είτε αφιερωμένο στην υπολογιστική γλωσσολογία/επεξεργασία φυσικής γλώσσας, όπως το Διατμηματικό Πρόγραμμα Μεταπτυχιακών Σπουδών Γλωσσική Τεχνολογία (MSc in Language Technology) από το Τμήμα Πληροφορικής και Τηλεπικοινωνιών του Εθνικού και Καποδιστριακού Πανεπιστημίου Αθηνών (ΕΚΠΑ) και το Ινστιτούτο Επεξεργασίας του Λόγου του Ερευνητικού Κέντρου (ΕΚ) «Αθηνά», καθώς και σε αντίστοιχα προγράμματα του εξωτερικού, όπως το MSc Speech & Language Processing του Πανεπιστημίου του Εδιμβούργου.
3. Τι συμβουλή θα δίνατε σε έναν/μια μαθητή/μαθήτρια που ενδιαφέρεται για την υπολογιστική γλωσσολογία αλλά δεν ξέρει αν του/της ταιριάζει;
Στους μαθητές και τις μαθήτριες που αγαπούν τη γλώσσα και τους υπολογιστές και ενδιαφέρονται να σπουδάσουν σε κάποιο τμήμα φιλολογίας ή πληροφορικής, θα πρότεινα να παρακολουθήσουν όλα τα μαθήματα της σχολής τους που αφορούν την επεξεργασία φυσικής γλώσσας/υπολογιστική γλωσσολογία/γλωσσική τεχνολογία. Επιπλέον, διαδικτυακά υπάρχει άφθονο δωρεάν υλικό, ακόμα και σχετικά βιβλία όπως το βιβλίο «Υπολογιστική Γλωσσολογία: Θεωρία και πράξη με ειδική αναφορά στην ελληνική γλώσσα» (αν και πολλά πράγματα έχουν αλλάξει από το 2017 που εκδόθηκε). Επίσης, υπάρχει η δυνατότητα παρακολούθησης δωρεάν διαδικτυακών σεμιναρίων σχετικών με τον τομέα (πολύ ενδιαφέροντα είναι αυτά του Κέντρου Αριστείας «Τάλως» στο Πανεπιστήμιο της Κρήτης και του δικτύου CLARIN), βίντεο και διαλέξεων στο YouTube, αλλά και επί πληρωμή μαθημάτων σε πλατφόρμες όπως το Coursera και το Udemy. Τέλος, θα πρότεινα στους μαθητές και στις μαθήτριες να μην διστάσουν να επικοινωνήσουν με καθηγητές σε πανεπιστήμια, αλλά και υπολογιστικούς γλωσσολόγους σε ερευνητικά κέντρα και εταιρείες, για να ζητήσουν περισσότερες πληροφορίες για την υπολογιστική γλωσσολογία και τους διάφορους τομείς της, καθώς και συμβουλές για τις σχετικές σπουδές και τις δεξιότητες που χρειάζεται να αναπτύξουν.
Η Δήμητρα Καλαντζή είναι υπολογιστική γλωσσολόγος. Επί σειρά ετών, εργάστηκε ως μεταφράστρια παρέχοντας γλωσσικές υπηρεσίες για μεγάλους οργανισμούς και κορυφαίες εταιρείες τεχνολογίας. Είναι διδάκτορας Πληροφορικής του University of Manchester, με εστίαση στη δημιουργία υποτίτλων για κωφούς και βαρήκοους μέσω ανάλυσης σωμάτων κειμένων. Έχει ολοκληρώσει μεταπτυχιακές σπουδές στη Μηχανική Μετάφραση στο UMIST και είναι απόφοιτη Αγγλικής Γλώσσας και Φιλολογίας του Εθνικού και Καποδιστριακού Πανεπιστημίου Αθηνών. Είναι μέλος του Institute of Translation and Interpreting (ITI, UK) και της European Association for Machine Translation (ΕΑΜΤ). Το έργο της κινείται στη διασταύρωση γλωσσικών σπουδών και τεχνολογίας, με ιδιαίτερη έμφαση στη γλωσσική τεχνολογία στον τομέα της μετάφρασης και τοπικοποίησης, και στην υποστήριξη γλωσσών με περιορισμένους πόρους.
Αναφορές:
- Βιβλίο «Υπολογιστική Γλωσσολογία: Θεωρία και πράξη με ειδική αναφορά στην ελληνική γλώσσα»
- Talos Centre
- CLARIN:EL
----------------------------------------
#Σπουδές στη Γλωσσολογία
Αν η Γλωσσολογία είναι ο τομέας που σε συναρπάζει, μπορείς να ενημερωθείς εδώ για όλα τα προπτυχιακά προγράμματα Φιλολογίας που προσφέρονται στην Ελλάδα και την Κύπρο.
Από την άλλη, αν έχεις ήδη ολοκληρώσει τις προπτυχιακές σπουδές σου και αναζητάς ευκαιρίες για μεταπτυχιακή εξειδίκευση, μπορείς να ψάξεις το μεταπτυχιακό που σε ενδιαφέρει από τη μηχανή αναζήτησης του eduguide, χρησιμοποιώντας λέξεις-κλειδιά όπως «Γλωσσολογία», «Μετάφραση» κ.λπ.