Η Τεχνητή Νοημοσύνη μιλάει ελληνικά

Σε μια εποχή όπου η Generative AI (Παραγωγική Τεχνητή Νοημοσύνη) κυριαρχείται από αμερικανικούς τεχνολογικούς κολοσσούς, η Ελλάδα επιχειρεί να διασφαλίσει τη δική της ψηφιακή κυριαρχία. Στο επίκεντρο αυτής της προσπάθειας βρίσκεται η ανάπτυξη εξειδικευμένων Ελληνικών Μεγάλων Γλωσσικών Μοντέλων (LLMs), μια πρωτοβουλία που δεν αφορά μόνο την τεχνολογική εξέλιξη, αλλά αποτελεί πράξη προστασίας του εθνικού πολιτισμού και της γλώσσας.

Στο πλαίσιο της εκπομπής Startech του τηλεοπτικού σταθμού Star, ο Βασίλης Κατσούρος, Διευθυντής του Ινστιτούτου Επεξεργασίας του Λόγου (ΙΕΛ) στο Ερευνητικό Κέντρο «Αθηνά», ξεδίπλωσε το στρατηγικό πλάνο για την επόμενη ημέρα των ελληνικών γλωσσικών μοντέλων, αναλύοντας πώς η χώρα μας απαντά στις προκλήσεις της νέας ψηφιακής εποχής.

35 χρόνια ιστορίας: Από την αυτόματη μετάφραση στα ελληνικά LLMs

Το Ινστιτούτο Επεξεργασίας του Λόγου κουβαλά μια βαριά κληρονομιά. Ιδρύθηκε το 1991, συμπληρώνοντας φέτος 35 χρόνια ζωής, ως αποτέλεσμα του ευρωπαϊκού προγράμματος «Eurotra» που ήταν αφιερωμένο στην αυτόματη μετάφραση.

«Η μετάφραση είναι κατεξοχήν ευρωπαϊκή τεχνολογία, καθώς η Ευρωπαϊκή Ένωση είναι ο πρώτος μεγάλος πολύγλωσσος οργανισμός στον κόσμο, με ανάγκη μετάφρασης εγγράφων σε 24 επίσημες γλώσσες», εξήγησε ο κ. Κατσούρος. Ωστόσο, όπως σημείωσε, ενώ η Ευρώπη ερευνά και καινοτομεί, η εμπορική εκμετάλλευση κατέληξε να γίνει αμερικανική υπόθεση. Σήμερα, το ΙΕΛ, ενταγμένο στο Ερευνητικό Κέντρο «Αθηνά» (το οποίο ιδρύθηκε το 2003 και αποτελεί ένα από τα 11 δημόσια ερευνητικά κέντρα της χώρας), γεφυρώνει αυτό το κενό, αναπτύσσοντας τεχνολογίες αιχμής για την επικοινωνία ανθρώπου-μηχανής.

Το στοίχημα του «Κρι-Κρι» και η ανάγκη για εγχώρια μοντέλα

Το Ινστιτούτο έχει ήδη αναπτύξει ελληνικά γλωσσικά μοντέλα, με πιο χαρακτηριστικό το μοντέλο «Κρι-Κρι». Η διαφορά τους από εμπορικά μεγαθήρια όπως το ChatGPT (OpenAI), το Gemini (Google) ή το Claude (Anthropic) έγκειται στον προσανατολισμό τους. Τα αμερικανικά μοντέλα είναι «κλειστά» και εκπαιδευμένα κυρίως σε αγγλόφωνα δεδομένα.

Η ελληνική γλώσσα, ωστόσο, παρουσιάζει ιδιαιτερότητες. Αν και ομιλείται από περίπου 15 εκατομμύρια ανθρώπους παγκοσμίως, το ψηφιακό της αποτύπωμα και οι διαθέσιμοι γλωσσικοί πόροι στο διαδίκτυο είναι περιορισμένοι.

«Η προσπάθειά μας δεν είναι να φτιάξουμε άλλο ένα ChatGPT», ξεκαθάρισε ο κ. Κατσούρος. «Η γλώσσα δεν είναι μόνο λέξεις, είναι πολιτισμός. Θέλουμε να υποστηρίξουμε την ελληνική γλώσσα με τις ιδιαιτερότητές της –από τη νέα ελληνική, το πολυτονικό, μέχρι και τις παλαιότερες μορφές της– μέσα από μικρότερα, ευέλικτα γλωσσικά μοντέλα, τα οποία θα διατεθούν δωρεάν στις ελληνικές μικρομεσαίες επιχειρήσεις για να αναπτύξουν εφαρμογές προσαρμοσμένες στην ελληνική πραγματικότητα».

Η ανάγκη για «εθνικά» μοντέλα είναι και ζήτημα τεχνολογικής κυριαρχίας. Παρότι τα ξένα μοντέλα έχουν βελτιώσει σημαντικά τα ελληνικά τους σε σχέση με το 2022, η Ελλάδα χρειάζεται δικά της εργαλεία αξιολόγησης (benchmarks). Τα υπάρχοντα κριτήρια αξιολόγησης παγκοσμίως είναι μεταφράσεις από τα αγγλικά, γεγονός που στερείται πολιτισμικής προσαρμογής.

Η πρόκληση των διαλέκτων και των μοντέλων φωνής

Μια από τις πιο ενδιαφέρουσες πτυχές της έρευνας που διεξάγεται στο ΙΕΛ και στο Ερευνητικό Κέντρο «Αθηνά» (σε συνεργασία με τη μονάδα «Αρχιμήδης») αφορά τις ελληνικές διαλέκτους. Όσο πιο μικροί είναι οι γλωσσικοί πόροι, τόσο μεγαλύτερη είναι η τεχνολογική πρόκληση, γι' αυτό και επιστρατεύονται τεχνικές δημιουργίας «συνθετικών πόρων».

Η έρευνα δεν περιορίζεται μόνο στον γραπτό λόγο, αλλά επεκτείνεται και στον προφορικό. Αναπτύσσονται μοντέλα φωνής που θα μπορούν να αναγνωρίζουν τον τρόπο εκφοράς των διαλέκτων και να τον μετατρέπουν σε κείμενο, διασώζοντας έτσι την προφορική πολιτιστική κληρονομιά της χώρας.

Πώς εκπαιδεύεται ένας «ψηφιακός εγκέφαλος»

Για το ευρύ κοινό που δεν διαθέτει τεχνικές γνώσεις, ο κ. Κατσούρος εξήγησε με απλά λόγια τη διαδικασία της μηχανικής μάθησης πίσω από τα LLMs, η οποία χωρίζεται σε τρία βασικά στάδια:

Προ-εκπαίδευση (Pre-training): Στο μοντέλο τροφοδοτούνται τεράστιοι όγκοι κειμένων. Εκεί μαθαίνει στατιστικά να παράγει την επόμενη λέξη (ή υπο-λέξη/token). Σε αυτό το στάδιο ξέρει να μιλάει, αλλά δεν ξέρει να εκτελεί εντολές.

Εκπαίδευση σε Οδηγίες (Instruction Tuning): Το μοντέλο μαθαίνει να ακολουθεί οδηγίες μέσα από ζεύγη ερωτήσεων-απαντήσεων. Εδώ εισάγεται και η έννοια του συλλογισμού (chain of thought).

Ευθυγράμμιση (Alignment): Ο κατασκευαστής δίνει στο μοντέλο τη συμπεριφορά και τις αξίες που επιθυμεί (τι θεωρείται καλή ή κακή απάντηση). Σε αυτό το σημείο ο κ. Κατσούρος τόνισε ότι κάθε μοντέλο κουβαλά τις προκαταλήψεις (bias) του δημιουργού του: «Τα κινεζικά μοντέλα έχουν διαφορετική προσαρμογή, τα αμερικανικά άλλη, ενώ το μοντέλο "Grok" του Έλον Μασκ σκέφτεται πρώτα τι λέει ο ίδιος ο Μασκ και μετά απαντάει».

Όσον αφορά τις περίφημες «ψευδαισθήσεις» (hallucinations) –τα λάθη δηλαδή όπου η AI επινοεί γεγονότα– σημείωσε ότι δεν πρόκειται για ένα απλό τεχνικό πρόβλημα αλλά για δομικό χαρακτηριστικό των μοντέλων, το οποίο οι επιστήμονες προσπαθούν συνεχώς να περιορίσουν μέσω νέων τεχνικών.

Η ενεργειακή κρίση της Τεχνητής Νοημοσύνης

Η ραγδαία εξάπλωση της AI φέρνει στο προσκήνιο ένα τεράστιο περιβαλλοντικό ζήτημα: την τεράστια κατανάλωση ενέργειας. Η έρευνα πλέον στρέφεται στη δημιουργία πιο αποδοτικών αλγορίθμων που απαιτούν λιγότερες υπολογιστικές πράξεις, καθώς και σε hardware φιλικό προς το περιβάλλον.

«Η τεχνητή νοημοσύνη έχει συνδέσει άρρηκτα την ενέργεια με τη γνώση. Αν δεν έχεις ενέργεια, δεν έχεις AI», υπογράμμισε ο Διευθυντής του ΙΕΛ, επισημαίνοντας ότι τα μεγάλα Data Centers πρέπει να υποστηρίζονται από πράσινη ενέργεια (αιολικά και φωτοβολταϊκά πάρκα). Παράλληλα, έστειλε ένα μήνυμα ψηφιακής υπευθυνότητας προς τους χρήστες, τονίζοντας ότι επειδή η AI έχει γίνει «μόδα», ο κόσμος τη χρησιμοποιεί αλόγιστα σαν παιχνίδι: «Πρέπει να έχουμε αυτοπεριορισμό και υπευθυνότητα στις ερωτήσεις που κάνουμε, καθώς κάθε ερώτημα έχει ενεργειακό κόστος».

Ανθρωπιστικές Επιστήμες και ο «Φάρος» του ελληνικού οικοσυστήματος

Η εφαρμογή της γλωσσικής τεχνολογίας εκτείνεται πλέον και σε πεδία που ξαφνιάζουν, όπως η αρχαία φιλολογία και η λογοτεχνική ανάλυση. Λόγω του διεπιστημονικού χαρακτήρα του ΙΕΛ, υπολογιστικοί γλωσσολόγοι και μηχανικοί συνεργάζονται με ιστορικούς, αρχαιολόγους και κοινωνικούς επιστήμονες, παρέχοντάς τους εργαλεία για να αναλύουν τεράστιες συλλογές δεδομένων, συνεντεύξεις ή τάσεις στον Τύπο.

Το μεγάλο ορόσημο για το ελληνικό οικοσύστημα είναι η επικείμενη λειτουργία του «Φάρου», του Ελληνικού Εργοστασίου Τεχνητής Νοημοσύνης (AI Factory). Ο «Φάρος» θα εστιάζει σε τρεις πυλώνες: την Υγεία, τη Βιωσιμότητα/Κλιματική Αλλαγή, και τη Γλώσσα/Πολιτισμό.

Όπως αποκάλυψε ο κ. Κατσούρος, μέσα στο καλοκαίρι του 2026 αναμένεται να κυκλοφορήσει το νέο προηγμένο ελληνικό μοντέλο του «Φάρου». Το Ινστιτούτο βρίσκεται ήδη σε επαφή με εγχώριες μικρομεσαίες επιχειρήσεις, οι οποίες μέχρι το τέλος του έτους θα παρουσιάσουν τις πρώτες εφαρμογές πολιτιστικής τεχνολογίας. Αυτές θα περιλαμβάνουν από έξυπνους ψηφιακούς βοηθούς για πολιτιστικά αρχεία και museums, μέχρι εξειδικευμένα συστήματα αμφίδρομης μετάφρασης μεταξύ αρχαίας και νέας ελληνικής γλώσσας.

Η Ελλάδα, μέσω των δημόσιων ερευνητικών της φορέων, αποδεικνύει ότι δεν προτίθεται να μείνει απλός θεατής στις εξελίξεις της Τεχνητής Νοημοσύνης, αλλά διεκδικεί ενεργά τον δικό της χώρο, διασφαλίζοντας ότι η ελληνική λαλιά θα συνεχίσει να ακούγεται δυνατά και στον ψηφιακό κόσμο του μέλλοντος.

Τεχνητή Νοημοσύνη LIFE