Η Τεχνητή Νοημοσύνη καλπάζει
Οι εξελίξεις στην Τεχνητή Νοημοσύνη στις τελευταίες εβδομάδες είναι καταιγιστικές!

Στο εξωτερικό!!!

Την προηγούμενη εβδομάδα ανακοινώθηκε από την openAI στις ΗΠΑ, ένα νέο μοντέλο του chatGPT4, το chatGPT4omni το οποίο μπορεί να συζητάει με τον χρήστη κανονικά σαν να ήταν ένας κανονικός συνομιλητής, να βλέπει από την κάμερα του κινητού και να αναγνωρίζει τη διάθεση του χρήστη ανάλογα με τις εκφράσεις του προσώπου του, μπορεί να αναγνωρίζει πρόσωπα, να διαβάζει από μια σελίδα που δείχνει η κάμερα και να βγάζει συμπεράσματα, και το κυριότερο να κάνει χιούμορ. Επίσης για πρώτη φορά ένα μοντέλο ευρείας χρήσης μπορεί να λύσει πρωτοβάθμιες εξισώσεις μαθηματικών. Α, να μη ξεχάσω ότι στην ομιλία του ακούγεται σαν τη Σκάρλετ Γιοχάνσον και μπορεί να εκφράσει συναισθήματα με τη φωνή του όπως έκπληξη, στόμφο, φόβο, ευθυμία και άλλα πολλά. Προς το παρόν όλα αυτά τα κάνει στα αγγλικά.

Αυτό το νέο ΑΙ ανήκει σε μια κατηγορία μοντέλων, τα λεγόμενα multi-modal μοντέλα που έχουν περισσότερους από έναν τρόπους επικοινωνίας με τον χρήστη (όραση, ομιλία, ακοή, κείμενα και αρχεία, βίντεο, κλπ).

Φυσικά αυτή είναι μια πρώτη απόπειρα για ένα μοντέλο ΑΙ που θα μπορεί να εκτελέσει καθήκοντα συνομιλητή, δασκάλου, ψυχαναλυτή, "φίλου" κλπ κλπ, δραστηριότητες που ως πριν δέκα μέρες θεωρούσαμε αυστηρά περιορισμένες σε πραγματικούς ανθρώπους.

Την ίδια στιγμή ο ιδρυτής της Amazon επενδύει $4 δισεκατομμύρια στις δραστηριότητες μιας νεοφυούς εταιρείας της τεχνητής νοημοσύνης, της Anthropic, με στόχο να δημιουργήσει μοντέλα τεχνητής νοημοσύνης με 1-2 ΤΡΙΣΕΚΑΤΟΜΜΥΡΙΑ παραμέτρους, όπου τα σημερινά έχουν λιγότερες από 200 δισεκατομμύρια παραμέτρους, αλλά κάνουν αυτά τα εκπληκτικά πράγματα που όλοι σχεδόν ξέρουμε.

Ο Μασκ δεν θα έλειπε από αυτή την αναμέτρηση φυσικά, διαθέτοντας πριν λίγες ημέρες την beta έκδοση ενός νέας τεχνολογίας ΑΙ, το Grok, το οποίο σκέφτεται γραμμικά με αποτέλεσμα να έχει πολλαπλάσια ταχύτητα από τα ισομεγέθη ανταγωνιστικά μοντέλα.

Παράλληλα η Meta του Facebook διέθεσε το ανοιχτού κώδικα δωρεάν μοντέλο της επόμενης γενιάς, το Llama3, το οποίο με μέγεθος 70 δισεκατομμυρίων παραμέτρων (40 γιγαμπάιτ όγκο δεδομένων) έχει τουλάχιστον ισοδύναμη απόδοση με το απλό chatGPT4 των 175 δισ. παραμέτρων.

Ανοιχτός κώδικας σημαίνει ότι κάποιος με βασικές γνώσεις υπολογιστών και λίγο παραπάνω προγραμματισμού, μπορεί να πάρει ένα από αυτά τα μοντέλα (ανοιχτού κώδικα) και να το βάλει να τρέχει αν όχι στο λάπτοπ του, σε έναν καλό υπολογιστή γραφείου με μια κάρτα γραφικών των €500-€1000, αποκτώντας μια δική του Τεχνητή Νοημοσύνη που θα ξέρει όλα του τα αρχεία από τότε που τα κρατάει, και θα μπορεί να του απαντήσει εκτός από ερωτήσεις επί των αρχείων του, και απαντήσεις σε οτιδήποτε βρίσκεται στο Ίντερνετ.


Όλα τα παραπάνω δεν είναι καν σημαντικά σε σχέση με την επανάσταση ευφυΐας που θα προκληθεί όταν όλα αυτά τα μοντέλα ΑΙ θα μπορέσουν να συνδυαστούν ώστε να συνεργαστούν μεταξύ τους ως Agents, όπως ανακάλυψε ο Minsky, ο ιδρυτής του AI labs του ΜΙΤ, ότι λειτουργεί ο ανθρώπινος εγκέφαλος.

Σχεδόν κάθε βδομάδα που περνάει στο 2024 ξεπερνάει την προηγούμενη σε ανακοινώσεις και πρόοδο της τεχνητής νοημοσύνης.

Εδώ τι θα κάνουμε;

Αν εξαιρέσουμε τα βήματα που κάνει ο Παπαστεργίου στο Υπουργείο Ψηφιακής στο bot που έβαλε για να απαντά ερωτήσεις στο Ίντερνετ, και τις ψηφιοποιήσεις που δρομολογεί ο Κυρανάκης για να ξεμπλέξει το κουβάρι του Κτηματολογίου, ελάχιστα περισσότερα ακούγονται στη χώρα μας.

Νομίζω κοιμόμαστε ύπνο βαθύ, όταν ο υπόλοιπος κόσμος επενδύει δισεκατομμύρια ευρώ και ανθρωποώρες, εμείς κοιτάμε να επενδύσουμε σε κανένα AirBnB και να εγκαταστήσουμε ταμειακή μηχανή σε κανένα μπιτσόμπαρο.

Από την άλλη από το πρόγραμμα ΑΘΗΝΑ που ξεκίνησε για την τεχνητή νοημοσύνη με πρωτοβουλία του πρωθυπουργού ακούγεται εκκωφαντική σιγή ιχθύος! Μάλλον θα βολεύτηκαν μερικές δεκάδες δημόσιοι υπάλληλοι που ίσως νομίζουν ότι ακόμα δουλεύουν στην αναπτυξιακή του Δήμου τους.

Δεν πιστεύω ότι θα δούμε όφελος ως χώρα από αυτή την κατεύθυνση.

Μακάρι να βγω ψεύτης.

Άγης Βερούτης

agissilaos@gmail.com