Σε αυτό το κείμενο θα μιλήσω για το πόσο άστοχο είναι να κάνουμε μακροπρόθεσμες προβλέψεις για το μέλλον της Τεχνητής Νοημοσύνης και το πώς θα επηρεάσει τη ζωή και την εργασία μας. Θα κάνω επίσης κάποιες μακροπρόθεσμες προβλέψεις για την ΤΝ.
Αν σας αρέσει το κείμενο, μπορείτε να κάνετε εγγραφή στο Medium για να παίρνετε ειδοποιήσεις και για τα επόμενα ή να το μοιραστείτε στα social media.
Αυτή την εικόνα δημιούργησε το tengr.ai με βάση την πρώτη παράγραφο του κειμένου.
1. Θα χάσουμε τη δουλειά μας από την Τεχνητή Νοημοσύνη
Ή, αλλιώς, δεν έχουμε (ρεαλιστικά) καμιά ιδέα για το πώς θα εξελιχθεί η αγορά εργασίας, ειδικά σε βραχυπρόθεσμο ορίζοντα. Αυτό που κάνουμε μέχρι τώρα, και χρησιμοποιώ πρώτο πληθυντικό πρόσωπο, είναι να βασίζουμε τις προβλέψεις μας σε ό,τι είχαμε δει σε παλιότερες βιομηχανικές επαναστάσεις, με την κλασική έννοια του όρου. Έτσι, όπως τα γεωργικά εργαλεία και μηχανήματα αντικατέστησαν πολλούς από τους εργάτες γης, βοηθώντας τους γαιοκτήμονες να αποκομίσουν πολλαπλάσιο έργο σε συγκριτικά λιγότερο χρόνο και με μικρότερο κόστος, θεωρούμε ότι «κάποια επαγγέλματα» (αρκετά αόριστο αυτό) θα περάσουν κρίση ή μπορεί και να εξαφανιστούν τελείως, αφού θα τα αντικαταστήσουν Τεχνητά Νοήμονα συστήματα, σε συνδυασμό με κάποια ρομποτικά — και η ιστορία μάς κάνει να πιστέψουμε ότι αυτά τα επαγγέλματα θα είναι αυτά που δεν απαιτούν ιδιαίτερη εξειδίκευση ή σπουδές και, άρα, όσοι τα εξασκούν θα μπορούν σχετικά εύκολα να επανειδικευτούν σε κάποιο νέο, πιο ασφαλές πόστο. Βέβαια, οι προβλέψεις αυτές γίνονται συνήθως από ανθρώπους που μιλούν εκ του ασφαλούς, θεωρώντας τις δικές τους θέσεις ως ακλόνητους βράχους και την «αυθεντία» τους ως διαχρονική, την ίδια στιγμή που για όσους πρέπει (σύμφωνα με αυτήν τη θεωρία) να αλλάξουν επάγγελμα μετά από 20 και 30 χρόνια προϋπηρεσίας, αυτό θα είναι μια οδυνηρή, αλλά αναπόφευκτη διαδικασία…
Το ζήτημα με αυτήν τη θεώρηση (πέρα από τον κοινωνικό αυτοματισμό των «ειδικών» και των «σοφών» απέναντι στους «πολλούς» και τους «αναλώσιμους») είναι ότι η ουσιαστική αξιοποίηση της ΤΝ έχει σημαντικό και διαρκές κόστος, ειδικά αν σκοπεύουμε να διατρέξουμε ολόκληρη τη διαδικασία ενός πραγματικού Ψηφιακού Μετασχηματισμού και όχι απλά να ψηφιοποιήσουμε τις υπάρχουσες, συχνά γραφειοκρατικές και παρωχημένες διαδικασίες.
Εξηγούμαι: η επιλογή, προσαρμογή, εγκατάσταση και αξιοποίηση ενός ΤΝ συστήματος σε μια επιχείρηση ή δημόσιο φορέα κοστίζει ποικιλοτρόπως, πολύ περισσότερο και για πολύ περισσότερο χρόνο από όσο νομίζει κανείς. Μπορεί τα περισσότερα από τα μοντέλα ΤΝ για τα οποία ακούμε στις ειδήσεις ή τα μέσα κοινωνικής δικτύωσης να διατίθεται δωρεάν και σε μορφή ανοικτού κώδικα, αλλά αυτό σε καμιά περίπτωση δε σημαίνει ότι απλά θα τα κατεβάσουμε σε έναν υπολογιστή του γραφείου, θα κάνουμε διπλό κλικ σε ένα αρχείο, θα ξεκινήσει κάτι να «τρέχει» και θα ανεβάσουμε σε αυτό ένα excelάκι με τα οικονομικά της επιχείρησής μας ή τα στοιχεία των πελατών μας. Ακόμα κι αν διαθέσουμε τον κόπο, τον χρόνο και το χρήμα που χρειάζεται για να το κάνει αυτό ένας σύμβουλος ή μια εταιρία πληροφορικής, η συντήρηση και η χρήση ενός τέτοιου συστήματος συνεχίζει να κοστίζει, αφού απαιτεί servers με αρκετή υπολογιστική ισχύ, άπλετο χώρο αποθήκευσης (συχνά στο cloud, το οποίο κι αυτό κοστίζει αρκετά) και συχνές συντηρήσεις του λογισμικού, κυρίως σε ό,τι αφορά την ασφάλεια των δεδομένων που χρησιμοποιούμε. Διαβάσαμε μόλις πρόσφατα για τη διαρροή δεδομένων από το DeekSeek, τα οποία προφανώς και προέρχονταν από όσους έσπευσαν να το χρησιμοποιήσουν, ανεβάζοντας τα ευαίσθητα ή ακόμα και πολύτιμα δεδομένα της επιχείρησής τους από τις πρώτες μέρες λειτουργίας τους. Τελικά, αυτό σημαίνει ότι, αν κάποιος αποφασίσει να κάνει την απαιτούμενη σοβαρή και μακροπρόθεσμη επένδυση στην ΤΝ για τον φορέα του, δεν είναι πολύ λογικό να προσπαθήσει να εκσυγχρονίσει θέσεις εργασίας που δεν του κοστίζουν πολύ (οι… αναλώσιμοι που έλεγα νωρίτερα), αλλά αυτές που είναι πιο εξειδικευμένες και μάλλον κρίσιμες για την παραγωγική διαδικασία του φορέα. Συνυπολογίστε εδώ και το κόστος της πιθανής χρήσης ρομποτικών συστημάτων σαν υποκατάσταση ή αντικατάσταση της χειρωνακτικής εργασίας: όταν ένας και μόνο ρομποτικός βραχίονας κοστίζει κάποιες δεκάδες χιλιάδες δολάρια μόνο για την αγορά (γιατί κι εδώ υπάρχουν κόστη εγκατάστασης, εκπαίδευσης και συντήρησης), δε νομίζω ότι θα τον δούμε πολύ σύντομα να αντικαθιστά ανθρώπους που τοποθετούν ή παίρνουν προϊόντα από ράφια σε ένα κατάστημα λιανικής ή ανθρώπους που μαζεύουν ελιές από ένα χωράφι. Αντίθετα, αυτό που βλέπουμε στην πράξη είναι ότι βάλλονται οι καλοπληρωμένες θέσεις εργασίας, οι οποίες συνήθως απαιτούν πανεπιστημιακή μόρφωση: το Pew Research Center αναφέρει ότι οι πτυχιούχοι Πανεπιστημίου έχουν υπερδιπλάσια έκθεση στην ΤΝ από τους αποφοίτους Λυκείου (27% έναντι 12%), ενώ οι εργαζόμενοι στους τομείς που κινδυνεύουν περισσότερο αμείβονταν το 2022 με 33$/ώρα και οι συγκριτικά πιο ασφαλείς με 20$/ώρα (άρα είναι οι σχετικά καλά αμοιβόμενοι). Παράλληλα, μια περσινή έρευνα από επιστήμονες στη Γερμανία και το Ηνωμένο Βασίλειο δείχνει ότι η ζήτηση για freelance εργασία σε τομείς που μπορούν να αυτοματοποιηθούν έχει ήδη συρρικνωθεί κατά 21%, με το copywriting να πλήττεται περισσότερο, ακολουθούμενο από τους developers και τους γραφίστες, κυρίως εξαιτίας της διάθεσης δωρεάν πλατφορμών δημιουργίας σαν το Midjourney ή το Dall-E.
Από την άλλη, θα ήταν αφελές να νομίζει κανείς ότι ο τρόπος που εργαζόμαστε και η παραγωγικότητά μας θα μείνουν αναλλοίωτες από την ΤΝ και όλα τα… καλούδια που αυτή μας προσφέρει. Οι μεγαλύτεροι από εμάς ζήσαμε μια παρόμοια μετάβαση και πριν από 25 περίπου χρόνια, όταν το Photoshop άρχισε να διαδίδεται περισσότερο στους υπολογιστές με Windows ή, μάλλον, όταν οι υπολογιστές με Windows έγιναν αρκετά ισχυροί υπολογιστικά και προσβάσιμοι οικονομικά, σε σύγκριση με τα μηχανήματα της Apple. Θυμάμαι τότε να διαβάζω μακροσκελή άρθρα από τους «σοφούς» της εποχής, για το πώς το «μάτι» του φωτογράφου ή του γραφίστα δεν έχει ανάγκη από τέτοια εργαλεία που θα παράγουν «ψεύτικο» αποτέλεσμα και το πώς το «ταλέντο» (whatever that means) και η δημιουργικότητα δε μπορούν να μπουν στην ίδια συζήτηση με τις… εξισώσεις που χρησιμοποιεί ένα λογισμικό. Την εξέλιξη τη ζήσαμε και τη ζούμε όλοι: δεν υπάρχει, εδώ και πολλά χρόνια, ούτε ένας επαγγελματίας ή ερασιτέχνης που να θέλει να κάνει την οποιαδήποτε αλλαγή σε μια φωτογραφία που τράβηξε με το κινητό του ή με την πανάκριβη φωτογραφική μηχανή του που να μην έχει αξιοποιήσει, έστω και στο ελάχιστο, κάποιο εργαλείο επεξεργασίας εικόνας. Τα καλούδια που μας πρόσφεραν όλα αυτά τα λογισμικά ενσωματώθηκαν προοδευτικά στη διαδικασία που ακολουθούν όσοι απασχολούνται στο αντικείμενο, φέρνοντας κοσμογονικές αλλαγές στο τι μπορούμε να κάνουμε σε μια απλή εικόνα και το πώς μπορούμε να τη μεταμορφώσουμε σε ένα έργο τέχνης — αντίστοιχα, σε λίγα χρόνια (ή μήνες!), δε θα διανοείται κάποιος να γράψει ή να διορθώσει ένα κείμενο, να συγκεντρώσει ή να αναλύσει κάθε είδους δεδομένα (όχι μόνο αριθμητικά ή κειμενικά), να οργανώσει ή να προγραμματίσει επαγγελματικές ή προσωπικές εργασίες, ακόμα και να κάνει επιστημονική έρευνα, χωρίς να αξιοποιήσει ένα ή περισσότερα εργαλεία ΤΝ. Κι αυτό σημαίνει ότι, αν δεν εξοπλίσουμε τα παιδιά που βρίσκονται στα σχολεία και στα Πανεπιστήμια με τις απαραίτητες γνώσεις, όχι μόνο τις τεχνικές, αλλά και αυτές που σχετίζονται με την κατανόηση της λειτουργίας και την ηθική και δεοντολογική χρήση αυτών των τεχνολογιών, το μέλλον που θα τα περιμένει θα είναι χειρότερο από αυτό ενός φωτογράφου που… δεν ξέρει Photoshop.
2. Το… ντόπιο AI είναι και το καλύτερο
Το οποιασδήποτε μορφής ή χρήσης λογισμικό δεν είναι, σε καμιά περίπτωση, λόγος… εθνικής υπερηφάνειας: όσο δεν έχει νόημα να υπερηφανεύεται το Ισραήλ επειδή εκεί δημιουργήθηκε το Viber, άλλο τόσο δε χρειάζεται να ντρέπεται η Εσθονία που μας προσέφερε το… Skype. Τις προηγούμενες εβδομάδες ζήσαμε μια πραγματικά κωμικοτραγική έκρηξη πανηγυρισμών για το πώς μια Κινεζική εταιρεία, η DeepSeek, διέθεσε από το πουθενά ένα παντοδύναμο και, κυρίως, δωρεάν και ελεύθερο Μεγάλο Γλωσσικό Μοντέλο, το οποίο ξεπέρασε σε επιδόσεις το ChatGPT, το Αμερικανικό «τέρας» της OpenAI, η οποία μας «είχε κλέψει» τα δεδομένα που είχαμε (αφελώς) ανεβάσει ελεύθερα στο internet και έφτιαξε μια αυτοκρατορία χρεώνοντας απίστευτα ποσά για να έχουμε εμείς το δικαίωμα να γράφουμε εύκολα και γρήγορα εργασίες για το αποχετευτικό σύστημα του Βυζαντίου.
Θεωρώ ότι δεν έχει ιδιαίτερο νόημα να μιλάμε για «νίκη της Κίνας επί των ΗΠΑ», πέρα ίσως από κάποια καφενειακού επιπέδου ανταλλαγή αναρτήσεων στα ΜΚΔ ή μια από τις αστείες δημόσιες τοποθετήσεις του Musk, όσο δεν έχει νόημα και να μιλάμε για «Ευρωπαϊκό ChatGPT» (EuroGPT) ή για το αντίστοιχο Γαλλικό (Mistral): αυτό που θέλουν οι developers, οι επιχειρήσεις και οι πολίτες είναι υψηλές επιδόσεις (που τις έχουμε), υψηλή διαθεσιμότητα και δικτυακή κάλυψη (ας πούμε ότι τις έχουμε) και ασφάλεια των δεδομένων τους (ούτε καν), για να μπορούν να δημιουργήσουν και να χρησιμοποιήσουν εύχρηστες εφαρμογές που να κάνουν τη ζωή των πολιτών ευκολότερη και ασφαλέστερη, χωρίς να πολύ-ενδιαφέρονται για την εθνικότητα της εταιρείας που δημιούργησε μια τεχνολογία. Άλλωστε, ένα μεγάλο ποσοστό από τους developers που απασχολούνται στις ΗΠΑ δεν έχουν Αμερικανικό διαβατήριο και αυτό ίσως αποτελέσει πρόβλημα με την καινούρια διακυβέρνηση, αλλά αυτό είναι αντικείμενο μιας άλλης συζήτησης.
Αν όμως το λογισμικό δεν έχει πατρίδα, αυτό που σίγουρα έχει πατρίδα είναι το hardware που είναι απαραίτητο για να τρέξει το λογισμικό, απλά γιατί χρειάζεται έναν real-life χώρο για να κατασκευαστεί και εμπορικούς κανόνες και νόμους για να διακινηθεί. Μια άλλη πτυχή των «πανηγυρισμών» που ανέφερα αφορούσε και στην πρόσκαιρη πτώση των μετοχών της NVIDIA, της εταιρίας που ξεκίνησε από την κατασκευή καρτών γραφικών για παιχνίδια με 3d γραφικά, έγινε ο κύριος κατασκευαστής καρτών με πολλαπλούς επεξεργαστές που χρησιμοποιούνταν για την εξόρυξη bitcoins και, εδώ και 3–4 χρόνια, παράγει το hardware στο οποίο εκπαιδεύονται τα μοντέλα ΤΝ για τα οποία μιλάμε. Ο όγκος των δεδομένων που έχουμε στην διάθεσή μας και το μέγεθος των μοντέλων σε σχέση με τον αριθμό των παραμέτρων από τα οποία αυτά αποτελούνται έχουν σαν αποτέλεσμα να υπάρχει τεράστια ζήτηση από τέτοιες κάρτες, τις οποίες αγοράζουν οι εταιρείες τόσο στη φάση της εκπαίδευσης των μοντέλων, όσο και για την ανάπτυξη πειραματικών εφαρμογών ή μελλοντικών εκδόσεων: υπάρχουν αναφορές για μαζικές αγορές από τον Musk που φτάνουν σε εξαψήφιο αριθμό καρτών, ενώ η χρηματιστηριακή αξία της NVIDIA ξεπερνάει τα 3 δισ. δολάρια, τοποθετώντας την στο top-5 της κεφαλαιοποίησης παγκοσμίως.
Το μεγάλο διαφαινόμενο πρόβλημα για την Ευρώπη είναι ότι η συντριπτική πλειοψηφία των ολοκληρωμένων κυκλωμάτων από τα οποία αποτελείται αυτό το hardware κατασκευάζεται στην Ταϊβάν — η εξάρτησή μας γίνεται ακόμα μεγαλύτερη, αν λάβουμε υπόψιν μας τα κυκλώματα που χρησιμοποιούνται σε κινητά, routers, συσκευές IoT, ακόμα και έξυπνες κάμερες ή αισθητήρες, δηλαδή σε όλο το hardware που είναι κι αυτό απαραίτητο για να καταφέρουμε να αξιοποιήσουμε την ΤΝ σε πραγματικές εφαρμογές. Και το πρόβλημα ξεκινά από το ότι η Ταϊβάν είναι… ένα τσιγάρο δρόμος από την Κίνα, η οποία από χρόνια δε βλέπει με καλό μάτι την ανεξαρτησία της — για τη γεωπολιτική διάσταση της «Δημοκρατίας της Κίνας», όπως αυτοαποκαλείται η Ταϊβάν, τη διαμάχη με τη Λαϊκή Δημοκρατία της Κίνας, και την ιδεολογία της One China που καλλιεργεί το Πεκίνο από το 1972, τα έχουμε συζητήσει στο ραδιόφωνο του ΣΚΑΪ πριν ακριβώς ένα χρόνο. Μια εμπόλεμη σύρραξη, η οποία αναπόφευκτα θα οδηγούσε σε κατάληψη της Ταϊβάν από τους Κινέζους, δε φαίνεται να συγκεντρώνει πολλές πιθανότητες, λόγω και της στρατιωτικής παρουσίας στην περιοχή — δεν είναι απίθανη όμως, μια νέα «πολιτιστική επανάσταση», όπου ο ίδιος ο λαός της Ταϊβάν θα «οδηγηθεί» στο να προτιμήσει την ένωση με τη «μητέρα πατρίδα», ειδικά αν οι Αμερικανοί, για κάποιο δικό τους λόγο, αποσύρουν τελικά τη στρατιωτική στήριξή τους προς το νησί. Ένας τέτοιος συμβιβασμός αρχίζει να αχνοφαίνεται στον ορίζοντα, με ενδεχόμενο αντάλλαγμα την απόσυρση της Κίνας από την «πίσω αυλή» των ΗΠΑ, δηλαδή τη Νότια Αμερική, και με δεδομένη την ανεξαρτητοποίηση της Αμερικανικής παραγωγής υψηλής τεχνολογίας από την Ταϊβάν, αφού μέσα στο 2025 αναμένεται να ξεκινήσει η παραγωγή στο εργοστάσιο της TSMC στην Αριζόνα, ενώ τόσο η Intel (που κυριαρχεί στην αγορά των προσωπικών υπολογιστών), όσο και η Samsung (κορυφαία στα Android κινητά) σχεδιάζουν να επωφεληθούν από Αμερικανικές χρηματοδοτήσεις δισεκατομμυρίων δολαρίων και να ανοίξουν τα δικά τους fab labs στις ΗΠΑ. Κι αν μας φαίνεται απίθανο το ενδεχόμενο να αποφασίσουν «μόνοι τους» οι Ταϊβανέζοι μια ένωση με την Κίνα, αρκεί απλά να ρίξει κάποιος μια ματιά στα αποτελέσματα των εκλογών του 2024 στο νησί για να δει πώς σιγά σιγά μπορεί να δημιουργείται το κατάλληλο κλίμα για να γίνει αυτό.
Απέναντι σε μια τέτοια εξέλιξη, η Ευρώπη είναι μάλλον ανοχύρωτη, αφού εξαρτάται απόλυτα από την Ταϊβάν για την προμήθεια ολοκληρωμένων κυκλωμάτων, ενώ η παραγωγή εντός των συνόρων της ΕΕ είναι αμελητέα. Πιστή στις… ρυθμιστικές συνήθειές της, η ΕΕ έθεσε σε εφαρμογή το European Chips Act (ECA) πριν περίπου 18 μήνες, εξαγγέλλοντας ιδιωτικές και δημόσιες επενδύσεις 43 δισ. ευρώ για τη σχεδίαση και παραγωγή υψηλής τεχνολογίας — κάτι τέτοιο όμως, ακόμα κι αν καταφέρει με κάποιο μαγικό τρόπο να ξεπεράσει τα εμπόδια της ευρω-γραφειοκρατίας, χρειάζεται πολλά χρόνια για να αποδώσει καρπούς και σίγουρα απαιτεί μια κοινή επιχειρηματική στρατηγική, την οποία δεν έχει επιδείξει η ΕΕ σε πιο απλά ζητήματα.
3. Η DeepSeek έκανε ό,τι και η OpenAI που «έκλεψε» περιεχόμενο για το ΜΓΜ της (και καλά να πάθει, κλπ.)
Λυπάμαι, αλλά από μένα είναι «όχι»: η χρήση ακόμα και copyrighted περιεχομένου για την εκπαίδευση ενός ΜΓΜ ή οποιουδήποτε άλλου μοντέλου ΤΝ δεν είναι ακόμα ξεκάθαρο αν είναι λογοκλοπή ή αντιγραφή, καθώς δικαστήρια στην Ιαπωνία και το Ισραήλ έχουν αποφανθεί ότι ανήκει στην κατηγορία του “fair use” (όπως, για παράδειγμα, ένας τηλεοπτικός σταθμός χρησιμοποιεί ένα καρέ από μια κινηματογραφική ταινία όταν παρουσιάζει μια σχετική είδηση), ενώ στις ΗΠΑ υπάρχουν μεμονωμένες περιπτώσεις που μιλάνε για το αντίθετο.
Παράλληλα, όπως και στην περίπτωση των ολοκληρωμένων κυκλωμάτων, η ΕΕ εξαντλείται κι εδώ σε ρυθμίσεις και διαβουλεύσεις, χάνοντας πολύτιμο χρόνο για ένα θέμα που προφανέστατα δεν έχει «άσπρο» ή «μαύρο», αλλά για το οποίο πρέπει άμεσα και αμέσως να ληφθεί μια στρατηγική απόφαση που θα προστατεύει την διανοητική ιδιοκτησία, χωρίς να εμποδίζει όμως και την καινοτομία και την τεχνολογική πρόοδο. Σε κάθε περίπτωση, η OpenAI, η Google, η Meta, η Stability AI ή οποιαδήποτε άλλη εταιρεία, μικρή ή μεγάλη, ασχολείται με τη δημιουργία και εκπαίδευση ΤΝ συστημάτων και συλλέγει κείμενα, εικόνες ή βίντεο για αυτόν τον σκοπό, προτιμούν πλέον να έρχονται εκ των προτέρων σε συμφωνία με τους κατόχους των δικαιωμάτων διανοητικής ιδιοκτησίας, πιο πολύ για να έχουν το κεφάλι τους ήσυχο απέναντι σε μελλοντικές εξελίξεις, να καθησυχάσουν τους επενδυτές τους και για να αποφύγουν το κόστος μιας δικαστικής διαδικασίας, το οποίο είναι ιδιαίτερα μεγάλο, ειδικά στις ΗΠΑ.
Από την άλλη, το να πάρεις ένα «κλειστό», copyrighted λογισμικό και με βάση αυτό να εκπαιδεύσεις ένα καινούριο μοντέλο, παραβαίνει καταφανώς τους σχετικούς νόμους, όσο κι αν στην Κίνα δεν τα πολυπιστεύουν όλα αυτά. Δεν ξέρω κατά πόσο είναι εφικτό να δικαιωθεί με κάποιον τρόπο η OpenAI και, κυρίως, να επιβληθεί κάποιο πρόστιμο ή άλλου είδους ποινή, αλλά είναι σημαντικό να τονιστεί η διαφορά, έτσι ώστε (και πάλι) να προστατευτεί η καινοτομία και η δημιουργία νέων τεχνολογικών προϊόντων που είναι κι αυτές εξαιρετικά δαπανηρές διαδικασίες. Σε κάθε περίπτωση, το μάθημα από την περίπτωση του μοντέλου της DeepSeek δεν είναι ότι «οι Κινέζοι νίκησαν τους Αμερικανούς», αλλά το ότι το δωρεάν/ανοικτού κώδικα λογισμικό έχει πολύ περισσότερα οφέλη για όλους, σε σχέση με τα κλειστά, εμπορικά συστήματα — κι εδώ έχουμε όντως μια νίκη απέναντι στο προηγούμενο paradigm, καθώς η OpenAI αρχίζει σιγά σιγά να ακολουθεί την πρακτική (κυρίως) της Google και (δευτερευόντως) της Meta και να διαθέτει δωρεάν τα μοντέλα της σε όλους τους developers, ενισχύοντας μάλιστα και τις σχετικές open source κοινότητες με εκπαιδευτικό υλικό και μαθήματα. Το οποίο μάς οδηγεί στον επόμενο μύθο…
4. Το ChatGPT είναι καλύτερο του Gemini που είναι καλύτερο του Claude (η σειρά είναι τυχαία και εξαρτάται από τον OP)
Όταν πρωτοβγήκε στη δημοσιότητα το ChatGPT (νομίζω ότι ήταν η έκδοση 3.5), όλοι τρέξαμε να δοκιμάσουμε τα πιο τρελά σενάρια παραγωγής κειμένου: άλλος δοκίμαζε να ρωτήσει για το όνομά του (οπότε είχαμε έξαρση στα hallucinations, γιατί οι περισσότεροι από εμάς δεν συμπεριλαμβανόμαστε στα 570 GB κειμένων που είχε επεξεργαστεί η OpenAI για να εκπαιδεύσει εκείνη την έκδοση), άλλος έψαχνε για το καλύτερο αυτοκίνητο εκείνης της χρονιάς (εδώ δε μπορούμε να συμφωνήσουμε εμείς για το πώς θα επιλέξουμε το καλύτερο, θα πρέπει να το ξέρει ένα ΜΓΜ), και μερικοί (εγώ) του ζητούσαν να γράψει k-pop τραγούδια με θέμα τη… φωτοσύνθεση. Από τότε έχει κυλήσει πολύ νερό στο αυλάκι (που λένε και στην τηλεόραση), με τα hallucinations να έχουν μειωθεί δραστικά, κυρίως χάρη στο επιπλέον βήμα του alignment που αποτρέπει τέτοιες κακοτοπιές, με την άμεση πρόσβαση στο internet για πληροφορίες σε πραγματικό χρόνο να συμπληρώνει τα χρονικά κενά στην εκπαίδευση των ΜΓΜ, και με τα ΜΓΜ να αρχίζουν δειλά δειλά να δοκιμάζονται και σε ενέργειες που απαιτούν, έστω και περιορισμένη, λογική σκέψη. Αυτό το τελευταίο βήμα, όπως και η ελεγχόμενη αυτονομία και ο σχεδιασμός (planning) που προσφέρουν τα μοντέλα όταν χρησιμοποιούνται σαν agents, είναι ήδη το next big thing για την ΤΝ ή, αν προτιμάτε, το πεδίο στο οποίο θα αναμετρηθούν οι μεγάλες εταιρείες του χώρου ή όσοι φιλοδοξούν να κερδίσουν μια θέση στο ίδιο τραπέζι με αυτές. Λαμβάνοντας σαν βάση τις πληροφορίες που έχουν ήδη κωδικοποιηθεί στο μοντέλο κατά τη διαδικασία της εκπαίδευσης, συν όσες ανακτώνται σε πραγματικό χρόνο από το internet, αλλά κυρίως όσες μπορεί να ανεβάσουμε εμείς στο μοντέλο (για παράδειγμα, τα αποτελέσματα ενός ερωτηματολογίου ή τα οικονομικά της εταιρείας μας), το ChatGPT, το Gemini ή οποιοδήποτε άλλο παρόμοιο agentic μοντέλο θα έχει τη δυνατότητα να κάνει αναλύσεις, να μας δώσει ιδέες για βελτίωση ή να εντοπίσει τυχόν προβληματικά σημεία σε εξαιρετικά διαφοροποιημένα σενάρια και δεδομένα — παράλληλα, θα έχουμε τη δυνατότητα να προγραμματίσουμε τη λήψη και επεξεργασία στοιχείων σε τακτά χρονικά διαστήματα, εμπλουτίζοντας έτσι τη διαδικασία ανάλυσης με όσα «φρέσκα» δεδομένα μπορεί να έχουν προκύψει. Προφανώς, θα πρέπει να θυμόμαστε ότι η ευθύνη της τελικής απόφασης θα πρέπει να ανήκει σε κάποιον άνθρωπο, αλλά και το ότι τα δεδομένα που ανεβάζουμε σε ένα μοντέλο που τρέχει απομακρυσμένα μπορεί να μην είναι ασφαλή (δείτε τι έγινε με τη διαρροή από το DeepSeek) ή μπορεί να χρησιμοποιούνται για την εκπαίδευσή του (ChatGPT) — σε κάθε περίπτωση, οι δυνατότητες ενός τέτοιου agentic συστήματος φτάνουν σε περιπτώσεις χρήσης που μπορεί να μην τις έχουμε φανταστεί καν, από τις πιο απλές (να βάλουμε στη σειρά τις εργασίες που έχουμε προγραμματισμένες για την επόμενη μέρα) μέχρι τις πιο πολύπλοκες, υλοποιώντας τη μέχρι τώρα ανεκπλήρωτη υπόσχεση για περισσότερο ελεύθερο χρόνο χάρη στην ΤΝ.
Bonus: τα chatbots διατίθενται διά πάσαν νόσον (ουσιαστικά, μια επέκταση του προηγούμενου)
Όταν διαβάζετε στο internet ή στα ΜΚΔ κείμενα που ξεκινάνε με τη φράση «ρωτήσαμε το ChatGPT για τα δέκα καλύτερα οτιδήποτε», αλλάξτε site/προφίλ/πεζοδρόμιο αμέσως: το ChatGPT (ή οποιοδήποτε μοντέλο που είναι fine-tuned για chat, όπως το Gemini) δεν έχει ενσωματώσει πληροφορία πραγματικού χρόνου, παρά μόνο αυτές που ήταν διαθέσιμες κατά τη συγκέντρωση των δεδομένων εκπαίδευσης — ακόμα κι αν του δώσουμε ρητά την οδηγία να την αναζητήσει εκείνη την ώρα, δεν είναι προφανές ότι θα εντοπίσει οποιαδήποτε σελίδα είναι σχετική (εκτός αν τις ορίσουμε εμείς) και, βέβαια, δε μπορεί να επεξεργαστεί τα δεδομένα σε βαθμό πιο προχωρημένο από κάποια απλή ταξινόμηση ή έναν απλό αλγόριθμο Python, τον όποιο θα γράψει επιτόπου. Επίσης, σε καμία περίπτωση τα chatbots δεν έχουν τη δυνατότητα επεξεργασίας κάποιου βίντεο ή αρχείου ήχου: για μια τέτοια περίπτωση χρήσης υπάρχουν εξειδικευμένα μοντέλα που μπορούν να επεξεργαστούν παράλληλα πολλαπλές μορφές πληροφορίας (τα λεγόμενα πολυτροπικά ή multimodal), αρκετά από τα οποία βρίσκονται εδώ. Όπως έγραψε στο Twitter η Merve Noyan, μια από τις πιο ενεργές developers του Huggingface, το να χρησιμοποιούμε το ChatGPT σε οποιαδήποτε χρήση, ακόμα και σε αυτές για τις οποίες δεν έχει σχεδιαστεί, αντιστοιχεί σε ένα τεράστιο skills gap. Πολύ περισσότερο, όταν μια τέτοια, αφελής χρήση αποσκοπεί στο να απαντήσει ερωτήματα σε ένα ευαίσθητο και σημαντικό θέμα, όπως είναι τα βίντεο από το μοιραίο τραίνο των Τεμπών, τα οποία κυκλοφόρησαν πρόσφατα: διάβασα τις προάλλες μια δημοσίευση-σεντόνι στο Facebook, όπου ο OP ρώτησε το ChatGPT αν μπορεί να πηγαίνει κάτι στραβά με τα βίντεο που όλοι είδαμε (προφανώς και ήθελε το εργαλείο να επιβεβαιώσει την εκτίμηση που ήδη είχε ο ίδιος). Όπως αναμενόταν, η απάντηση του εργαλείου θύμιζε υποψήφιο δήμαρχο λίγο πριν τις εκλογές, όπου αποφεύγει να πάρει σαφή θέση και απαριθμεί όλα τα πιθανά ενδεχόμενα, κάτι όμως που ερμηνεύτηκε ως εκτίμηση του συστήματος ότι τα βίντεο μπορεί να είναι «πειραγμένα». Ο OP μάλιστα έκανε copy/paste ένα μεγάλο κομμάτι κώδικα Python, το οποίο έγραψε εκείνη την ώρα το ChatGPT, χωρίς βέβαια να κάνει τον κόπο να δει καν αν σχετιζόταν με το ερώτημα ή αν μπορούσε, έστω και στο περίπου, να το απαντήσει και με πόση ακρίβεια (είπαμε και πιο πάνω, αυτή είναι δουλειά εξειδικευμένων επιστημόνων που θα χρησιμοποιήσουν εξειδικευμένα μοντέλα για αυτόν τον σκοπό). Η χρήση ενός μοντέλου chat για χρήση εκτός αυτών για τις οποίες έχει γίνει fine tuned είναι εξαιρετικά επικίνδυνη, θα οδηγήσει σε αντίθετα αποτελέσματα σε σχέση με την υιοθέτηση της ΤΝ σε προβλήματα του πραγματικού κόσμου και, σίγουρα, αποδυναμώνει τη θέση όσων υποπίπτουν σε αυτό το σφάλμα.
Κι αυτός είναι ένας παραπάνω λόγος γιατί πρέπει να αρχίσουμε από τώρα να μιλάμε για την Τεχνητή Νοημοσύνη σε όλες τις βαθμίδες της εκπαίδευσης, όχι μόνο αξιοποιώντας τα εργαλεία που μας προσφέρει, αλλά κυρίως εκπαιδεύοντας τους ανθρώπους της εκπαίδευσης και της έρευνας για το πώς δημιουργούνται τέτοια συστήματα, πώς συλλέγονται με δεοντολογικό τρόπο τα δεδομένα που χρησιμοποιούμε στην εκπαίδευση, τι πραγματικά σημαίνουν οι αποφάσεις ή οι εκτιμήσεις που μας δίνουν τα ΤΝ συστήματα και τι μπορεί να μην πάει καλά αν δε γνωρίζουμε πώς αυτά λειτουργούν σε κάθε σημείο της διαδικασίας. Κι αυτό είναι κάτι που δε μπορεί να περιοριστεί σαν γνώση ή διδασκαλία στους επιστήμονες των υπολογιστών, αλλά πρέπει να γίνει κτήμα από όλες τις επιστήμες, τις ειδικότητες και τους επαγγελματικούς τομείς, αφού — όπως έγραψα και νωρίτερα — κανένας μας δε θα μείνει ανεπηρέαστος, ειδικά μακροπρόθεσμα.
Αν σας αρέσει το κείμενο, μπορείτε να κάνετε εγγραφή στο Medium για να παίρνετε ειδοποιήσεις και για τα επόμενα, να πατήσετε το clap για να δείξετε την εκτίμησή σας και να το μοιραστείτε στα social media. Στην απίθανη περίπτωση που δε σας άρεσε, μπορείτε πάλι να το μοιραστείτε στα social και να το “θάβετε” μαζί με τους δικτυακούς σας φίλους :-)
https://medium.com/
Δεν υπάρχουν σχόλια:
Δημοσίευση σχολίου