Το 2017, δόθηκε η πρώτη υπηκοότητα σε ρομπότ: η τελετή έλαβε χώρα στη Σαουδική Αραβία και αφορούσε τη «Σοφία», που προσομοίαζε μια νέα γυναίκα. Ωστόσο, αμέσως φάνηκε ότι επρόκειτο για marketing, με τα πιο εντυπωσιακά σχόλια του ρομπότ να είναι προσχεδιασμένα.
Δεν υπήρχε κανένα πρότζεκτ που να μπορούσε να προσεγγίσει την τεχνητή νοημοσύνη (AI) που βλέπουμε στο σινεμά. Τέτοιου επιπέδου νοημοσύνη έχει ονομαστεί γενική (AGI), και υποτίθεται ότι θα μπορούσε να κατανοήσει και να μάθει νέες δεξιότητες με ανθρώπινη ευελιξία.
Οι πλέον ειδικοί εμφανίζονταν διχασμένοι στις δημοσκοπήσεις για το πότε θα μπορούσαμε να φτάσουμε ένα τέτοιο επίτευγμα, με το μέσο όρο να εκτιμά ότι θα χρειάζονταν αρκετές δεκαετίες. Παράλληλα, μια μη αμελητέα μερίδα ειδικών πίστευε ότι δε θα φτάναμε μέχρι εκεί εντός του αιώνα, καθώς δεν είχαμε ιδέα για το πώς.
Μελετώντας τα τότε χρηστικά μοντέλα τεχνητής νοημοσύνης, βλέπαμε εντυπωσιακές εξελίξεις σε εξειδικευμένους τομείς, όπως η μετάφραση κειμένου, η διάγνωση ασθενειών μέσα από φωτογραφίες, ακόμα και η νίκη του παγκόσμιου πρωταθλητή στο Go (από τα πιο δύσκολα επιτραπέζια).
Αλλά δε βλέπαμε ίχνος της πολυπόθητης πραγματικής κατανόησης εννοιών και ευρύτερου κόσμου, έξω από τα στενά και προβλεπόμενα πλαίσια λειτουργίας των μοντέλων. Εργαλεία «έξυπνα» στην τυποποιημένη δουλειά τους, αλλά «χαζά» ευρέως.
—
Μέχρι που το καλοκαίρι του 2018, η OpenAI, οργανισμός-εταιρεία με σκοπό την προσεκτική μελέτη και την ανάπτυξη ενός ασφαλούς AGI, πρότεινε μια νέα προσέγγιση, με την ονομασία GPT.
Με απλά λόγια, ο υπολογιστής αφηνόταν να διαβάσει έναν εκτενή όγκο ποιοτικών κειμένων χωρίς καθοδήγηση, και αφού δεχόταν γενικές ερωτήσεις, έπρεπε να δομήσει απαντήσεις προβλέποντας κάθε φορά την πιθανότερη επόμενη λέξη της απάντησης.
Το 2020, δόθηκε πρόσβαση μεταξύ ειδικών στην 3η έκδοση του μοντέλου, οι οποίοι εξέφρασαν έκπληξη με τις ικανότητές του. Ωστόσο, το ευρύ κοινό δεν είχε ιδέα μέχρι και τα τέλη του 2022, όπου δόθηκε εύχρηστη και δωρεάν πρόσβαση στην έκδοση 3.5, μέσω μιας ιστοσελίδας διαδραστικών ερωταπαντήσεων (chatbot), το γνωστό πια ChatGPT.
Η δημοσίευση του ChatGPT έγινε χωρίς φανφάρες, και εντός της OpenAI, ο σκοπός ήταν μια προκαταρκτική ευρεία δοκιμή της τεχνολογίας, χωρίς μεγάλες προσδοκίες. Ωστόσο, ακολούθησε ένας καινοφανής καταιγισμός χρήσης και δημοσιότητας, που οδήγησε στο θεωρούμενο ιστορικά ταχύτερο ρεκόρ των 100 εκατομμυρίων ενεργών χρηστών, σε μόλις 2 μήνες.
Παρά τις ευρύτατες δεξιότητες του GPT-3.5, από τις κριτικές απαντήσεις σε σύνθετα θέματα, μέχρι τον προγραμματισμό εφαρμογών σε κάθε γλώσσα, συχνά φαινόταν να υστερεί σε ορισμένα πολυσύνθετα ερωτήματα.
Παράλληλα, όταν δεν γνώριζε την απάντηση σε ένα πολύ συγκεκριμένο ζητούμενο (όπως το βιογραφικό κάποιου εγχώριου δημοσίου προσώπου), συχνά κατασκεύαζε μια ευλογοφανή απάντηση, που όμως δεν ήταν ακριβής (φαινόμενο hallucination).
—
Ωστόσο, το πραγματικό προϊόν της OpenAI δεν είχε φτάσει ακόμη: επρόκειτο για το GPT-4, που έπειτα από ανάπτυξη μισού έτους, δημοσιεύτηκε στις 14 Μαρτίου 2023 για επί πληρωμή χρήστες.
Έμαθα για την ανακοίνωση κατά την διάρκεια ενός ταξιδιού. Θα μου μείνει το πώς μελετούσα την επιστημονική δημοσίευσή του για ώρες, αγόρασα τη συνδρομή προτού καν αποβιβαστώ, και μετά τα πρώτα απαιτητικά μου τεστ, το σοκαριστικό αίσθημα ότι «το κάστρο πια έπεσε».
Το GPT-4 πλέον δεν παρουσίαζε μόνο την ικανότητα να απαντάει σε δύσκολα ερωτήματα, αλλά να ξεπερνάει ακόμη και μεγάλο μέρος των ειδικών, για παράδειγμα σκοράρωντας στις πρώτες θέσεις δικηγορικών και ιατρικών τεστ που δεν είχε ξαναδεί, και αυτό χωρίς εξειδικευμένη εκπαίδευση. Επίσης, διέθετε πολύ προχωρημένες οπτικές δεξιότητες, κατασκευάζοντας για παράδειγμα μια λειτουργική ιστοσελίδα από ένα πρόχειρο σκίτσο.
Η Microsoft ήταν από τους βασικούς χρηματοδότες της ανάπτυξης του GPT-4, με σκοπό να το ενσωματώσει σύντομα στην επαγγελματική σουίτα της, και πειραματίστηκε εκτενώς με αυτό πριν τη δημοσίευσή του. Πρόσφατα, ερευνητές της ανάρτησαν μια εργασία 155 σελίδων, που έκανε λόγο για τις «πρώτες σπίθες AGI».
Παρά τον «βαρύ τίτλο», οι ερευνητές τεκμηρίωσαν εύλογα και συστηματικά ότι επρόκειτο για ένα πρώιμο είδος AGI, μέσα από δεκάδες τεστ σε ποικίλα πεδία. Σε αντίθεση με το προηγούμενο μοντέλο, το GPT-4 έδειχνε σε βάθος κατανόηση της συναισθηματικής κατάστασης των ανθρώπων και του πραγματικού κόσμου.
—
Βασικοί περιορισμοί του γενικού GPT-4, είναι ο χρονικός ορίζοντας της γνώσης του μέχρι την ημερομηνία της βασικής του εκπαίδευσης, η αδυναμία του να «κρατάει και ξαναγράφει σημειώσεις» προτού δώσει την τελική του απάντηση και οι περιορισμένες ικανότητές του σε τομείς που δεν μελετούνται εύκολα μόνο μέσω λέξεων, όπως τα μαθηματικά.
Ωστόσο, η OpenAI έχει ήδη αρχίσει να δίνει πρόσβαση στο GPT-4 σε εξωτερικά εργαλεία, όπως για αναζήτηση στο διαδίκτυο, για αλληλεπίδραση με άλλες εφαρμογές, για άντληση εξειδικευμένων πληροφοριών και για υπολογισμούς. Το πιο εντυπωσιακό; Το GPT-4 φαίνεται ικανό να τα χειρίζεται αποτελεσματικά, αμέσως αφού του δοθεί μια σύντομη περιγραφή τους.
Παράλληλα, είναι πολύ εύκολη η σύζευξη του GPT-4 με τις υπηρεσίες τεχνητής παραγωγής εικόνων, τον δεύτερο κλάδο της επανάστασης του AI που παρατηρούμε, ο οποίος φαίνεται σε πολλά σημεία να έχει φτάσει την ανθρώπινη δεξιότητα και δημιουργικότητα.
Παρότι είμαστε ακόμη στις πρώτες μέρες που οι ευρύτερες δυνατότητες του GPT-4 παρέχονται σταδιακά σε ανεξάρτητους ερευνητές, βλέπουμε να πληθαίνουν οι εντυπωσιακές εφαρμογές του. Χαρακτηριστικό το παράδειγμα του AutoGPT, που του δίνει τη δυνατότητα να δέχεται προφορικές εντολές, να δομεί σκέψεις και να εκτελεί σειρά ενεργειών αυτόνομα.
—
Και εδώ φυσικά φτάνουμε στον φόβο που μας έχει διδάξει το ιστορικό δεκαετιών της επιστημονικής φαντασίας.
Καταρχάς, μπορούμε να θεωρήσουμε ευτυχές ότι το GPT εφευρέθηκε από μια εταιρεία που εξαρχής είχε σκοπό την ανάπτυξη ενός ασφαλούς AGI. Έτσι, το μοντέλο έχει εκπαιδευτεί εκτενέστατα ώστε να αποφεύγει ανήθικες πρακτικές, τόσο πριν τη δημοσίευσή του όσο και καθημερινά, μέσα από την αλληλεπίδρασή του με τους αναρίθμητους χρήστες του.
Ωστόσο, για αρχή δεν χρειάζεται κανένα φουτουριστικό σενάριο για να ανησυχήσουμε. Οι συνειδητά ανήθικες χρήσεις του GPT-4 πληθαίνουν μαζί με το εύρος των δυνατοτήτων και των χρηστών του, και έχουν βρεθεί διάφορες τεχνικές εξαπάτησής του ώστε να ξεπεράσει τις ηθικές αναστολές του (jailbreak), που δεν έχουν μπορέσει να αποτραπούν ακόμη πλήρως.
Παράλληλα, υπάρχουν βάσιμες ανησυχίες για την ευρύτερη κοινωνική επίδραση μοντέλων όπως το GPT-4, με πιο χαρακτηριστική την ταχεία αντικατάσταση εργαζομένων. Πρόσφατη μελέτη με τη συμμετοχή της OpenAI, εκτίμησε ότι περίπου οι μισές εργασίες είναι εκτεθειμένες κατά τουλάχιστον το ήμισυ, στις διευρυμένες δεξιότητες τέτοιων μοντέλων.
Παράλληλα όμως, υπάρχουν και αντεπιχειρήματα, όπως ότι ιστορικά, η τεχνολογία δημιούργησε περισσότερες δουλειές απ’ όσες κατήργησε, και ότι με κατάλληλες ρυθμίσεις και προβλέψεις, τα εργαλεία αυτά μπορούν να φτιάξουν περισσότερο πλούτο για όλους μας, με μειωμένα ωράρια εργασίας.
Πρόκειται για πολυσύνθετα ζητήματα, αλλά ένα πράγμα είναι σίγουρο: το μέλλον είναι εδώ και δεν γυρνάει πίσω. Πρέπει να προβληματιστούμε και προετοιμαστούμε σοβαρά το συντομότερο.
***
Tελειόφοιτος του τμήματος Πληροφορικής του Οικονομικού Πανεπιστημίου Αθηνών. Είναι υπεύθυνος στα “Ελληνικά Hoaxes” για την τεχνική υλοποίηση της πρώτης ελληνικής εφαρμογής προειδοποίησης ψευδών ειδήσεων
Παραπομπές:
Συνολικές πληροφορίες για το ιστορικό της OpenAI και των GPT
(Η εικόνα αυτόματα σχεδιασμένη από το Bing Chat με τεχνολογία DALL∙E)
πηγη: https://antikleidi.com