Σας ενδιαφέρουν ΠΡΟΣΦΟΡΕΣ? Εξοικονομήστε χρήματα με τα κουπόνια μας WhatsApp o ΤΗΛΕΓΡΑΦΗΜΑ!

Υπάρχει ένα τεράστιο πρόβλημα που εμποδίζει την εκπαίδευση των νευρωνικών δικτύων

Στον δυναμικό κόσμο τουνοημοσύνη τεχνητός, κορυφαίες εταιρείες τεχνολογίας αντιμετωπίζουν μια απροσδόκητη πρόκληση που θα μπορούσε να επιβραδύνει τον ρυθμό της καινοτομίας: την ανάπτυξη δυσκολία στην εύρεση δεδομένων ποιότητας για την εκπαίδευση των μοντέλων τους. Αυτή η έλλειψη δεδομένων επηρεάζει την ανάπτυξη προηγμένων τεχνολογιών όπως π.χ GPT-5, ενώ εταιρείες του διαμετρήματος της Microsoft και της OpenAI αναζητούν καινοτόμες λύσεις για να ξεπεράσουν αυτό το εμπόδιο.

Προκλήσεις εκπαίδευσης AI: Υπάρχει μια πείνα για δεδομένα και αυτό επιβραδύνει την πρόοδο

Σε μια εποχή που χαρακτηρίζεται από μια άνευ προηγουμένου αύξηση της υπολογιστικής ισχύος και την πρόοδο των τεχνικών μηχανικής μάθησης, το OpenAI και τα παρόμοια του αντιμετωπίζουν παράδοξο: Η αφθονία των διαδικτυακών δεδομένων δεν μεταφράζεται αυτόματα σε χρήσιμο πόρο για εκπαίδευση τεχνητής νοημοσύνης. ο χρειάζονται ακριβή δεδομένα, σχετικό και ενημερωμένο είναι πιο κρίσιμο από ποτέ, ειδικά όταν πρόκειται για εκπαίδευση ολοένα και πιο περίπλοκων μοντέλων όπως το προγραμματισμένο GPT-5.

Η μετάβαση από το GPT-4 στο GPT-5 δείχνει αυτή την εκθετική αύξηση της ζήτησης δεδομένων: ενώ το πρώτο απαιτούσε «μόνο» 12 τρισεκατομμύρια μάρκες, οι εκτιμήσεις για τον διάδοχο είναι περίπου 60-100 τρισ. Η ασυμφωνία μεταξύ της διαθεσιμότητας και της ανάγκης για δεδομένα υψηλής ποιότητας αναδεικνύεται ως σημαντικό εμπόδιο, εκτιμώντας έλλειψη που θα μπορούσε να κυμαίνεται μεταξύ 10 και 20 τρισεκατομμυρίων μάρκες.

Λογότυπο openai σε smartphone σε λευκό φόντο

Αυτό το έλλειμμα ποιοτικών δεδομένων μεταφράζεται σε πραγματικό εμπόδιο για την πρόοδο της τεχνητής νοημοσύνης. Τα συχνά παρωχημένα ή χαμηλής ποιότητας δεδομένα που γεμίζουν τον ιστό αντιπροσωπεύουν ένα σοβαρό όριο για την αποτελεσματικότητα της μηχανικής μάθησης. Επιπλέον, οι περιορισμοί που επιβάλλονται από την πρόσβαση σε δεδομένα από μεγάλες πλατφόρμες απλώς επιδεινώνουν το πρόβλημα, περιορίζοντας περαιτέρω τους διαθέσιμους πόρους για εκπαίδευση γλωσσικά μοντέλα.

Ως απάντηση σε αυτή την πρόκληση, οι στρατηγικές που υιοθετούνται ποικίλλουν από τεχνικές καινοτομίες έως στρατηγικές εταιρικές σχέσεις. Το OpenAI, για παράδειγμα, στοχεύει στην ενίσχυση τουχρησιμοποιώντας δεδομένα ήχου και βίντεο μέσω του εργαλείου αναγνώρισης ομιλίας Whisper, προκειμένου να επεκταθεί η δεξαμενή των διαθέσιμων δεδομένων. Παράλληλα, η εταιρεία διερευνά τη δυνατότητα δημιουργούν συνθετικά δεδομένα ποιότητας που μπορεί να χρησιμεύσει για την κάλυψη του υφιστάμενου κενού.

Gianluca Cobucci
Gianluca Cobucci

Παθιασμένοι με τον κώδικα, τις γλώσσες και τις γλώσσες, τις διεπαφές ανθρώπου-μηχανής. Το μόνο που είναι η τεχνολογική εξέλιξη με ενδιαφέρει. Προσπαθώ να αποκαλύψω το πάθος μου με απόλυτη σαφήνεια, στηριζόμενος σε αξιόπιστες πηγές και όχι «σε πρώτο πέρασμα».

Εγγραφή
Ειδοποίηση
επισκέπτης

0 Σχόλια
Ενσωματωμένα σχόλια
Δείτε όλα τα σχόλια
XiaomiToday.it
Λογότυπο