
Το OpenAI ανακοίνωσε την alpha κυκλοφορία του Η προηγμένη λειτουργία φωνής του ChatGPT, τροφοδοτείται απόκαινοτόμο μοντέλο GPT-4o. Αυτό το επαναστατικό χαρακτηριστικό, που υπόσχεται να προσφέρει υπερρεαλιστικές ηχητικές αποκρίσεις, θα είναι αρχικά προσβάσιμο σε μια μικρή ομάδα χρηστών ChatGPT Plus από σήμερα, με στόχο την επέκταση της διαθεσιμότητας σε όλους τους συνδρομητές Plus μέχρι το φθινόπωρο του 2024.
Λειτουργία φωνής: Η λειτουργία φωνής του ChatGPT είναι επίσημη
Η παρουσίαση της λειτουργίας φωνής με GPT-4o, που έγινε τον Μάιο, είχε προκαλέσει μεγάλο ενδιαφέρον και θαυμασμό στο κοινό, χάρη στην εξαιρετική ταχύτητα παραγωγής και η εντυπωσιακή ομοιότητα με πραγματική ανθρώπινη φωνή, που έχει προκαλέσει συγκρίσεις με αυτή της διάσημης ηθοποιού Σκάρλετ Γιόχανσον.
Το OpenAI αρνήθηκε ότι χρησιμοποίησε τη φωνή της ηθοποιού, αφαιρώντας στη συνέχεια τη φωνή από το demo και ανακοινώνοντας, τον Ιούνιο, ένα αναβάλετε την κυκλοφορία της προηγμένης λειτουργίας φωνής για τη βελτίωση των μέτρων ασφαλείας.
Σε αυτήν τη φάση άλφα, ορισμένες από τις λειτουργίες που εμφανίζονται κατά την εαρινή ενημέρωση, όπως η κοινή χρήση βίντεο και οθόνης, δεν θα συμπεριληφθούν και θα παρουσιαστούν αργότερα. Ωστόσο, α επιλεγμένη ομάδα χρηστών premium θα έχει πρόσβαση στη δυνατότητα φωνής ChatGPT που παρουσιάζεται στην επίδειξη.
Διαβάστε επίσης: SearchGPT: τι είναι η μηχανή αναζήτησης OpenAI και πώς λειτουργεί
Η λειτουργία Advanced Voice διαφέρει από τη λύση ήχου που προσφέρεται αυτήν τη στιγμή από το ChatGPT, η οποία βασίζεται σε τρία διαφορετικά μοντέλα. GPT-4o, χάρη στο δικό του φύση πολυτροπικά, είναι σε θέση να επεξεργαστεί αυτές τις εργασίες χωρίς να καταφύγει σε βοηθητικά μοντέλα, δημιουργώντας φωνητικές αποκρίσεις με ένα Σημαντικά μειωμένη καθυστέρηση. Επιπλέον, το OpenAI υπογραμμίζει την ικανότητα του GPT-4o να αντιλαμβάνονται συναισθηματικές αποχρώσεις στη φωνή, όπως η λύπη και ο ενθουσιασμός, και να αναγνωρίσουμε το τραγούδι.
Για να διασφαλίσει την προσεκτική παρακολούθηση της χρήσης φωνής του ChatGPT, το OpenAI επέλεξε ένα σταδιακή απελευθέρωση. Τα μέλη του προγράμματος Alpha θα λάβουν μια ειδοποίηση στην εφαρμογή ChatGPT, ακολουθούμενη από ένα email που θα περιέχει οδηγίες για τη χρήση της δυνατότητας.
Οι φωνητικές δυνατότητες του GPT-4o έχουν δοκιμαστεί σε 45 γλώσσες, επιδεικνύοντας τη δέσμευση του OpenAI να κάνει αυτή την τεχνολογία προσβάσιμη σε ένα ευρύ διεθνές κοινό. Επιπλέον, η εταιρεία έχει εφαρμόσει νέα φίλτρα για αποτροπή αιτημάτων δημιουργίας μουσικής ή άλλο ηχητικό υλικό που προστατεύεται από πνευματικά δικαιώματα, προστατεύοντας έτσι την πνευματική ιδιοκτησία.
Η βελτιωμένη λειτουργία φωνής του ChatGPT αρχικά θα περιοριστεί σε τέσσερις προκαθορισμένες φωνές από ChatGPT: Juniper, Breeze, Cove και Ember, που δημιουργήθηκε σε συνεργασία με επαγγελματίες ηθοποιούς φωνής. Το ChatGPT δεν θα έχει τη δυνατότητα να μιμείται τις φωνές άλλων ανθρώπων και θα μπλοκάρει κάθε έξοδο που αποκλίνει από αυτές τις προεπιλεγμένες φωνές, διασφαλίζοντας έτσι την ηθική και υπεύθυνη χρήση της τεχνολογίας.