Σας ενδιαφέρουν ΠΡΟΣΦΟΡΕΣ? Εξοικονομήστε χρήματα με τα κουπόνια μας WhatsApp o ΤΗΛΕΓΡΑΦΗΜΑ!

Το Llama 3 προκαλεί τους γίγαντες: εδώ είναι το νέο μοντέλο AI της Meta

Απρίλιος 18 2024

Η Meta πρόσθεσε δύο νέα γλωσσικά μοντέλα στη σειρά του: Λάμα 3 8Β e Λάμα 3 70Β. Αυτά υπόσχονται ανώτερες επιδόσεις στον κόσμο της τεχνητής νοημοσύνης. Τα πιο εντυπωσιακά νέα; Η παρουσία 8 δισεκατομμυρίων και 70 δισεκατομμυρίων παραμέτρων αντίστοιχα. Αυτοί οι αριθμοί αντιπροσωπεύουν την πολυπλοκότητα και την ικανότητα του μοντέλου να χειρίζεται και διαδικασίας πληροφορίες.

Το Llama 3 δεν είναι μόνο δύο μοντέλα: περισσότερο υλικό είναι στο δρόμο

Ο Meta δεν σταματά εκεί. σχεδιάζει να κυκλοφορήσει περισσότερα μοντέλα της σειράς Llama 3, αλλά χωρίς να προσδιορίζεται ημερομηνία. Αυτή η στρατηγική δημιουργεί προσμονή και επίσης καταδεικνύει τη δέσμευση της εταιρείας να βελτιώνει συνεχώς τις προσφορές της.

I νέα μοντέλα Llama περιγράφονται ως ένα άλμα από προηγούμενα μοντέλα. Αυτή η βελτίωση οφείλεται εν μέρει στη χρήση του δύο προσαρμοσμένα συμπλέγματα GPU, το καθένα με 24.000 μονάδες, γεγονός που επέτρεψε στα μοντέλα να εκπαιδεύονται πιο αποτελεσματικά και με ακρίβεια. Η Meta ισχυρίζεται ότι, λόγω του αριθμού των παραμέτρων που διαθέτουν, αυτά τα μοντέλα είναι από τα καλύτερα διαθέσιμα σήμερα για τη γενετική τεχνητή νοημοσύνη.

Η απόδοση του Llama 3 μετρήθηκε μέσω διαφόρων σημείων αναφοράς AI, τα οποία είναι τυποποιημένα τεστ που χρησιμοποιούνται για την αξιολόγηση των δυνατοτήτων των μοντέλων AI. Αυτά περιλαμβάνουν MMLU για γνώση, ARC για την απόκτηση δεξιοτήτων, π DROP για συλλογισμούς σχετικά με τμήματα κειμένου. Αν και υπάρχουν διαφορετικές απόψεις σχετικά με τη χρησιμότητα αυτών των σημείων αναφοράς, παραμένουν μια κοινή μέθοδος για την αξιολόγηση και τη σύγκριση των δυνατοτήτων των μοντέλων τεχνητής νοημοσύνης.

Συγκεκριμένα, το Llama 3 8B ξεπέρασε παρόμοια μοντέλα ανοιχτού κώδικα με λιγότερες παραμέτρους, όπως το Mistral και Google Gemma, σε τουλάχιστον εννέα διαφορετικά σημεία αναφοράς. Αυτό περιλαμβάνει τεστ γενικών γνώσεων, συλλογισμού και ειδικών δεξιοτήτων σε τομείς όπως η βιολογία, η φυσική, η χημεία, ακόμη και η δημιουργία κώδικα και τα μαθηματικά προβλήματα. Κάτι που το GPT-4, για παράδειγμα, δεν μπορεί να κάνει πολύ καλά.

Το μεγαλύτερο μοντέλο, το Llama 3 70B, όχι μόνο ανταγωνίζεται αλλά σε ορισμένες περιπτώσεις ξεπερνά τα κορυφαία μοντέλα όπως π.χ. Gemini 1.5 Pro από την Google σε διάφορες δοκιμές, αποδεικνύοντας ότι παρά τον έντονο ανταγωνισμό, μπορεί να αντέξει ακόμη και τους κολοσσούς του κλάδου. Ωστόσο, είναι σημαντικό να σημειωθεί ότι ενώ υπερτερεί σε ορισμένα βασικά μοντέλα όπως π.χ Claude 3 Sonnet του Anthropic σε αρκετές δοκιμές, δεν φτάνει τις επιδόσεις του πιο προηγμένου μοντέλου Claude 3 Opus.