Offcanvas
Offcanvas

Tech

Τεχνητή νοημοσύνη: Η καλά κρυμμένη «συνταγή» – Πώς οι εταιρείες παράγουν φθηνές λύσεις

Τεχνητή νοημοσύνη: Η καλά κρυμμένη «συνταγή» – Πώς οι εταιρείες παράγουν φθηνές λύσεις

Πόσο κοστίζει να ξεκινήσεις μια εταιρεία στην τεχνητή νοημοσύνη; - Η απάντηση κάθε μέρα όλο και λιγότερο

Στο κυνήγι της μείωσης του κόστους επιδίδονται οι εταιρείες τεχνητής νοημοσύνης, αντιγράφοντας πρακτικά τις εργασίες η μία της άλλης για να φτιάξουν όλο και πιο φθηνά γλωσσικά μοντέλα. Άλλωστε, όπως γράφει το business insider, τελικά στην ερώτηση πόσο κοστίζει να ξεκινήσει κάποιος μια εταιρεία AI η απάντηση είναι όλο και λιγότερα, καθώς τα μεγάλα γλωσσικά μοντέλα δημιουργούνται για όλο και μικρότερα ποσά.

Η απόσταξη στην τεχνητή νοημοσύνη

Η τεχνική αυτή, έχει ενθουσιάσει τους πιο μικρούς παίχτες λόγω του ότι μπορεί να δημιουργεί γλωσσικά μοντέλα μειώνοντας το κόστος υπολογιστικής ισχύος. Δεν ισχύει βέβαια ο ίδιος ενθουσιασμός και  για τις μεγάλες πολυεθνικές που έχουν επενδύσει δισεκατομμύρια τεράστια foundation models. Η απόσταξη θεωρείται μια παλιά έννοια που κερδίζει νέα σημασία.

Είναι ένα εργαλείο που χρησιμοποιούν οι προγραμματιστές, μαζί με τη βελτίωση (fine-tuning), για να βελτιώσουν τα μοντέλα κατά τη φάση εκπαίδευσης, αλλά με πολύ μικρότερο κόστος από άλλες μεθόδους. Οι δύο αυτές  τεχνικές χρησιμοποιούνται για να δώσουν στα μοντέλα ειδικές γνώσεις ή ικανότητες. Για τους περισσότερους, είναι καλή είδηση ενώ για άλλους  είναι περίπλοκη.  Σε κάθε περίπτωση για το μέλλον της τεχνητής νοημοσύνης, είναι σημαντική.

Ο ορισμός της απόσταξης

Οι προγραμματιστές και οι ειδικοί της τεχνητής νοημοσύνης ορίζουν την  απόσταξη ως μια διαδικασία στην οποία γίνεται χρήση ενός μοντέλου για να βελτιώσει ένα άλλο. Ένα μεγαλύτερο μοντέλο στο ρόλο του «δασκάλου»,  προτρέπει το σύστημα να παράγει απαντήσεις και μονοπάτια λογικής ενώ και ένα μικρότερο “μαθητευόμενο” μοντέλο μιμείται τη συμπεριφορά του.

Η κινεζική εταιρεία DeepSeek προκάλεσε αίσθηση με τα μοντέλα που θεωρείται ότι εκπαιδεύτηκαν με κόστος περίπου 5 εκατ. δολάρια. Αυτό έστειλε τις χρηματοπιστωτικές αγορές σε πανικό, τιμωρώντας την Nvidia με μια απώλεια 600 δισ.  δολαρίων σε κεφαλαιοποίηση της αγοράς λόγω της πιθανής μείωσης της ζήτησης για τσιπ (αν και αυτή η πτώση δεν έχει υλοποιηθεί ακόμα).

Η ομάδα ερευνητών του Πανεπιστημίου της Καλιφόρνιας, στο Μπέρκλεϊ, εκπαίδευσε δύο νέα μοντέλα με λιγότερο από 1.000 δολάρια σε υπολογιστικό κόστος, όπως ανέφερε η έρευνα τον Ιανουάριο.

Στις αρχές Φεβρουαρίου, ερευνητές από το Πανεπιστήμιο Στάνφορντ, το Πανεπιστήμιο της Ουάσιγκτον και το Allen Institute for AI κατάφεραν να εκπαιδεύσουν ένα μοντέλο λογικής για ένα μικρό κλάσμα αυτού του κόστους, σύμφωνα με έρευνα.

Η απόσταξη  κλειδί για όλες αυτές τις εξελίξεις

Ας πάρουμε για παράδειγμα  ένα γενικό μοντέλο βάσης όπως το Llama της Meta  και τη χρήση ενός άλλου μοντέλου ώστε να το αποστάξει  ένας ειδικό για το αμερικανικό φορολογικό δίκαιο. Επίσης μπορεί να χρησιμοποιηθεί το μοντέλο λογικής R1 της DeepSeek για να αποσταγεί από το Llama, προσθέτοντας περισσότερες ικανότητες λογικής. Το AI παίρνει περισσότερο χρόνο για να παράξει μια απάντηση, αμφισβητώντας τη δική του λογική και αναλύει τη διαδικασία για να φτάσει σε μια άλλη απάντηση βήμα προς βήμα.

“Ίσως το πιο ενδιαφέρον κομμάτι του R1 ήταν ότι καταφέραμε να μετατρέψουμε μικρότερα μοντέλα που δεν κάνουν λογική σε μοντέλα λογικής μέσω της βελτίωσής τους με εξόδους από ένα μοντέλο λογικής”, ανέφεραν αναλυτές της SemiAnalysis τον Ιανουάριο.

Εκτός από την προσιτή τιμή — τουλάχιστον για την τεχνητή νοημοσύνη — η DeepSeek δημοσίευσε αποσταγμένα μοντέλα άλλων ανοιχτών πηγών χρησιμοποιώντας το μοντέλο λογικής R1 ως “δάσκαλο”. Τα πλήρη μοντέλα της DeepSeek, καθώς και οι μεγαλύτερες εκδόσεις του Llama, είναι τόσο μεγάλα που μόνο συγκεκριμένος εξοπλισμός μπορεί να τα τρέξει. Η απόσταξη βοηθά και σε αυτό.

“Το αποσταγμένο μοντέλο έχει μικρότερο αποτύπωμα, λιγότερους παραμέτρους, λιγότερη μνήμη”, είπε ο Σαμίρ Κουμάρ, γενικός εταίρος της Touring Capital. “Μπορείς να το τρέξεις στο τηλέφωνό σου. Μπορείς να το τρέξεις σε συσκευές άκρης.”

Η ανακάλυψη της DeepSeek ήταν ότι τα αποσταγμένα μοντέλα δεν χειροτέρεψαν καθώς γίνονταν μικρότερα, όπως αναμενόταν, αντίθετα, έγιναν καλύτερα.

Η απόσταξη δεν είναι νέα απλά έχει αλλάξει

Η τεχνική της απόσταξης εμφανίστηκε για πρώτη φορά σε μια εργασία του 2015 από τους διάσημους βετεράνους της Google AI, Τζεφ Ντιν και Τζεφρί Χίντον, και τον αντιπρόεδρο έρευνας της DeepMind, Όριολ Βινιάλς.

Ο Βινιάλς δήλωσε πρόσφατα ότι η εργασία απορρίφθηκε από το prestigious συνέδριο NeurIPS γιατί δεν θεωρήθηκε ότι είχε σημαντικό αντίκτυπο στον τομέα. Δέκα χρόνια αργότερα, η απόσταση είναι ξαφνικά στην κορυφή της συζήτησης για την τεχνητή νοημοσύνη. Αυτό που κάνει την απόσταξη τόσο ισχυρή τώρα, σε αντίθεση με τότε, είναι ο αριθμός και η ποιότητα των ανοιχτών πηγών μοντέλων που χρησιμοποιούνται ως “δασκάλοι”.

Θερριεύει ο ανταγωνισμός

Η απόσταξη έχει φέρει ευκαιρίες, αλλά αναμένεται να συναντήσει αντιδράσεις λόγω της απειλής που θέτει στα τεράστια, ακριβά, ιδιόκτητα μοντέλα όπως εκείνα που κατασκευάζονται από την OpenAI και την Anthropic.  Υπάρχουν επίσης πιο επιθετικές τακτικές που μπορεί να ακολουθήσουν οι εταιρείες μοντέλων βάσης, όπως ανέφεραν  ερευνητές της Google DeepMind. Οι εταιρείες με μοντέλα λογικής θα μπορούσαν να αφαιρέσουν ή να μειώσουν τα βήματα ή “ίχνη” λογικής που παρουσιάζονται στον χρήστη, ώστε να μην μπορούν να χρησιμοποιηθούν για απόσταξη. Η OpenAI κρύβει το πλήρες μονοπάτι λογικής στο μεγάλο μοντέλο λογικής o1, αλλά έχει κυκλοφορήσει έκδοση μικρότερη, το o3-mini, που δείχνει αυτές τις πληροφορίες.

Παρόλα αυτά, είναι εξαιρετικά δύσκολο να κλειστεί το «τζίνι» της απόσταξης πίσω στο λυχνάρι, καθώς η ανοιχτή άγρια δύση της τεχνητής νοημοσύνης είναι πλέον γεγονός

Πηγή: ot.gr

Διαβάστε επίσης: Ευρώπη: Ποιες βιομηχανίες θα επιβιώσουν της πράσινης μετάβασης; (γράφημα)

Τελευταία Νέα

Τελευταία νέα

Στενά του Ορμούζ: Έλλειψη δεξαμενόπλοιων απειλεί την παγκόσμια προσφορά πετρελαίου

Στενά του Ορμούζ: Έλλειψη δεξαμενόπλοιων απειλεί την παγκόσμια προσφορά πετρελαίου

Η έλλειψη διαθέσιμων δεξαμενόπλοιων και η παράλυση στα Στενά του Ορμούζ απειλούν με αναγκαστικές διακοπές παραγωγής στον…

Deutsche Bank: Πότε θα πρέπει να ανησυχήσουν οι αγορές - Τα 3 σημάδια

Deutsche Bank: Πότε θα πρέπει να ανησυχήσουν οι αγορές - Τα 3 σημάδια

Οι τρεις προϋποθέσεις που ιστορικά οδηγούν σε βαθιά πτώση του S&P 500 και τι πρέπει να φοβούνται τώρα οι επενδυτές σύμφωνα…

Επιστολή Συνδέσμου Τυροκόμων στα αρμόδια Υπουργεία για λήψη άμεσων και προληπτικών μέτρων για τον αφθώδη πυρετό

Επιστολή Συνδέσμου Τυροκόμων στα αρμόδια Υπουργεία για λήψη άμεσων και προληπτικών μέτρων για τον αφθώδη πυρετό

Ο Σύνδεσμος ζητεί την ανάκληση ή/και προσωρινή αναστολή λειτουργίας κτηνοτροφικών μονάδων που βρίσκονται εντός της Νεκρής…

Μαζική φυγή από το Ντουμπάι: Πλούσιοι εγκαταλείπουν την πόλη με ιδιωτικά τζετ των €85.000

Μαζική φυγή από το Ντουμπάι: Πλούσιοι εγκαταλείπουν την πόλη με ιδιωτικά τζετ των €85.000

Ιρανικές επιθέσεις και κλείσιμο αεροδρομίου στο Ντουμπάι πυροδοτούν μαζική φυγή εύπορων κατοίκων με ιδιωτικά τζετ, εκτίναξη…

Τράπεζα Κύπρου: Από 90% έως 100% μέρισμα για το 2026-2028

Τράπεζα Κύπρου: Από 90% έως 100% μέρισμα για το 2026-2028

Τι αναφέρει στο Business Plan - Για τo 2026, στοχεύει σε συνήθη διανομή ύψους 70%, στο ανώτατο όριο της πολιτικής διανομής,…

Τρεις ασθενείς ζήτησαν επαναπατρισμό από το Ισραήλ - Τι αναφέρει ο ΟΑΥ

Τρεις ασθενείς ζήτησαν επαναπατρισμό από το Ισραήλ - Τι αναφέρει ο ΟΑΥ

Τι γίνεται με τους ασθενείς που βρίσκονται στο Ισραήλ εν μέσω βομβαρδισμών - Τρεις ζήτησαν να επιστρέψουν, αξιολογείται η…

Πιέσεις στα ευρωομόλογα – Οι traders «ζυγίζουν» την αύξηση στις τιμές ενέργειας

Πιέσεις στα ευρωομόλογα – Οι traders «ζυγίζουν» την αύξηση στις τιμές ενέργειας

Η «εκτίναξη» των τιμών φυσικού αερίου και πετρελαίου αναζωπυρώνει τους φόβους για στασιμοπληθωρισμό - Αυξάνονται οι πιθανότητες…

Έχουν θανατωθεί 1.300 αιγοπρόβατα - Εκκρεμεί η θανάτωση 2.700

Έχουν θανατωθεί 1.300 αιγοπρόβατα - Εκκρεμεί η θανάτωση 2.700

Μέχρι στιγμής δεν υπάρχει άλλο κρούσμα πέραν από αυτά στις 22 μονάδες στην επαρχία Λάρνακας, ανέφερε η εκπρόσωπος Τύπου των…

CLOSE X
CLOSE X
CLOSE X