Apple ha rilasciato il proprio modello linguistico che può essere eseguito in modo nativo sui propri dispositivi. OpenELM è un modello generico che consente agli sviluppatori di creare un'intelligenza artificiale produttiva. Questo è un modello piccolo, necessario per il funzionamento locale.
Apri ELM, O Modelli linguistici open source efficientiLui Modello linguistico piccolo È adatto principalmente per la generazione di testo tramite intelligenza artificiale. Apple non dice esplicitamente per cosa intende utilizzare lo strumento, ma è probabile che l'azienda voglia creare applicazioni AI che possano essere eseguite in modo nativo su iPhone o Macbook. Apple aveva precedentemente affermato che si sarebbe unita alla mischia anche per l’intelligenza artificiale generativa, ma è sempre stata vaga al riguardo.
Il modello OpenELM è costituito da quattro diversi tipi. Hanno tutti una dimensione diversa. Le dimensioni del modello variano da 270 milioni, 450 milioni, 1,1 miliardi e 3 miliardi di parametri. Per fare un confronto: il modello linguistico finale di grandi dimensioni che Meta vuole inserire in WhatsApp conterrà tra 7 e 400 miliardi di parametri. Ciò è possibile se i modelli vengono eseguiti nel cloud, ma sono necessari modelli più piccoli per l'elaborazione locale. Sempre più aziende si concentrano non solo su modelli di grandi dimensioni, ma anche su modelli più piccoli. Microsoft, ad esempio, lo ha fatto all’inizio di questa settimana.
Apple ha Ha scritto un articolo su come funziona il modello Dice che il modello sarà disponibile open source. OpenELM è addestrato, tra le altre cose, su Set di dati Web raffinato E da parte di Pigiama rosso, una raccolta di articoli, libri e informazioni principalmente in inglese da piattaforme come GitHub, Wikipedia e StackExchange. Inoltre, il modello viene addestrato Dati da Reddit e Project Gutenberg.