Google Cloud sta lanciando aggiornamenti completi al suo portafoglio Vertex AI, volti a migliorare i modelli esistenti e introdurre nuove funzionalità. L’aggiornamento più notevole è la disponibilità generale di Gemini 1.5 Pro, un software LLM avanzato con una finestra contestuale di 2 milioni di token. Inoltre, il convertitore da testo a immagine Imagen 3 sarà disponibile per l’anteprima.
Gemini 1.5 Pro ha una finestra contestuale di 2 milioni di token, che lo rende adatto all’elaborazione di grandi quantità di dati contemporaneamente, siano essi testo, immagini o video. Pensa a enormi librerie di codici, video lunghi o una libreria capovolta per una buona libreria di ricerca.
Sarà generalmente disponibile anche la versione più semplice di Gemini 1.5 Flash. Questo modello promette bassa latenza e un costo interessante. Fornisce una finestra contestuale di 1 milione di token e, secondo Google, è particolarmente adatto per attività pratiche come chatbot in ambienti di vendita al dettaglio, analisi di documenti e scansione di modesti silos di dati.
Secondo Google, Gemini 1.5 Flash ha una finestra contestuale 60 volte più grande del suo concorrente GPT 3.5 Turbo, che è un modello simile. Sarà inoltre più veloce del 40% rispetto al concorrente OpenAI con 10.000 caratteri di input e quattro volte più economico in termini di input.
Fondazioni più efficaci e input da parte di terzi
Naturalmente, basarsi sul contesto fornito dal cliente era già possibile, ma ora è possibile anche con informazioni specifiche di noti fornitori di conoscenze, come l’agenzia di rating del credito Moody’s, l’indice azionario MSCI, Thomson Reuters e Zoominfo.
Se desideri installare Gemini basandoti su informazioni generali e aggiornate, puoi ricorrere all’integrazione con la ricerca di Google. Ciò consente di fornire informazioni specifiche e aggiornate al modello utente, in base ai risultati tramite il popolare motore di ricerca dell’azienda. La nuova modalità di messa a terra ad alta precisione consente inoltre agli utenti di aumentare la precisione durante tali operazioni. Quest’ultima aggiunta è ancora un’anteprima beta.
Google vuole offrire agli utenti di Vertex AI la necessaria libertà di scelta. Coloro che preferiscono utilizzare il modulo Claude 3.5 Sonnet di Anthropic su Google Forms ma vogliono comunque rimanere nella suite Vertex AI possono sbizzarrirsi. Il modulo può ora essere utilizzato qui. Successivamente, i modelli Mistral AI Mistral Small, Mistral Large e Mistral Codestral arriveranno alla scuderia Vertex AI.
Il fratellino sta crescendo
Un altro aggiornamento importante riguarda Gemma 2, il fratello open source di Gemini rivolto agli sviluppatori. La nuova versione sarà presto disponibile nelle versioni da 9 miliardi (9B) e 27 miliardi (27B) di parametri. Google ha affermato che questa espansione significa che il modello può gestire compiti più complessi e fornire risultati dettagliati e più accurati.
Google offre anche una funzionalità di memorizzazione nella cache del contesto sia per Gemini 1.5 Pro che per Flash, che consente di memorizzare nella cache i contesti utilizzati di frequente. Ciò riduce i costi di immissione dei dati e fornisce risposte più rapide in contesti completi. In breve, potete elaborare grandi quantità di dati in modo efficiente e allo stesso tempo risparmiare denaro.
consiglio: Google suggerisce la prossima grande mossa per i titolari di LLM con Infini interessati
Un altro modo per tenere sotto controllo i crescenti costi dei carichi di lavoro dell’intelligenza artificiale è includere il throughput disponibile. Questo è un modo per aumentare la pressione del carico di lavoro un po’ più o meno a seconda delle necessità. Si tratta essenzialmente di una tecnologia che consente di risparmiare sui costi ed è disponibile solo nell’ambiente Google per i modelli proprietari dell’azienda.
Generatore di immagini avanzato
E vale sicuramente la pena notare nella montagna di annunci di Google: il creatore di immagini Imagen 3 è ora disponibile per l’anteprima. Abbiamo già scritto di questa funzionalità. Imagen 3 è un modello da testo a immagine che crea immagini realistiche basate su istruzioni dettagliate. È anche possibile creare immagini che assomigliano a disegni, cartoni animati, pixel art o animazioni con l’argilla.
Google indica esplicitamente la possibilità di inserire testo nelle immagini utilizzando Imagen 3, come iscrizioni su edifici o stampe su vestiti. È qui che a volte le cose andavano storte con gli strumenti di intelligenza artificiale, che non sapevano davvero cosa fare con quel testo.
Leggi anche: Google Cloud vuole mantenere rapidamente le promesse dell’intelligenza artificiale