OpenAI annuncia due nuove funzionalità per ChatGPT: la capacità di elaborare immagini e la capacità di riconoscere e “rispondere” alle voci. La funzionalità verrà implementata nell’arco di due settimane per gli abbonati Plus ed Enterprise.
La nuova funzionalità vocale consente agli utenti di parlare con ChatGPT, dopodiché il modello linguistico di OpenAI parla utilizzando un modello di sintesi vocale. In linea di principio tutte le applicazioni chatbot sono possibili anche tramite funzionalità vocale; Gli utenti possono richiedere storie, spiegazioni, ricette, consigli e informazioni tangibili e ora possono riceverle in forma audio. La funzionalità vocale è abilitata e sarà disponibile solo per le versioni iOS e Android del chatbot. Ciò richiede un abbonamento Plus o Enterprise.
L’azienda consiglia agli utenti Per parlare con ChatGPT in inglese. Anche alcune altre lingue possono essere elaborate dal modello linguistico, ma i risultati saranno comunque migliori in inglese. OpenAI ha basato le cinque voci disponibili su doppiatori reali, ma in linea di principio può imitare qualsiasi voce basandosi su poche frasi. Oggi Spotify ha annunciato che il servizio musicale utilizza la stessa tecnologia per tradurre i podcast.
Inoltre, la società annuncia una funzionalità Immagini che consentirà agli utenti di caricare immagini, documenti e immagini e ChatGPT potrà quindi rispondere dinamicamente in base a queste informazioni visive. Alcuni esempi includono la richiesta di assistenza tecnica durante la messa a punto di una bicicletta, la richiesta di ricette basate sul contenuto del frigorifero o l’analisi di una tabella. Questa funzionalità sarà disponibile per tutte le piattaforme entro le prossime due settimane, sempre a condizione che tu acquisti un abbonamento Plus o Enterprise.
OpenAI afferma che entrambi i lavori comportano anche dei rischi. Ad esempio, i malintenzionati potrebbero teoricamente utilizzare la funzione vocale per imitare persone reali. Pertanto, è l’azienda a determinare la tecnologia utilizzata nella funzionalità di chat vocale di ChatGPT. Inoltre, lo sviluppatore afferma che la funzione fotografica è “significativamente limitata” quando si tratta di rispondere a persone reali.