Meta Platforms ha utilizzato post pubblici su Facebook e Instagram per addestrare il suo nuovo assistente virtuale Meta AI, ma ha escluso i post privati condivisi solo con familiari e amici nel tentativo di rispettare la privacy dei consumatori, ha affermato il chief policy officer dell’azienda in un’intervista a Reuters.
Inoltre, Meta non ha utilizzato le chat private sui suoi servizi di messaggistica come dati di formazione per il modello e ha adottato misure per filtrare i dati privati dai set di dati pubblici utilizzati per la formazione, ha affermato Nick Clegg, responsabile degli affari globali di Meta, parlando a margine dell’evento di quest’anno. . La settimana della conferenza annuale Connect dell’azienda.
“Abbiamo cercato di escludere set di dati con un’elevata preponderanza di informazioni personali”, ha affermato Clegg, aggiungendo che la “stragrande maggioranza” dei metadati utilizzati per la formazione era disponibile al pubblico.
Ha citato LinkedIn come esempio di un sito web i cui contenuti Meta consapevolmente non ha voluto utilizzare per motivi di privacy.
I commenti di Clegg arrivano mentre le aziende tecnologiche, tra cui Meta, OpenAI e Google di Alphabet, sono state criticate per aver utilizzato informazioni ottenute da Internet senza autorizzazione per addestrare i loro modelli di intelligenza artificiale, che ingeriscono enormi quantità di dati per riassumere le informazioni e creare immagini.
Le aziende stanno valutando come gestire il materiale proprietario o protetto da copyright che i loro sistemi di intelligenza artificiale potrebbero riprodurre nel processo, mentre allo stesso tempo devono affrontare azioni legali da parte di autori che le accusano di violazione del copyright.
Meta AI è stato il prodotto principale tra i primi strumenti di intelligenza artificiale consumer svelati dal CEO Mark Zuckerberg mercoledì alla conferenza annuale sui prodotti di Meta, Connect. Le conversazioni sull’intelligenza artificiale hanno dominato l’evento di quest’anno, a differenza delle conferenze precedenti incentrate sulla realtà aumentata e virtuale.
Meta ha creato l’assistente utilizzando un modello personalizzato basato sul potente modello linguistico principale Llama 2 che la società ha rilasciato per uso commerciale generale a luglio, ha affermato la società.
L’assistente può generare testo, audio, immagini e accedere a informazioni in tempo reale attraverso una partnership con il motore di ricerca Bing di Microsoft.
I post pubblici su Facebook e Instagram utilizzati per addestrare la Meta AI includevano testo e immagini, ha affermato Clegg.
Ha detto che Meta ha anche imposto restrizioni di sicurezza sui contenuti che lo strumento poteva creare, come proibire la creazione di immagini realistiche di personaggi pubblici.
Per quanto riguarda il materiale protetto da copyright, Clegg ha affermato di aspettarsi “una discreta quantità di controversie” sulla questione “se il contenuto creativo rientri o meno nell’attuale dottrina del fair use”, che consente un uso limitato di opere protette da copyright per scopi come commentare, ricercare e pubblicare. . Parodia.
“Crediamo che sia così, ma dubito fortemente che ciò porterà ad una causa”, ha detto Clegg.
Alcune aziende dotate di strumenti di generazione di immagini semplificano la riproduzione di personaggi famosi come Topolino, mentre altre hanno pagato per i materiali o hanno deliberatamente evitato di includerli nei dati di addestramento.
Ad esempio, quest’estate OpenAI ha firmato un accordo di sei anni con il fornitore di contenuti Shutterstock per utilizzare le librerie di foto, video e musica dell’azienda per la formazione.
Alla domanda se Meta avesse adottato tali misure per impedire la riproduzione di immagini protette da copyright, un portavoce di Meta ha sottolineato i nuovi termini di servizio che impediscono agli utenti di creare contenuti che violano la privacy e i diritti di proprietà intellettuale.