Visual ChatGPT

Visual ChatGPT: ChatGPT sta imparando a disegnare

Microsoft Research Asia (MSR Asia), il più grande ed attivo istituto di ricerca Microsoft al di fuori degli Stati Uniti, è a lavoro su un nuovo progetto (nome in codice: \textbf{Visual ChatGPT}) che consentirà a ChatGPT di elaborare o generare immagini dal mondo visivo (Visual ChatGPT).

Grazie all’integrazione di modelli visuali di apprendimento automatico profondo (come, ad esempio, Stable Diffusion), gli utenti saranno in grado di interagire con ChatGPT, non solo mediante l’invio e la ricezione di messaggi scritti, ma, anche e soprattutto, attraverso disegni ed immagini. Potranno fare “domande visive” complesse o fornire, addirittura, istruzioni di editing visivo, attività, queste, che richiedono la collaborazione di più modelli di Intelligenza Artificiale contemporaneamente (multi-livello).

Visual ChatGPT: il punto della situazione

Al momento, il team di progetto di Microsoft sta testando, sembrerebbe con grande successo, una serie di prompt per attivare questa nuova forma di interazione, servendosi, come dicevamo poco fa, di modelli di apprendimento visuale (Visual Foundation Models) incredibilmente complessi, ovvero di una serie di algoritmi di deep learning pre-addestrati con una quantità quasi inimmaginabile di dati.

La ricerca è pubblicamente disponibile all’indirizzo “Visual ChatGPT: Talking, Drawing and Editing with Visual Foundation Models”, dove troverete anche una dettagliata descrizione dell’architettura della soluzione ed una demo, davvero esplicativa, delle sue enormi potenzialità.


Pubblicato

in

da