Microsoft va oferi o inteligentă artificială care transformă fotografiile în videoclipuri cu „fete vorbitoare”

20.04.2024 - Cercetătorii Microsoft au dezvoltat o tehnologie de inteligență artificială (AI) care va transforma o fotografie a unei fețe și un eșantion de voce într-un videoclip ultrarealist al unei „fețe care vorbește”, potrivit unui document publicat de gigantul IT în această săptămână, scrie Le Figaro.
„Scopul nu este de a crea conținut menit să inducă în eroare sau să înșele”, precizează compania, dar recunoaște că, la fel ca „alte tehnici de generare de conținut, ar putea fi folosită în mod abuziv pentru a uzurpa identitatea unei ființe umane”.
Dezvoltarea rapidă a inteligenței artificiale generative, care facilitează producerea cu ușurință a tuturor tipurilor de conținut (text, imagini, sunet etc.) de o calitate uluitoare, dă naștere la numeroase preocupări, în special în ceea ce privește exploatarea pentru fraudă și dezinformare. „Cercetările noastre se concentrează asupra (…) avatarurilor virtuale, în vederea unor aplicații pozitive”, asigură Microsoft. „Ne opunem oricărui comportament care vizează crearea de conținut înșelător sau dăunător din partea unor persoane reale”.
Prin urmare, firma de IT, principalul investitor în OpenAI (ChatGPT), nu intenționează să pună la dispoziție noul instrument sau să furnizeze informații tehnice „până când nu vom fi siguri că tehnologia va fi utilizată în mod responsabil și în conformitate cu reglementările în vigoare”. Denumit VASA-1, programul informatic ia o simplă fotografie portret și un fișier audio și le convertește într-un videoclip în care chipul prinde viață și vorbește într-un mod hiperrealist. În exemplele postate online – previzualizări bazate pe imagini ale unor personaje virtuale – mișcările buzelor sunt sincronizate, trăsăturile feței sunt convingătoare, iar mișcările capului sunt puțin sacadate, dar totuși impresionante.
Și alte companii lucrează la această tehnologie, cum ar fi Runway, unul dintre specialiștii în inteligența artificială generativă pentru video. Cercetătorii de la Google au creat, de asemenea, un model de inteligență artificială, Vlogger, care poate genera videoclipuri realiste cu capete vorbitoare. Potrivit Microsoft, beneficiile dezvoltării acestei tehnologii „cum ar fi creșterea echității în educație, îmbunătățirea accesibilității pentru persoanele cu dificultăți de comunicare, oferirea de sprijin terapeutic pentru persoanele care au nevoie, printre altele” justifică efectuarea acestor cercetări. 

sursa: G4Media