Microsoft VASA-1: Gerçek Zamanlı Olarak Oluşturulan Gerçekçi Ses ile Konuşan Yüzler

19 Nisan 2024

391

Microsoft tek bir statik görüntü ve bir konuşma ses klibi ile, çekici görsel duygusal becerilere (Visual Affective Skills -VAS) sahip sanal karakterlerin gerçeğe yakın konuşan yüzlerini oluşturmaya yönelik bir yapay zeka modeli olan VASA’yı tanıttı.

İlk model VASA-1, yalnızca sesle mükemmel şekilde senkronize edilmiş dudak hareketleri üretmekle kalmıyor, aynı zamanda özgünlük ve canlılık algısına katkıda bulunan geniş bir yelpazedeki yüz nüanslarını ve doğal baş hareketlerini de taklit ediyor.

Yeni model yalnızca gerçekçi yüz ve kafa dinamikleriyle yüksek video kalitesi sunmakla kalmıyor, aynı zamanda ihmal edilebilir başlangıç gecikmesiyle 40 FPS’ye kadar 512×512 videoların çevrimiçi oluşturulmasını da destekliyor. İnsanların konuşma davranışlarını taklit eden gerçekçi avatarlarla gerçek zamanlı etkileşimlerin önünü açıyor. VASA-1 bu performansını NVIDIA RTX 4090 ile sağlaybiliyor.

Ve Microsoft sayfada gördüğünüz tüm portre görselleri, StyleGAN2 veya DALL·E-3 (Mona Lisa hariç) tarafından oluşturulan sanal, var olmayan kimlikler olduğunu söylüyor. Sanal, etkileşimli karakterler için görsel duygusal beceri oluşturmayı araştırdığını ve herhangi bir ürün veya API planlarının olmadığını söylüyor.

Tags
Microsoft

Önceki İçerik

Yeni şarj algoritması li-ion pillerin ömrünü iki katına çıkarabilir

Sonraki İçerik

GPU-Z Download v2.59.0

Benzer İçerikler

Microsoft VASA-1: Gerçek Zamanlı Olarak Oluşturulan Gerçekçi Ses ile Konuşan Yüzler

Microsoft ve NVIDIA yapay zekâyı beslemek için nükleer santral kuracak

Microsoft’tan geri adım: Windows 11 için büyük performans ve arayüz güncellemeleri yolda

Nintendo’dan AB’ye özel Switch 2 hamlesi: Çıkarılabilir bataryalı model yolda

Yorum Yap İptal

Haberler

PS5 Pro’nun gizli gücü PSSR, FSR 4’ün izinden gidiyor

Microsoft ve NVIDIA yapay zekâyı beslemek için nükleer santral kuracak

NVIDIA GeForce 595.97 WHQL sürücüsü yayınlandı

Microsoft, Windows 11’de çevrimiçi hesap zorunluluğunu kaldırabilir

AMD’den DLSS’e rakip: FSR 4.1 ve Ray Regeneration 1.1

Son Yorumlar