Bir İngiliz startup’ı bugün, sanal ile gerçek arasındaki sınırları bulanıklaştıran yeni yapay zeka avatarlarını duyurdu. İngiltere merkezli Synthesia adlı şirket, “Duygusal Avatarlar” projesiyle piyasadaki en gerçekçi duygusal ifadeleri vaat ediyor.
Gerçek aktörlerin görüntülerinden eğitilen bir yapay zeka modeli tarafından oluşturulan avatarlar, video oluşturmak amacıyla geliştirildi. Kullanıcılar sadece bir metin girdisi yaparak avatarların insan benzeri duygularla ekranda metni okumasını sağlayabiliyorlar.
Avatarların fotoğraftan gerçekçi renderları oldukça etkileyici. Ancak onları farklı kılan özellikleri, insan duygularını ifade edebilme yetenekleri.
Synthesia’nın yapay zeka modelleri, metin içindeki duyguları çıkarmak için “otomatik duygu tahmini” adı verilen bir teknik kullanıyor. Bu, avatarların ses tonunu, vücut dilini ve yüz ifadesini belirlemelerini sağlıyor.
Avatarlar her zaman tamamen yeni ve benzersiz çıktılar üretecek şekilde tasarlandı. Aynı senaryoyu iki kez verilse bile iki farklı performans sergiliyorlar. Pazartesi günü gerçekleşen bir ürün demosunda, avatarların oyunculuk yetenekleri sergilendi.
Eleştirmenlerin ortak görüşüne göre, Synthesia’nın avatarları şimdiye kadar piyasada gördükleri en iyi yapay zeka aktörleri oldu. Fotoğraftan gerçekçi yüzlerin, duygusal jestlerin, ifadeli seslerin ve senkronize hareketlerin birleşimi büyük övgü aldı.
Neşeli bir senaryo verildiğinde, avatarlar gülümseme ve enerjik bir ton sundu. Daha üzücü satırlar verildiğinde ise hüzünlü bir tonlama ve daha yavaş bir konuşma sergilediler.
Ancak, performansları eleştirmenler tarafından tam not almadı. Ana eksiklikleri, duyguların abartılı şekilde ifade edilmesi oldu. Başka bir dezavantajları ise hareketlerinin sadece baş, yüz ve omuzlarla sınırlı olmasıydı. Yorumcular şu aşamada, avatarların sadece haber sunucuları için uygun olduğunu, diğer sektörlerde ise oyunculuk performansından uzak olduklarını belirttiler.