Meta Çarşamba günü, son teknoloji büyük dil modeli Llama 3.2’nin yükseltildiğini duyurdu ve bu model yalnızca konuşmuyor, aynı zamanda görüyor.
Daha da ilginci, bazı versiyonlar kalite kaybı yaşamadan akıllı telefonunuza sığabiliyor; bu da verilerinizi üçüncü taraf sunuculara göndermeden özel yerel yapay zeka etkileşimlerine, uygulamalara ve özelleştirmelere sahip olabileceğiniz anlamına geliyor.
Çarşamba günü Meta Connec t sırasında tanıtılan Llama 3.2, her biri farklı bir etki yaratan dört farklı versiyonda geliyor. Ağır sıklet yarışmacılar— 11B ve 90B parametre modelleri—hem metin hem de görüntü işleme yetenekleriyle kaslarını esnetiyor.
Grafikleri analiz etme, görsellere başlık ekleme ve hatta doğal dil açıklamalarına dayanarak resimlerdeki nesneleri belirleme gibi karmaşık görevlerin üstesinden gelebilirler.
Llama 3.2, sentetik kıyaslamalarda en iyi açık kaynaklı çok modlu görme LLM’si olduğunu iddia eden Allen Enstitüsü’nün Molmo’suyla aynı hafta geldi ve testlerimizde GPT-4o, Claude 3.5 Sonnet ve Reka Core ile aynı seviyede performans gösterdi.