Geçtiğimiz hafta boyunca, OpenAI’nin AI modeli hiyerarşisindeki yeri Çinli model DeepSeek tarafından ciddi şekilde tehdit edildi . OpenAI bugün, en son simüle edilmiş akıl yürütme modeli ve şirketin abonelik olmadan tüm kullanıcılara ücretsiz olarak sunacağı türünün ilk örneği olan o3-mini’nin genel sürümüyle karşılık verdi.
Geçtiğimiz ay ilk kez duyurulan OpenAI, bugünkü duyurusunda o3-mini’nin “küçük modellerin başarabileceklerinin sınırlarını ilerlettiğini” söylüyor. OpenAI, Eylül ayındaki o1-mini gibi , modelin de STEM işlevleri için optimize edildiğini ve o1-mini’den daha düşük işletme maliyetleri ve gecikmeye rağmen “bilim, matematik ve kodlamada özel bir güç” gösterdiğini söylüyor.
Kullanıcılar o3-mini kullanırken üç farklı “muhakeme çabası seçeneği” arasından seçim yapabilir ve bu da göreve bağlı olarak gecikme ve doğruluk arasında ince ayar yapmalarına olanak tanır. OpenAI’ye göre bu muhakeme seviyelerinin en düşüğü genellikle matematik ve kodlama kıyaslamalarında o1-mini ile karşılaştırılabilir doğruluk seviyeleri gösterirken, en yükseği aynı testlerde tam teşekküllü o1 modelini yakalar veya geçer.

OpenAI, test edenlerin o1-mini’ye kıyasla o3-mini kullanırken “büyük hatalarda” %39 azalma bildirdiğini ve o3-mini yanıtlarını %56 oranında tercih ettiğini söylüyor. Bu, o3-mini’nin orta versiyonunun o1-mini’den ortalama %24 daha hızlı yanıt süresi sunmasına rağmen böyle – 10,16 saniyeden 7,7 saniyeye düştü.
OpenAI ayrıca o3-mini’nin uygun durumlarda “ilgili web kaynaklarına bağlantılar içeren güncel yanıtları bulmasını” sağlayan bir arama fonksiyonunun “erken prototipini” sunacağını vaat ediyor.
OpenAI’nin Plus, Team veya Pro katmanlarına abone olanlar, bugün itibarıyla model seçeneklerinde o1-mini’nin yerini o3-mini’nin aldığını görecekler. Plus ve Team aboneliği olanlar, o1-mini için günlük 50 mesaj sınırından yeni modelde günde 150 mesajla sınırlı olacak.
Ücretli aboneliği olmayan kullanıcılar da ChatGPT arayüzündeki açılır menüden “Mantık” seçeneğini seçerek modele erişebilecekler; bu, şirketin simüle edilmiş bir akıl yürütme modelini ücretsiz kullanıcılara ilk kez sunması anlamına geliyor.