Google’ın Yeni Yapay Zeka Modeli Gemini 3.1 Pro ile Akıl Yürütme Devrimi

Google’ın Yeni Yapay Zeka Modeli: Gemini 3.1 Pro

Google, yapay zeka alanındaki yeniliklerini sürdürerek Gemini 3.1 Pro sürümünü piyasaya sürdü. Bu güncelleme, 2023 yılının perşembe günü itibarıyla hem geliştiricilere hem de son kullanıcılara sunuldu. Kasım ayında tanıtılan Gemini 3’ün devamı niteliğindeki bu model, özellikle akıl yürütme ve problem çözme becerilerine odaklanıyor. Ayrıca, Google’ın geçtiğimiz günlerde paylaştığı Deep Think güncellemesinin temelini de bu model oluşturuyor.

Google'ın Yeni Yapay Zeka Modeli Gemini 3.1 Pro ile Akıl Yürütme Devrimi

Gemini 3.1 Pro’nun yetenekleri, benchmark sonuçları üzerinden değerlendiriliyor. Bu testler, geçmiş sürümle kıyaslandığında yalnızca küçük iyileştirmeler sunmakla kalmayıp, bazı alanlarda belirgin sıçramalar da gösteriyor. Özellikle, ileri seviye bilgiyi ölçen Humanity’s Last Exam testinde, Gemini 3.1 Pro yüzde 44,4 puan aldı. Bu, bir önceki sürüm olan Gemini 3’ün yüzde 37,5 ile elde ettiği sonuçtan önemli bir yükseliş. Aylık güncellemeleri ile bilinen OpenAI’nin GPT 5.2 modeli ise yüzde 34,5 gibi bir skorla geri planda kalıyor.

Bunun yanı sıra, Google’ın ARC-AGI-2 testine de özel bir önem atfettiği dikkat çekiyor. Bu test, modellerin eğitim verilerini ezberleyip geçemeyeceği yeni mantık problemlerini çözmelerini gerektiriyor. Gemini 3, bu teste katıldığında yüzde 31,1 skor almıştı; ancak yeni Gemini 3.1 Pro, bu oranı yüzde 77,1’e çıkararak önemli bir gelişme kaydetti. Bu, şirketin önceki sonuçlarını iki katına çıkararak, yapay zeka performansındaki ilerlemeyi gözler önüne seriyor.

Gemini 3.1 Pro ile Geliştiricilere Güçlü Araçlar Sunuluyor

Modeldeki iyileştirmeler, sadece teorik testlerle sınırlı kalmıyor. Google, karşılaştırmalı videolarında grafik ve simülasyon üretim yeteneğini de ön plana çıkarıyor. Metin tabanlı içeriklerden daha temiz ve optimize edilmiş SVG çıktılar üretme kapasitesi, geliştiricilerin iş akışlarına büyük bir katkı sağlıyor. Ayrıca, APEX-Agents benchmark’ında elde edilen skorun neredeyse iki katına çıkması, ajan tabanlı iş akışlarında kayda değer bir ilerlemeyi işaret ediyor.

Ancak Arena liderlik tablosu, durumun farklı bir yanını ortaya koyuyor. Metin üretiminde Claude Opus 4.6 modeli 1504 puan alarak, Gemini 3.1 Pro’yu yaklaşık dört puan geride bıraktı. Kod üretiminde de benzer bir durum söz konusu; Opus 4.6, Opus 4.5 ve GPT 5.2 High sürümleri, Gemini’nin biraz üzerinde bir konumda yer alıyor. Arena değerlendirmelerinin kullanıcı oylarına dayandığını ve çıktının doğruluğundan ziyade beğenilme oranını ölçtüğünü de unutmamak gerekiyor.

Gemini 3.1 Pro’ya Erişim ve Fiyatlandırma

Yeni sürüm, AI Studio ve Antigravity IDE üzerinden önizleme olarak erişime açıldı. Kurumsal kullanıcılar, Vertex AI ve Gemini Enterprise gibi platformlar üzerinden bu modele ulaşabiliyor. Ayrıca, son kullanıcılar için Gemini uygulaması ve NotebookLM içerisinde de 3.1 Pro versiyonu sunuluyor. Bu sayede, model hem bireysel hem de kurumsal kullanıcılar için eş zamanlı olarak devreye alınıyor.

Fiyatlandırma konusunda Google, herhangi bir değişiklik yapmaktan kaçınmış durumda. Geliştiriciler için API maliyeti, 1 milyon giriş token’ı başına 2 dolar ve çıkış token’ı başına 12 dolar olarak belirlenmiş. Ayrıca, bağlam penceresi, 1 milyon giriş ve 64 bin çıkış token sınırı ile devam ediyor. Şirketin geçmiş güncelleme takviminin, daha hızlı ve düşük maliyetli Flash model için 3.1 tabanlı bir güncelleme geleceğine işaret ettiğini de belirtmekte fayda var.

Google, bu sürümle birlikte özellikle soyut ve katmanlı sorulara verilen yanıtların daha tutarlı olmasını amaçlıyor. Uzun bağlamlı metinlerde çıkarım yapma ve çok adımlı problemleri çözme yeteneklerinin genişletilmesi hedefleniyor. Güncellenen model, geliştiricilerin oluşturduğu otomasyon senaryolarında daha kararlı sonuçlar üretmeyi vaat ediyor.

Yorum yapın