Google’ın paylaştığı kıyaslamalara göre Gemini 3.1 Pro, “Humanity’s Last Exam” adlı testte 44,4 puana ulaştı. Şirket, önceki sürümün 37,5 seviyesinde kaldığını; OpenAI’ın GPT 5.2 modelinin ise 34,5 puan aldığını aktarıyor.
Bir diğer dikkat çeken veri ARC-AGI-2’de geldi. Yeni ve alışılmadık akıl yürütme problemlerine odaklanan bu testte, Google’a göre Gemini 3’ün 31,1 olan skorunun 77,1’e çıktığı görülüyor. Öte yandan Google, her alanda zirvede olmadığını da kabul ediyor: Kullanıcı oylamasına dayanan Arena sıralamasında, metin kategorilerinde Claude Opus 4.6’nın Gemini’nin önünde olduğu belirtiliyor. Google ayrıca bu tür oylama tabanlı sıralamaların, “doğru gibi görünen ama ince hatalar barındıran” yanıtları ödüllendirebileceğine işaret ediyor.
1
Balıkçıların ağına bir dev takıldı
197 kez okundu
2
Avustralya’da kıyıya vuran balinalar: 70’i kurtarıldı, 380’i öldü
139 kez okundu
3
Yeni Yılda Bilgisayar ve Telefon Fiyatlarında Patlama Yaşanacak
67 kez okundu
4
RAM krizi 2026: Nedenleri ve mümkün sonuçları
56 kez okundu
5
Mount And Blade 2 Banner Lord Hileleri – Bannerlord Hile Kodları Aktif Etme Ve Açma 2026
55 kez okundu