Google, yapay zeka alanında büyük bir adım atarak en ileri modeli olan Gemini 2.5’i tanıttı. Bu yeni model, “düşünerek yanıt verme” yeteneğiyle dikkat çekiyor ve özellikle kodlama, matematik ve bilimsel analizlerde etkileyici performans sergiliyor.
Gelişmiş Akıl Yürütme ve Uzun Bağlam Penceresi Yetenekleri
Gemini 2.5 Pro, akıl yürütme yeteneklerini ön planda tutarak geliştirilmiş olup, birçok benchmark testinde rakiplerini geride bırakmayı başardı. Model, şu anda Google AI Studio ve Gemini uygulamasında Gemini Advanced abonelerine sunulmakta ve yakında Vertex AI platformuyla entegre olması bekleniyor.
Yeni model, 1 milyon token’lık (yaklaşık 750 bin kelime) bir bağlam penceresine sahip, bu da ona tek seferde “Yüzüklerin Efendisi” kitap serisinin tamamını işleme kapasitesi sağlıyor. Gelecekte bu kapasitelerinin 2 milyon token’a çıkarılacağı duyuruldu.
Google, Gemini 2.5 Pro’nun yazılım geliştirme alanında oldukça güçlü olduğunu vurguluyor. Model, kod düzenleme testlerinden biri olan Aider Polyglot’ta %68.6 puan alarak, OpenAI, Anthropic ve DeepSeek’in en iyi AI modellerini geride bıraktı. Ancak, yazılım geliştirme yeteneklerini değerlendiren SWE-bench Verified testinde %63.8 puanla OpenAI’ın o3-mini modelini geçerken, Anthropic’in Claude 3.7 Sonnet modelinin gerisinde kaldı.
“Humanity’s Last Exam” Sınavında %18.8 Puan
Model, “Humanity’s Last Exam” adlı çok modlu sınavdan %18.8 puan alarak, matematik, beşeri bilimler ve doğa bilimleri alanlarında pek çok rakibini geride bıraktı. Bu sınav, birçok uzman tarafından hazırlanan binlerce sorudan oluşuyor ve yapay zekanın karmaşık problemleri çözme yeteneğini değerlendirmeyi amaçlıyor.
Google, yapay zekanın daha karmaşık görevleri yerine getirebilmesi için akıl yürütme tekniklerine uzun zamandır yatırım yaptığını belirtiyor. Reinforcement learning ve chain-of-thought (düşünce zinciri) gibi yöntemler üzerine inşa edilen Gemini 2.5, analitik düşünme, mantık yürütme ve bağlamsal kararlar alma konularında en gelişmiş modeli olarak öne çıkıyor.
Google, yeni modelin ücretlendirme detaylarını önümüzdeki haftalarda açıklamayı planlıyor, ancak Gemini 2.5 Pro şu anda geliştiricilere açık.