Apple, üretken yapay zeka alanında gecikmiş olsa da, görüntü ve metin verilerini yorumlayabilen çok modlu büyük dil modeli MM1’i tanıtarak durumu değiştiriyor gibi görünüyor.
Apple araştırmacıları, büyük dil modellerini (LLM) eğitmek için hem metin hem de görsel bilgileri sorunsuz bir şekilde entegre eden yeni bir yöntem geliştirdi. Apple MM1 olarak adlandırılan model, Google Gemini gibi çok modlu modellerle (30 milyara kadar parametre içeren) rekabet etmek için piyasaya sürüldü. Apple MM1, resim-altyazı çiftleri, resim-metin belgeleri ve yalnızca metin verilerinden oluşan bir veri seti kullanarak çok modluluk yeteneklerini sergiliyor.
Apple’dan Yeni Yapay Zeka Modeli
Çok modlu büyük dil modelleri (MLLM) ile büyük dil modelleri (LLM) arasında önemli farklar bulunmaktadır ve artık gelişmiş yapay zeka sistemleri çok modlu olarak geliştirilmektedir. ChatGPT gibi yapay zeka sohbet robotları sadece metinsel girdileri kabul ederken, Apple MM1, Gemini ve Copilot gibi yapay zekalar metinlerle birlikte görsel veya ses içeriklerini de işleyebilme yeteneğine sahiptir.
Apple, MM1’in nesneleri sayabildiğini, görüntülerin parçalarını tanımlayabildiğini ve temel matematiksel işlevleri yerine getirebildiğini iddia ediyor. Ayrıca, bağlam içi öğrenmeyi destekliyor, yani modelin her sorgu için yeniden eğitilmesi veya ince ayar yapılması gerekmiyor. MM1 ayrıca birden fazla görüntüyü yorumlayabilir ve bunlardan sonuçlar çıkarabilir, bu da çoklu görüntü muhakemesine olanak tanır.
Makale ayrıca MM1 modelinin, özellikle modelin en büyük 30 milyar parametreli konfigürasyonunda, bağlam içi öğrenme yeteneklerini vurguluyor. Bu versiyon, yapay zekanın minimum örneklere dayanarak karmaşık, açık uçlu problem çözme yeteneğine sahiptir. Araştırma makalesinde araştırmacılar modele gösterdikleri fotoğrafta masadaki tüm biralar için ne kadar ödemeleri gerektiğini soruyorlar. Bu soru Emu-Chat-37B ve LLaVA-NeXT-34B’ye de yöneltiliyor. Ve sadece Apple MM1’in doğru cevap verdiği görülüyor.
Öte yandan, MM1 şu anda sadece bir araştırma makalesiyle sınırlıdır ve somut bir ürün henüz mevcut değildir. Apple’ın yapay zeka araştırmaları umut verici olsa da, herhangi bir demo bile sunulmaması endişe yaratmaktadır. Geçtiğimiz günlerde, Apple’ın iOS 18 ile üretken yapay zekayı iPhone’lara getirmek için Google Gemini’yi kullanabileceği öne sürülmüştü. Bu iddialar güçlü görünse de, aynı zamanda Apple’ın yapay zeka alanında beklediği ilerlemeyi henüz yakalayamadığına işaret etmektedir.