Düzenlenmiş bir demo videosunda Gemini skeçleri tanımlayabiliyor, film benzetmelerini tanımlayabiliyor ve şakalar yapabiliyor gibi görünüyor.
Çarşamba günü Google, şirketin yapay zeka bölümü DeepMind tarafından sıfırdan inşa edilen yeni çok modlu büyük dil modeli Gemini’nin gelişini duyurdu. Gemini, birçok işlevinin yanı sıra, daha önce sohbet robotu öncüsü OpenAI’nin ChatGPT’sinin gölgesinden çıkmakta zorlanan Google Bard’ı destekleyecek.
Çarşamba günü Google, şirketin yapay zeka bölümü DeepMind tarafından sıfırdan inşa edilen yeni çok modlu büyük dil modeli Gemini’nin gelişini duyurdu. Gemini, birçok işlevinin yanı sıra, daha önce sohbet robotu öncüsü OpenAI’nin ChatGPT’sinin gölgesinden çıkmakta zorlanan Google Bard’ı destekleyecek.
Kredi: Google DeepMind / YouTube
Google CEO’su Sundar Pichai ve DeepMind kurucu ortağı ve CEO’su Demis Hassabis’in 6 Aralık tarihli blog yazısına göre, LLM’nin çeşitli uygulamalar için teknik olarak üç versiyonu -Gemini Ultra, Pro ve Nano- bulunmaktadır. “İnce ayarlı” Gemini Pro şu anda Bard’ın temelini oluştururken, Nano varyantı Pixel Pro akıllı telefonlar gibi ürünlerde görülecek. Gemini varyantları önümüzdeki aylarda Google Arama, Reklamlar ve Chrome için de gelecek, ancak Ultra’ya genel erişim 2024 yılına kadar mümkün olmayacak.
Yapay zeka rakiplerinin çoğunun aksine, Gemini lansmandan itibaren “çok modlu” olacak şekilde eğitildi, yani hem metin, hem ses hem de görüntü tabanlı istemleri zaten işleyebiliyor. Ekteki bir video gösteriminde Gemini’ye önüne konulan şeyi (bir kağıt parçası) tanımlaması için sözlü olarak görev veriliyor ve ardından bir kullanıcının çizdiği ördek taslağını gerçek zamanlı olarak doğru bir şekilde tanımlıyor. Diğer yetenekleri arasında videolar duraklatıldıktan sonra bir sonraki eylemin ne olacağı konusunda çıkarım yapmak, görsel yönlendirmelere göre müzik üretmek ve çocukların ev ödevlerini -genellikle biraz arsız, kelime oyunlarına yatkın bir kişilikle- değerlendirmek yer alıyor. Bununla birlikte, video açıklamasının “Bu demonun amaçları doğrultusunda, gecikme süresi azaltılmış ve Gemini çıktıları kısa olması için kısaltılmıştır.” şeklinde bir feragatname içerdiğini belirtmek gerekir.
Gemini’nin beraberindeki teknik rapor, LLM’nin en güçlü yinelemesi olan Ultra’nın “[LLM] araştırma ve geliştirmesinde kullanılan ve yaygın olarak kullanılan 32 akademik kıyaslama ölçütünün 30’unda mevcut son teknoloji sonuçlarını aştığını” belirtiyor. Bununla birlikte, gelişmeler biraz mütevazı görünüyor-Gemini Ultra, ChatGPT’nin yüzde 86,4’üne karşılık çok disiplinli soruları zamanın yüzde 90’ında doğru yanıtladı. Bununla birlikte, istatistiksel saçmalıklar ne olursa olsun, sonuçlar ChatGPT’nin Gemini ile gerçek bir rekabet içinde olabileceğini gösteriyor.
[İlgili: ChatGPT gibi yapay zeka sohbet robotlarının arkasındaki mantık şaşırtıcı derecede basit].
Şaşırtıcı olmayan bir şekilde, Google Çarşamba günkü duyurusunda yeni yıldız yapay zekasının mükemmel olmaktan uzak olduğu ve hala gelişmekte olan teknolojiyi rahatsız eden sektör genelindeki “halüsinasyonlara” eğilimli olduğu konusunda uyardı – yani LLM zaman zaman rastgele yanlış veya saçma cevaplar verecek. Google ayrıca Gemini’yi, 6 Aralık’taki lansman etkinliğinde konuşan Google DeepMind Ürün Başkan Yardımcısı Eli Collins’e göre “herhangi bir Google AI modelinin en kapsamlı güvenlik değerlendirmelerine” tabi tuttu. Buna Gemini’ye Allen Institute for AI tarafından geliştirilen ve büyük bir dil modelinin potansiyel siyasi ve demografik önyargılarını değerlendirmek amacıyla 100.000’den fazla sorunlu girdiyi içeren bir test olan “gerçek toksisite istemleri” görevi de dahildi.
Gemini, bir dizi kapalı test aşamasının yanı sıra önümüzdeki aylarda Google’ın ürün paketine entegre olmaya devam edecek. Her şey planlandığı gibi giderse, Gemini Ultra destekli bir Bard Advanced önümüzdeki yıl halka sunulacak; ancak, şimdiye kadar çok iyi bilindiği gibi, devam eden yapay zeka silahlanma yarışını tahmin etmek genellikle zordur.
Gemini tarafından desteklenip desteklenmediği sorulduğunda Bard, PopSci’ye “ne yazık ki” “dahili Google projeleri hakkında” bilgiye erişimi olmadığını bildirdi.
Bard PopSci’ye şunları yazdı: “… ‘Gemini’ hakkında daha fazla bilgi edinmek istiyorsanız, resmi Google kanalları aracılığıyla bilgi aramanızı veya şirket içinde bu tür bilgilere erişimi olan biriyle iletişime geçmenizi tavsiye ederim.” “Rahatsızlık için özür diler ve bu bilgilerin yardımcı olmasını umarım.”
*Bu yazı Google announces Gemini, its ‘multimodal’ answer to ChatGPT başlıklı yazıdan çevrilmiştir.