Google’ın “Genie “si, oyunlardan daha fazlası için çok çeşitli etkileşimli ortamlar oluşturmak üzere kullanılabilir.
No Man’s Sky video oyunu 2016 yılında ilk kez yayınlandığında, 18 kentilyondan fazla gezegen içeren bir evrene sahipti. Kabul etmek gerekir ki, bu gezegenlerden herhangi birini keşfetmeye değer hale getirmek için altı yıl daha ek geliştirme yapılması gerekti, ancak bu muazzam, neredeyse sınırsız evren “prosedürel nesil” adı verilen bir geliştirme yöntemi kullanılarak oluşturuldu.
Prosedürel üretim, bilgisayarların insan yapımı varlıkları (dokular ve prefabrik nesneler gibi) bir algoritma tarafından üretilenlerle birleştirerek video oyunu içeriği oluşturmasına olanak tanır. Diğer popüler oyunlar bu yöntemi, geniş oyun dünyalarını elle inşa etmenin zorluğunu hafifletmek (Skyrim ve The Witcher III) ya da her yeni oyun oturumu için benzersiz dünyalar oluşturmak (Minecraft ve Dead Cells) için kullanmıştır.
No Man’s Sky örneğinden de anlaşılacağı üzere, prosedürel üretim, kurallar ve parametrelerin yanı sıra ilk varlıkları sağlamak için insan geliştiriciler mevcut olduğu sürece neredeyse sonsuz sayıda etkileşimli ortam yaratabilir. Ancak Google, prosedürel olarak oluşturulan ortamları yepyeni bir seviyeye taşıdı.
Şirketin yapay zeka araştırma laboratuvarı Deepmind, kısa bir süre önce internet videolarını analiz ederek 2D video oyunları oluşturmayı öğrenen bir yapay zeka modeli duyurdu. Eğitildikten sonra, bir insanın sağlaması gereken tek varlık tek bir görüntüdür. Bir peçete çizimi bile yeterli olacaktır.
Genie (Generative Interactive Environments) olarak adlandırılan Al şu anda bir kavram kanıtı, ancak gelecekte video oyunlarını nasıl geliştirdiğimiz konusunda sismik bir değişimden daha fazlasını işaret edebilir. Etkileşimli ortamlarla yapabileceklerimizde yeni bir potansiyelin kilidini açabilir.
I am really excited to reveal what @GoogleDeepMind‘s Open Endedness Team has been up to 🚀. We introduce Genie 🧞, a foundation world model trained exclusively from Internet videos that can generate an endless variety of action-controllable 2D worlds given image prompts. pic.twitter.com/TnQ8uv81wc
— Tim Rocktäschel (@_rockt) February 26, 2024
Şimdi yapay zeka gücüyle oynuyorsun.
Genie’nin antrenman rejimi her ortaokul öğrencisini kıskandıracak cinsten: Çevrimiçi oynanan video oyunlarının 6,8 milyon video klibini izledi. Yapay zeka özellikle klasik Super Mario Bros. ve Sonic the Hedgehog gibi 2D platform oyunlarına odaklandı. Her klip 16 saniye uzunluğundaydı, yani Genie 30.000 saatlik Twitch yayınına eşdeğer bir süre izledi (yorumlar hariç).
Genie, animasyonun her karesi arasında hangi “gizli eylemlerin” gerçekleştiğini belirlemek için videoları analiz etti. Bu analiz gizli eylemleri inceledi çünkü internet videoları oyunda neler olduğunu açıklayan eylem etiketleriyle birlikte gelmiyor. Modelin bu bilgiyi kendisi çıkarması gerekiyordu. Araştırmacılar işleri basit tutmak için potansiyel eylemleri sekiz olasılıkla (yukarı, aşağı, sol, sağ, artı köşegenler) sınırladılar.
Klasik bir yandan kaydırmalı video oyunundan pikselli bir karakter platformlar arasında zıplıyor.
Google’ın Genie’si tarafından yaratılan bir 2D platform oyunu örneği. İlk komut istemi bir karakter içeren bir Imagen2 görüntüsüydü.
Tonlarca video oyunundan veri çektikten ve potansiyel gizli eylemler için analiz ettikten sonra Genie, temel olarak tek bir görüntü kullanarak oynanabilir 2D platformlar oluşturabilir. Bu görüntü gerçek dünyadan bir fotoğraf, elle çizilmiş bir taslak ya da yapay zekanın metinden görüntüye yarattığı bir şey olabilir.
Kaynak ne olursa olsun, görüntü oyunun ilk karesi haline gelir. Oyuncu daha sonra bir eylem belirler – sağa hareket et veya yukarı zıpla – ve model dizideki bir sonraki kareyi tahmin eder ve üretir. Bu döngü, önceki karelerin oyuncu girdisine dayalı olarak bir sonraki kareyi tahmin etmek için veri haline gelmesiyle oyun süresince devam eder. Dolayısıyla, geliştiricilerin potansiyel oyuncu girdilerine dayalı animasyonlar oluşturmak zorunda olduğu geleneksel video oyunlarının aksine, Genie bunu mevcut oyuncu girdisine dayalı olarak ilerledikçe oluşturuyor.
Google bir blog yazısında “Genie, görüntülerden veya metinlerden tüm interaktif dünyaları oluşturabilme dönemini başlatıyor” diyor.
Bir oyundan daha fazlası
Sonuçlar oldukça etkileyici. Gönderide Google, video oyunlarının giflerini iş başında paylaştı. Bunlardan biri, stilize bir Super Nintendo oyunundan fırlamış hissi veren bir dünyada zıplayan kil bir karakteri gösteriyordu. Bir diğeri küçük bir çocuğun buzdolabı resmini oynanabilir bir şeye dönüştürdü. Bir diğerinde ise LEGO Thor kuru bir tahta silgisinden sıçrıyordu.
Genie ayrıca bazı beklenmedik ortaya çıkan özellikler de sergiledi. Örneğin, bazı ortamlar “paralaks kaydırma” olarak bilinen bir animasyon tekniğini taklit etti. Bu, oyun geliştiricilerinin derinlik yanılsaması vermek için arka planı ön plandaki öğelerden daha yavaş bir hızda hareket ettirmesidir. Bu, bir yapay zekanın açık talimatlar olmadan algılayabileceği gelişmiş bir tasarımdır.
Araştırmacılar ayrıca Genie’nin oyun dışında da öğrenip öğrenemeyeceğini belirlemek istediler. Bir yan deney düzenleyerek, yapay zekayı nesneleri hareket ettiren ve manipüle eden robot kollarının videoları üzerinde eğittiler. Bu robotların nasıl çalışması gerektiğine dair herhangi bir ek bilgi olmadan Genie, bir kullanıcının sanal bir robot kolunu tıpkı bir video oyunundaki oynanabilir bir karakter gibi manipüle edebileceği etkileşimli bir ortam geliştirebildi.
Bonus olarak, araştırmacılar bir başka ortaya çıkan özellik daha buldular: Yapay zeka modeli, robot kolun kavramasıyla ezilen bir cips torbası gibi nesne deformasyonunu simüle etti.
“[W]Genie’nin gelecekteki araştırmalar için büyük bir potansiyel yarattığına inanıyoruz. Genelliği göz önüne alındığında, model çeşitli, gerçekçi ve hayali ortamları simüle etmek için İnternet videolarının daha da büyük bir kısmından eğitilebilir” diye yazıyor araştırmacılar teknik raporlarında.
Örneğin, araştırmacılar Genie’nin diğer yapay zeka modellerinin öğrenmesi için çok sayıda etkileşimli ortam yaratma potansiyeline sahip olduğunu düşünüyor. Dolayısıyla, sürücüsüz araç YZ’lerini gerçek şehir sokaklarında deneme yanılma yoluyla eğitmek yerine, Genie gibi bir model, bu YZ modellerinin öğrenmesi için geniş ve çeşitli sanal ve etkileşimli ortamlar yaratabilir.
Araştırmacılar, “Zengin ve çeşitli ortamların eksikliğinin [pekiştirmeli öğrenmedeki] temel sınırlamalardan biri olduğu göz önüne alındığında, daha genel yetenekli [YZ] aracılar yaratmanın yeni yollarını açabiliriz” diye ekliyor.
Güçlendirilmeye ihtiyaç duyan potansiyel
Ancak No Man’s Sky’da olduğu gibi, Genie’nin de dünyalarından sonuna kadar yararlanılabilmesi için iyileştirilmesi gereken sınırlamaları var. Tüm yapay zeka modelleri gibi Genie de hata yapmaya meyilli. Bir örnekte, iki kuş birbirine çarpmadan önce geriye doğru uçuyor ve tamamen yeni bir karaktere dönüşüyor.
One amazing thing Genie enables: anyone, including children, can draw a world and then *step into it* and explore it!! How cool is that!?! We tried this with drawings my children made, to their delight. My child drew this, and now can fly the eagles around. Magic!🧞✨ https://t.co/qyWoT7O26I pic.twitter.com/EsEv6EkEds
— Jeff Clune (@jeffclune) February 26, 2024
Yapay zeka modelinin üretebilecekleri de sınırlı. Yalnızca “16 kare belleği” yönetebiliyor, bu da “uzun ufuklar boyunca tutarlı ortamlar elde etmeyi zorlaştırıyor.” Başka bir deyişle, seviyeler kısa ya da hızlı bir şekilde tuhaflaşıyor. Ortamlar da saniyede sadece yaklaşık 1 kare hızında çalışıyor. Bunu bir perspektife koymak gerekirse, çoğu 2D platform oyunu saniyede 60 kare hızını hedefler. (Google tarafından yayınlanan örnekler kareleri gif standartlarına kadar hızlandırıyor).
Bu sınırlamalar göz önünde bulundurulduğunda, Genie’nin sınırsız bir yeni oyun içeriği akışı oluşturabilmesi için birkaç yıldan daha uzun bir geliştirme süreci gerekebilir. Ancak makalenin yazarı ve British Columbia Üniversitesi’nde bilgisayar bilimleri doçenti olan Jeff Clune’un X’te belirttiği gibi: “Unutmayın: Bu şimdiye kadarki en kötü durum. Yakında mükemmel çalışacak.”
*Bu yazı Google’s AI can create a video game based on a napkin drawing başlıklı yazıdan çevrilmiştir.