Meta ve NYU’nun robotu daha önce hiç görmediği odalarda gezinebiliyor ve temizlik yapabiliyor.
Araştırmacılar, sadece açık kaynaklı yapay zeka kullanarak ticari bir robotun daha önce hiç girmediği bir odada nesneleri bulmasını ve hareket ettirmesini sağladı. Robot mükemmel değil, ancak evlerimizi ev robotlarıyla paylaşmaktan uzmanların daha önce düşündüğü kadar uzak olmayabileceğimizi gösteriyor.
“Tamamen imkansız”: Mutfakları temizleyen, atıştırmalıklar hazırlayan ve diğer ev işlerini yapan robotların demo videoları, bulaşık makinesini doldurduğunuz günlerin sayılı olduğunu ummanıza neden olabilir, ancak yapay zeka uzmanları, ev işlerimizin bir kısmını bile botlara devretmekten hala on yıl uzakta olduğumuzu tahmin ediyor.
NYU Courant’ta doktora öğrencisi olan Mahi Shafiullah, MIT Technology Review’a verdiği demeçte, “[Robotik] topluluğunda evlerin zor, robotların zor ve evlerle robotları birleştirmenin tamamen imkansız olduğuna dair çok yaygın bir his var” dedi.
“Robota neyi alacağını ve nereye bırakacağını doğal bir dille söylemeniz yeterli, o da bunu yapacaktır.”
-LERREL PINTO
Açık kaynak, kullanıma hazır: Ev robotu devriminin önündeki en büyük engellerden biri, herhangi birinin evinde çalışabilecek bir robot yapmanın, kontrollü bir laboratuvar ortamında çalışacak bir robotu eğitmekten çok daha zor olması.
Shafiullah tarafından yönetilen ve NYU ile Meta’daki yapay zeka araştırmacılarının da yer aldığı yeni bir çalışma, ev robotlarına sandığımızdan daha yakın olabileceğimizi gösteriyor.
Yalnızca açık kaynaklı yazılım kullanarak, piyasada satılan bir robotu, daha önce hiç girmediği bir odadaki nesneleri talep üzerine hareket ettirebilecek şekilde değiştirdiler. Sisteme “OK-Robot” adını verdiler ve çalışmalarını arXiv ön baskı sunucusunda paylaştıkları bir makalede detaylandırdılar.
Shafiullah ile birlikte çalışmayı yürüten Lerrel Pinto, “Robota neyi alacağını ve nereye bırakacağını doğal bir dille söylemeniz yeterli, o da bunu yapacaktır” diye tweet attı.
Nasıl çalışıyor? OK-Robot sisteminin merkezindeki robotun adı Stretch (bir tanesini sadece 19.950$ artı nakliye ve vergiler karşılığında satın alabilirsiniz). Stretch tekerlekli bir tabana, dikey bir direğe ve direkte aşağı yukarı kayabilen robotik bir kola sahip. Kolun ucunda robotun nesneleri kavramasını sağlayan bir kavrayıcı bulunuyor.
Robotu insanların konuşabileceği bir şeye dönüştürmek için ekip, onu hem görüntüleri hem de kelimeleri anlamak üzere eğitilmiş yapay zekalar olan görme-dil modellerinin (VLM’ler) yanı sıra önceden eğitilmiş gezinme ve kavrama modelleriyle donattı.
Daha sonra iPhone uygulaması Record3D’yi kullanarak bir odanın 3D videosunu oluşturdular ve bunu robotla paylaştılar – bu işlem yaklaşık altı dakika sürdü. Bundan sonra, robota odadaki bir nesneyi yeni bir konuma taşıması için bir metin komutu verebiliyorlardı ve robot nesneyi bulup taşıyordu.
OK-Robot’u 10 odada test ettiler. Her odada, robotun kavrayıcısına sığabilecek 10-20 nesne seçtiler ve bunları (her seferinde bir tane olmak üzere) odanın başka bir yerine taşımasını söylediler (“Soda kutusunu kutuya taşı,” “Masanın üzerindeki Takis’i komodine taşı,” vb.)
Genel olarak, robot görevleri tamamlamada %58,5 başarı oranına sahipti. Ancak daha az dağınık olan odalarda başarı oranı çok daha yüksekti: %82,4.
İleriye bakmak: OK-Robot sadece tek bir şey yapabilse de (ve her zaman doğru yapamasa da), kullanıma hazır modellere dayanması ve yeni bir ortamda çalışmak için herhangi bir özel eğitim gerektirmemesi – sadece odanın bir videosu – oldukça dikkat çekici.
Ekip için bir sonraki adım, kodlarını açık kaynaklı hale getirmek olacak, böylece başkaları da başlattıkları şeyi geliştirebilecek ve potansiyel olarak ev robotlarının ev işlerimizi tahmin edilenden daha erken yapmasına yardımcı olacak.
Shafiullah, “Bence insanlar ev robotlarının mümkün olduğuna inanmaya başladığında, bu alanda çok daha fazla çalışma yapılmaya başlanacak” dedi.
*Bu yazı Install open-source AI in a commercial robot and it’ll clean your room başlıklı yazıdan çevrilmiştir.