Zihninizin eridiğini hissetmeden Sora hakkında yazmak zor. Ancak OpenAI’nin dün öğleden sonra yaptığı sürpriz yapay zeka duyurusundan sonra, henüz düzenlenmemiş, sonuçsuz bir teknoloji endüstrisinin size ne satmak istediğine dair en iyi kanıta sahibiz: yasallık, mahremiyet ve nesnel gerçekliğin sınırlarını zorlayan fotogerçekçi medya üretebilen, enerji tüketen bir kara kutu yapay zeka ürünleri paketi.
Kararlı, düşünceli ve kapsamlı bir düzenleme yapılmazsa, çevrimiçi ortam neredeyse tanınmaz hale gelebilir ve bir şekilde her zamankinden daha da güvenilmez olabilir. Hiper-gerçek yünlü mamutların ve kağıt sanatından okyanus manzaralarının anlaşılabilir “vay canına” faktörü ortadan kalktığında, CEO Sam Altman’ın en yeni çarpıtma projesi endişe verici olmaya devam ediyor.
Introducing Sora, our text-to-video model.
Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W
Prompt: “Beautiful, snowy… pic.twitter.com/ruTEWn87vf
— OpenAI (@OpenAI) February 15, 2024
Sora’nın (Japonca’da “gökyüzü” anlamına geliyor) arkasındaki konsept aslında yeni bir şey değil: Görünüşe göre, yalnızca kullanıcının açıklayıcı metin girdilerine dayanarak yüksek çözünürlüklü video üretebilen bir yapay zeka programı. Basitçe söylemek gerekirse: Sora’nın DALL-E’ye güç veren metinden görüntüye difüzyon modelini transformatör olarak bilinen bir sinir ağı sistemiyle birleştirdiği bildiriliyor. Genellikle metin gibi devasa veri dizilerini ayrıştırmak için kullanılsa da, OpenAI’nin transformatör teknolojisini video karelerini benzer bir şekilde işlemek için uyarladığı iddia ediliyor.
“Görünüşe göre,” “bildirildiğine göre,” “iddia edildiğine göre.” Sora’yı tanımlarken tüm bu uyarılar gereklidir, çünkü MIT Technology Review’un açıkladığı gibi, OpenAI dünkü örnek kliplere ancak medya kuruluşlarının “dışarıdan uzmanların görüşünü almak” için şirketin resmi duyurusunun sonrasına kadar beklemeyi kabul etmelerinin ardından erişim izni verdi. Ve OpenAI en yeni deneyinin ön gösterimini yaptığında bile, bunu teknik bir rapor ya da modelin “gerçekten çalıştığına” dair bir arka uç gösterimi yayınlamadan yaptı.
Bu da, akla gelebilecek bir gelecek için, tek bir dış düzenleyici kurumun, seçilmiş yetkilinin, endüstri gözlemcisinin veya alçak teknoloji muhabirinin Sora’nın yapay zeka tarafından şimdiye kadar üretilen en tekinsiz medyayı nasıl oluşturduğunu, Altman’ın şirketinin yeni programını eğitmek için hangi verileri topladığını ve bu bir dakikalık video görüntülerini beslemek için ne kadar enerji gerektiğini bilmeyeceği anlamına geliyor. OpenAI’nin kamuoyu ile paylaşmayı seçtiği şeylerin insafına kalmış durumdasınız – CEO’su defalarca yapay zekanın yok olma riskinin nükleer savaşla eşit olduğu konusunda uyarıda bulunmuş, ancak bunun olmasını engelleyecek fon ve kaynakların yalnızca kendisi gibi adamlara emanet edilebileceğini söylemiş bir şirket.
Prompt: “Several giant wooly mammoths approach treading through a snowy meadow, their long wooly fur lightly blows in the wind as they walk, snow covered trees and dramatic snow capped mountains in the distance, mid afternoon light with wispy clouds and a sun high in the distance… pic.twitter.com/Um5CWI18nS
— OpenAI (@OpenAI) February 15, 2024
Bu noktaya gelme hızımız en az videoların kendisi kadar baş döndürücü. New Atlas dün durumun sağlam bir özetini sundu-OpenAI’nin örnek klipleri hiçbir şekilde mükemmel değil, ancak sadece dokuz ay içinde, yapay zeka Will Smith’in spagetti yemesinin “komedi dehşetinden”, kalabalık şehir sokaklarını, soyu tükenmiş hayvanları ve hayali çocuk fantezi karakterlerini tasvir eden neredeyse fotogerçekçi, yüksek çözünürlüklü videolara geçtik. Benzer bir teknoloji bundan dokuz ay sonra, modern tarihin en önemli ABD başkanlık seçimlerinden birinin arifesinde nasıl görünecek?
Sora’nın salon numarası taklitlerini atlattıktan sonra, rahatsız edici sonuçları görmezden gelmek zor. Elbette videolar teknoloji harikası. Elbette Sora yenilikçi, eğlenceli, hatta faydalı sonuçlar verebilir. Ama ya birisi onu “yenilikçi”, “eğlenceli” ya da “faydalı” dışında bir şey elde etmek için kullanırsa? İnsanlar herhangi bir yapay zeka programından çok daha yaratıcıdır. Şimdiye kadar bu tür şeyleri kırmak sadece biraz özveri, sabır ve teknolojiyi kötü niyetli kazançlar için bükme arzusu gerektiriyordu.
Prompt: “A gorgeously rendered papercraft world of a coral reef, rife with colorful fish and sea creatures.” pic.twitter.com/gzEE8SwP81
— OpenAI (@OpenAI) February 15, 2024
OpenAI gibi şirketler, Sora gibi projelerle pervasızca girmeye devam ettikleri keşfedilmemiş bir bölge olan yeni teknolojik dünyamızdan kötü aktörlerin yararlanmasını önlemek için şu anda güvenlik protokolleri ve endüstri standartları geliştirdiklerini vaat ediyorlar. Yine de en temel güvenlik önlemlerini bile uygulamada başarısız oldular: Deepfake’ler insan bedenlerini istismar ediyor, okul bölgeleri faşist kitap yasaklarını kabul etmek için ChatGPT’den yararlanıyor ve gerçek ile kurgu arasındaki çizgiler lekelenmeye devam ediyor.
[İlgili: Üretken Yapay Zeka 2024’te en büyük yasal testlerle karşı karşıya kalabilir].
OpenAI, Sora’nın halka açılması için acil bir plan olmadığını ve “zarar veya riskler açısından kritik alanları değerlendirmek” için kırmızı ekip testleri yürüttüklerini söylüyor. Ancak herhangi bir düzenleyici geri itme olmadığı sürece, OpenAI’nin Sora’yı mümkün olan en kısa sürede serbest bırakması mümkündür.
OpenAI dünkü duyurusunda “Sora, gerçek dünyayı anlayabilen ve simüle edebilen modeller için bir temel oluşturuyor, bu da [Yapay Genel Zeka] elde etmek için önemli bir kilometre taşı olacağına inandığımız bir yetenek” dedi ve bir kez daha şirketin insanlardan ayırt edilemeyen yapay zeka yaratma hedefine açıkça atıfta bulundu.
Sora, gerçek dünyayı anlamak ve simüle etmek için bir model – en azından geriye ne kaldıysa.
*Bu yazı OpenAI’s Sora pushes us one mammoth step closer towards the AI abyss başlıklı yazıdan çevrilmiştir.