Üretken sana

HABER MASASI
Abone Ol

Dünya tarihindeki hemen hemen her olgu -sistematik olmasına bakılmaksızın- birikimli bir gelişim seyri izlemiştir. Bir önceki çağın fikri kendinden sonraki çağı etkilerken yüz yıl önceki bilimsel çalışma yüz yıl sonrasının kaderini değiştirmiştir.

Mustafa Özgör

Üniversite öğrencisi

Bilimde, felsefede hatta kültürel dilde dahi çalışan bu mekanizmanın söz konusu sanat olduğunda da işlemesi sürpriz olmamıştır. Bahsedilen doğrultuda yirminci yüzyıl sanat anlayışının yirmi birinci yüzyıla bıraktığı büyük miraslardan birini disiplinlerarası sanat yaklaşımı olarak görmek yerinde olacaktır. Nitekim bilgisayar teknolojilerinin ilerlemesinin ve analog sistem mimarisinden dijital sistemlere geçilmesinin sanat üzerindeki en büyük teknolojik etki olduğunu söylemek de kaçınılmazdır. 2000’li yılların başlarından itibaren görselişitsel içerik üretim araçlarının nicelik ve nitelik bakımından zenginleşmesi ile disiplinlerarası titiz birçok çalışma yürütülmüştür. Yazılım ve yapay zeka unsurları git gide daha da odak noktası haline gelmiş ve sanatsal çıktıların büyük bir parçasını oluşturmaya başlamıştır. Bu samimi ilişki sonucunda ise ortaya “üretken sanat” adı verilen bir kavram çıkmıştır.

Son birkaç yılda hayatımızda etkisini güçlü bir şekilde hissettirmiş ve ChatGPT ile ün kazanmış GPT teknolojisi “generative pre-trained transformer” ifadesinin kısaltmasıdır ve Türkçeye “üretken ön işlemeli dönüştürücü” şeklinde çevrilmektedir. Teknoloji ve sanat iş birliğinden doğan üretken sanat kavramı ile GPT arasındaki benzerlik elbette tesadüfi değildir. İki kavramın da temelinde bağlantısallık olgusu yatmaktadır. Üretken sanat denildiğinde ortaya çıkan eserde enstrümanlar ne bir ressamın boyaları ne de bir müzisyenin notaları gibi somut değildir. Mevzubahis sanatın el çantasını algoritmik ifadeler, matematiksel sıfır-birler, elektriksel impulslar ve ek olarak insan zihninin uçsuz bucaksız dünyası oluşturur. Çünkü bu “yeni nesil” sanat, insan zihni ve teknolojik imkanların sanal alemde çarpışması sonucu ortaya çıkmıştır.

Üretken sanat kavramı her ne kadar bilgisayar teknolojilerinin sanat ile disiplinlerarası ortaklığından kurgulanmış olsa da sanatın mutlak zamanın bir uğraşı olmaktan çıkıp bir sürecin unsuru olduğu düşünüldüğünde bu kavramın gayriresmi olarak çok daha eski tarihlerde de var olduğu söylenebilir. Bunun en güzel örneği rastgele müzik parçalarının bir araya getirilmesine dayanan “müzikal zar oyunu” adlı sistemdir. Mozart tarafından 1787 yılında bestelenen ve 176 adet tek çubuklu müzik parçasından oluşan beste, zar müziğinin en önemli örneklerinden biridir. Bu yöntem yalnızca on sekizinci yüzyılda entelektüel bir uğraş olarak kalmamış yirminci yüzyılın başlarına kadar birçok evrim ve varyasyona ayrılarak bir deney nesnesi haline de gelmiştir.

“İşlek caddeleri ve uzaktaki kalesiyle OrtanÇağ’a ait bir köy manzarası”

Bilgisayar ve yazılım kullanılarak sanat eseri üretilmesinin kökeni ise yirminci yüzyılın ortalarına dayanmaktadır. Alan Turing ile 1950 yılında fitili ateşlenmiş “Makineler de düşünebilir mi?” sorusunun bilim dünyasını işgal ettiği günlerde Amerikalı matematikçi ve aynı zamanda grafik tasarımcısı olan Benjamin F. Laposky soyut sanat üretebilmek için trigonometrik dalgalar üretebilen (sinüs ya da kosinüs dalgaları) bir jeneratör, çeşitli işlev ve özelliklerde elektronik devreler ve bir osiloskop kullanmıştı. Ortaya çıkan sanat eserlerini de “Elektriksel Komposizyonlar” olarak adlandırdı. Bu adlandırma o kadar yerinde ve kapsayıcıydı ki Laposky’nin çalışmasının üzerinden geçen yetmiş üç sene dahi üretken sanat eserlerini elektriksel birer kompozisyon olmaktan alıkoyamadı.

Aynı mantık ile oluşturulmuş bazı QR kodlar.

Geçmişten bugüne geldiğimizde günümüzün en ileri düzey elektriksel kompozisyonlarını üretmeye aday olan “Stable Diffusion” isimli model ilk olarak 2022 yılında piyasaya sürülmüştür. Münih ve Runway’deki Ludwig Maximilian Ünivesitesindeki CompVis Group araştırmacıları tarafından Stability AI adı ile geliştirilmiştir. En basit şekilde ifade edilirse girilen pozitif ve negatif komutlar neticesinde görsel üreten bir yapay zeka modelidir. Derin öğrenme metotları kullanılarak geliştirilen bu model benzer sonuç üreten MidJourney, Dall-E, Photoshop Beta vb. gibi modellerden bir yönüyle ayrılmıştır. Girilen komutları iki aşamalı bir işleme sokar. İlk işlemde verilen komutu tamamen gürültülü (teknik bir kavram olarak noise ifadesinin kullanımı daha uygundur) bir veri setinden geçirir. Bu adım oluşacak resmin anahatlarını belirler. İkinci aşamada ise birinci aşama sonucu elde edilen temel yapı kullanılarak yüksek çözünürlüklü görseller ortaya çıkar. Bu işlemler süresince model, bilgisayarın GPU gücünden fazlasıyla yararlanmak zorundadır. Stable Diffusion modelini başarılı bir elektriksel kompozisyon üreticisi yapan da bu elektriksel sıfır-birler üzerine kurulu yapısıdır.

Stable Diffusion modelini diğer text-to-image (metinden görüntüye) modellerinden ayıran bir diğer özellik ise bireysel modifikasyon ve montajlara açık olmasıdır. Bu sayede yeni bir görsel üretim metodu geliştirmek istenirse tüm sistemi baştan kurmaya gerek olmadan ufak modifikasyonlarla bu işlem gerçekleştirilebilir. Yapılan modifikasyonlara örnek olarak yakın zamanda “resim resim içinde” metodu öne sürülmüştür. Bu ismin literatürde bir karşılığı olmasa da gereken mesajı veren bir tanım olduğunu söylemek yanlış olmayacaktır. Ana hatlarıyla yapılan işlem, karmaşık bir görüntünün içerisine ondan daha az karmaşık olan ve çoğu zaman belirli desenlerin (spiraller, halkalar yahut çeşitli geometrik-örüntüler) ya da basit hatlarla çizilmiş figürlerin yerleştirilmesinden ibarettir. Bu yolla kendi içerisinde bir anomali barındırmayan ancak uzaktan bakıldığında fark edilen iki katmanlı görseller üretilmektedir. Bu sayede birtakım semboller, işaretler ya da izler yalnızca amaca yönelik ifadeler olmaktan çıkıp estetik birer nesne haline getirilebilmektedir. Resim resim içinde metodunun en etkili uygulama alanı olarak estetik QR kodları üretiliyor olsa da akla gelebilecek her çeşit sembol bu yolla estetik bir boyut kazanabilmektedir. Stable Diffusion modelinin bahsedilen metotla kullanımı fazlaca teknik müdahale gerektirdiğinden bir yazı ile anlatmak ne yazık ki mümkün olamamaktadır. Ancak internet üzerinde birçok kullanım rehberi mevcuttur. O sebepten biz de bu yazımızda sadece örnek görseller sunmakla yetineceğiz.

Stable Diffusion ile görsel üretme sürecinde iki adet komuta ihtiyaç duyarız: pozitif komut ve negatif komut. Buradaki temel mantık, kesin olarak istenilen ve kesin olarak istenmeyen unsurların resim içerisinde doğru bir dağılım göstermesini sağlamaktır. Ancak diğer modellerden farklı olarak teknik ve özel bir dil gerektirir. Aşağıdaki örneklerde teknik unsurlardan arındırılmış haliyle kullanılan komut şu şekildedir:

“İşlek caddeleri ve uzaktaki kalesiyle Orta Çağ’a ait bir köy manzarası”

Aynı mantık ile oluşturulmuş bazı QR kodlar ise şu şekildedir:

Örneklerden de görüleceği üzere resimler içerisinde bir örgü sistemi barındırır ancak bu, resimlerin kendi yapısında bir bozukluğa neden olmaz. Ayrıca bu yöntemle yalnızca iki katmanla sınırlı kalmayı gerektirecek bir kısıt yoktur. Uygun şekiller seçildiğinde üç, dört ve hatta beş katmanlı görseller üretilebilmektedir.

Kısaca özetlemek gerekirse, tarihin erken zamanlarından itibaren birtakım elektriksel etkilenmelerden hatta daha da öncesinde rastgelelik ve rastlantısallıktan ibaret olan üretken sanat kavramı, günümüzün popüler teknolojileri olan derin öğrenme (deep-learning) ve derin sinir ağları (deep-neuralnetwork) ile birlikte bir üst seviyeye taşınmıştır. İnsan-makine zihninin en soyut yönünü ortaya çıkaran bu kavram bir yıl önce geliştirilen Stable Diffusion modeli ile hem sürrealist sanat anlayışını güçlendirmiş hem de somut bazı kavramlara estetik boyut kazandırmıştır. İnsanlık hayal gücünü, makineler ise elektriği kaybetmedikçe sanat ve teknoloji arasındaki bağ güçlenerek devam edecektir.

Not: Metnin hazırlanması sırasında Selçuk Artut tarafından yazılan “Geometric Patterns with Creative Coding, Coding for the Arts” kitabından faydalanılmıştır.