kızımla yapay zeka sohbetleri #7
biz onu görmeye geldik ama hadi uyansın artık..
idil hanım artık belirli başlı şeyleri yaptığımda doğrudan gülümsüyor — gerçekten, kalıcı olarak. geçen haftanın yazısında bu kalıcılaşmadan bahsetmiştim: altı haftalık birikimin, bir anda değil ama bir eşiği aşarak yüzeye çıkışından.
şimdi sekizinci haftadayız ve gülümseme artık bir sürpriz değil, bir rutin. her sabah yüzüme bakıyor, bir şey oluyor içinde, ve o dişsiz damağını göstere göstere gülümsüyor. ama bu haftanın asıl gözlemi gülümsemenin kendisi değil, gülümsemenin etrafında olan şey.
idil’in gülümsemesi sosyal bir davet aslında. evrim bunu öyle tasarlamış — bebek bu sinyalle bakım ağını genişletiyor, anne babadan büyükanne büyükbabaya, oradan komşuya, akrabaya. “ben buradayım, sen de yaklaş” diyor.. ve bizimkiler de yaklaşıyorlar.
idil gülümsemeye başladığından beri etrafındaki dünya değişti.. ziyaretler uzuyor. gezdiği kucak sayısı artıyor. eline ayağına dokunan, onları yiyecekmiş gibi yapanların sayısı artıyor. ve tabi ki idil için endişelenenlerin sayısı da artıyor. herkesin bir fikri var: “yüz üstü yatırın, boynu güçlensin.” “çok kucakta taşımayın, alışır.” “müzik açın, beyin gelişir.” “ekrana maruz bırakmayın.” “doğal ışık şart.”
sevgiyle söyleniyor bunların hepsi. iyilik niyetiyle.
biyolog ve insan gelişimi araştırmacısı urie bronfenbrenner, çocuğu bir vakum içinde değil katmanlı bir ekosistem içinde ele alır. aile çekirdeği en içteki halka — mikrosistem. büyükanne, komşu, pediatrist bir sonraki halka. kültürel normlar, toplumsal beklentiler daha dışta.. her halkanın bebeğe bir baskısı var, her biri farklı bir şeyi optimize etmeye çalışıyor. bronfenbrenner’a göre bu katmanlar birbirini etkiler — ama her katmanın aynı anda, aynı yoğunlukta müdahale etmesi sistemin kendi iç dengesini bozabilir.
bugünkü derdimiz de tam olarak bu aslında — idil’in gülümsemesiyle birlikte bütün halkaların aynı anda harekete geçmesi.
bunun bir adı da var aslında, daha klinik bir adı: aşırı uyarılma. over-stimulation. yeni doğan sinir sistemi belirli bir uyaran eşiğine kadar düzenli çalışır — ses, dokunuş, ışık, hareket. eşik aşıldığında bebek bunu kendi başına regüle edemez. sonuç genellikle huzursuz bir ağlama, bozulan uyku, zor yatışan bir gece olur. herkes ayrı ayrı “biraz” geldi ama toplamda idil’in sistemi bir günde haftalarca alacağı kadar girdi işlemek zorunda kaldı.
burada ironik olan şu: aşırı uyarılma genellikle sevgiden doğar. kimse kötü niyetle gelmiyor. ama sistemin kapasitesi, gelenlerin niyetinden bağımsız bir şey.
hiç kuşkusuz yapay zeka projelerinde de böyle anlar olur.
bir model eğitilirken — özellikle ilk birkaç iterasyonda — sistem henüz ne yaptığını öğreniyordur. veri akar, ağırlıklar güncellenir, hatalar geriye yayılır. bu sürecin kendi ritmi vardır. test setlerinde model neler yapmış diye incelemeye başlar başlamaz, ekipteki herkes bir şey fark eder: “model şunu yapıyor, şunu yapmamalı.” “learning rate’i düşürelim.” “bu feature’ı çıkaralım.” “şu threshold’u değiştirelim.” hepsi haklı gözlemler. hepsi iyi niyetli.
buna yazılım dünyasında premature optimization deniyor — sistem neye ihtiyacı olduğunu henüz ortaya koymadan yapılan erken optimizasyon. donald knuth’un ünlü sözü var: “premature optimization is the root of all evil.” çoğu zaman bağlamından koparılarak alıntılanır bu söz, ama özü şu: bir sistemi tam anlamadan müdahale etmek, çözdüğünden fazla sorun yaratır.
daha derinine inince, asıl mesele şu: çok sayıda iyi niyetli müdahale birbirini iptal eder. birisi learning rate’i düşürürken diğeri batch size’ı artırır. birisi veriyi temizlerken diğeri yeni veri ekler. sistem bir yöne çekilirken başka bir yöne itilir.. ve model ne öğreneceğini bilemez hale gelir. optimizasyon değil bu — kocaman bir gürültü.
andrej karpathy — söz konusu yapay zeka olduğunda kendisi şahsi peygamberim — son dönemde autoresearch adlı bir proje yayınladı. fikir basit ama çarpıcı: model eğitiminde insanın kendisini döngünün dışına çıkarması. karpathy, kendi varlığının darboğaz haline geldiğini fark etmiş — her deneyi o kontrol ettiğinde, yorgunluk, dikkat dağılması, context-switching araya giriyor. bunun yerine bir ai agent’ı döngüye koyuyor: agent kendi başına deney tasarlıyor, çalıştırıyor, sonucu değerlendiriyor, işe yarayanı tutuyor, yaramayanı atıyor. sabırla, yorulmadan, gece boyunca.
burada kritik olan şey çoklukla ilgili değil — tam tersi. tek bir tutarlı, sabırlı mekanizma var ve insan müdahalesi azaldıkça sistem daha iyi optimize oluyor. karpathy’nin agent’ı tam da bizim bebek gelişiminde karşımıza çıkan “too many cooks” probleminin çözümü gibi duruyor: bir aşçı, ama yorulmayan, dikkati dağılmayan, her seferinde aynı titizlikle yemek yapan bir aşçı.
idil’in dünyasında böyle bir mekanizma yok. onun “autoresearch”ü kendi sinir sistemi — ve bu sistemin dışarıdan yardımı yok, gece boyunca onun yerine deney yapan bir agent yok. üstüne bir de etrafında, her biri “ben optimize edeyim” diyen insanlarla dolu. karpathy bir tek agent’a güvenip kendini geri çekiyor; idil’in etrafındaki insanlar ise tam tersini yapıyor — her biri içeri giriyor, hiçbiri çekilmiyor.
sizi sovyet psikolog abimiz vygotsky’ye geri götürmek istiyorum — kavrama refleksi yazısında ondan bahsetmiştik, idil’in elimi tuttuğu o anda. vygotsky, öğrenmenin sosyal bir eylem olduğunu söylüyordu: bir çocuk, kendi başına ulaşabileceği seviyenin ötesine ancak bir yetişkinle birlikte çıkabilir. buna “yakınsak gelişim alanı” demişti — şu an bildiğin ile biraz zorlanırsan bilebileceğin arasındaki o dar boşluk. o yazıda bu boşluğun yalnız geçilemeyeceğinden, bir elin uzanması gerektiğinden bahsetmiştim.
ama o elin nasıl uzandığı da önemliymiş, şimdi fark ediyorum. tek bir el, doğru zamanda uzanırsa boşluk geçilir. on el birden uzanırsa, boşluğun kendisi kaybolur.
scaffolding — iskele — deniyor buna. bir bina inşa edilirken kurulan geçici destekler gibi. bina yükseldikçe iskele de değişir. ama iskeleyi sökmeden bina tamamlanmaz. ve iskeleyi kuran kişi sayısı arttıkça, hangi desteğin gerçekten gerekli olduğunu ayırt etmek zorlaşır.
idil için de aynı şey geçerli. etrafındakilerin ilgisi bir iskele. doğru zamanda, doğru yoğunlukta olursa gelişimi destekler. ama herkes aynı anda farklı bir iskele kurmaya kalkarsa — bina altında ezilir.
yapay zeka modelinde de öğrenme süreci kendi yakınsak gelişim alanını bulmalı. hangi parametrenin ne zaman dokunulacağına sabırla bakılmalı. müdahale değil, gözlem. optimizasyon değil, takip.
bir yapay zeka projesi de ilk anlamlı çıktısını ürettiğinde idil’in gülümsemesine benzer bir şey yaşar. model bir şeyler yapıyor, sonuçlar görünür hale geliyor.. ve herkes bir fikir geliştiriyor. product manager uat’den bir şeylerle dönüyor, testçiler bazı caselerde modeli fail ettiriyor, kıdemli mühendis mimariyi sorguluyor, yönetici metriği değiştirmek istiyor. bir anda geri bildirimlerin ardı arkası kesilmiyor.
gülümseme gibi: davet işe yaradı, ama arkasından kocaman bir kalabalık da geldi.
too many cooks spoil the broth derler gavur ellerinde — aşçı çok olunca çorbanın da tadı kaçarmış. mutfakta bunu sezgisel olarak biliriz. ama bir ekip toplantısında, herkesin niyeti iyiyken, bu sezgiyi unutmak çok daha kolay.
sekizinci haftanın en büyük dersi bu oldu benim için. idil her geçen gün biraz daha kendisi oluyor — ama bu “olma” süreci ancak ona yetecek kadar alan bırakıldığında işliyor. çok fazla uyaran, çok fazla düzeltme, çok fazla iyi niyet.. ve nihayetinde aşırı uyarılmış, huysuz bir sistem. herkesler giderken, gecenin köründe uykusuzluğun üzerine bir de çilek niyetine gelen ağlama krizleri.
bir yapay zeka modeli eğitirken de en zor beceri bu: elleri cebine koymak. gözlemlemek. beklemek. sistemin kendi sinyalini bulmasına izin vermek. karpathy bunu otomatikleştirerek çözdü — kendini çekti, sabırlı bir mekanizmayı işin başına koydu. ama idil için böyle bir vekil yok. orada duran, gözlemleyen, ne zaman çekileceğine karar veren tek şey — biz.
belki de bütün yazının özeti şu ayrımda: ilgi göstermek ile müdahale etmek aynı şey değil. ilgi, sistemin yanında durup onu izlemektir — gerektiğinde elini uzatmak, ama elini sürekli uzatılmış tutmamak. müdahale ise sistemin kendi ritmine güvenmemekten doğar — “ben daha iyi bilirim” düşüncesinden. machine learning’den, deep learning’e geçişte ne ablalar abiler harcandı bu yolda. feature engineering’i tarihin derinliğine gömdüğümüz gibi bu premature optimizationcıları da gömeceğiz, kimsenin endişesi olmasın.
neyse.. bugün şöyle bir baktığımızda ben de merve de şunun farkındayız — idil’e gösterilen sevginin hiçbiri kötü niyetli değil, ama sevgi ile sabır aynı anda gelmiyor her zaman.
peki ya bir toplulukta bunu nasıl başarırsın? herkes iyilik istiyorken, herkes katkı sunmak istiyorken — kimin ne zaman geri adım atacağını kim belirler? bazen kucağında hüngür hüngür ağlamaktan şişen bebeği devralıp, sana 3-5 dakika dinlenme fırsatı sunan anneanne ya da babaanneye hayır diyebilir misin?
eyy donald trump, gel de challenge gör!





