kızımla yapay zeka sohbetleri #1
iki hafta önce baba oldum.
daha doğrusu hayatımın en uzun gecelerinden birinin ardından, sabahın erken saatlerinde hastane koridorunda oturmuş, elleri titrerken telefon tutmaya çalışan biri haline geldim.
idil’in doğumhane kapısından kollarıma teslim edildiği an aklımdan ne geçti bilmiyorum. muhtemelen hiçbir şey. yıldızlar arası yapılan bir yolculuk gibiydi.. bazı anlar, düşünceyi askıya alır nitekim.
ama sonraki günlerde, o tuhaf yenidoğan uykusuzluğunun içinde, meslek hayatımın üzerime çöküp oturduğunu hissettim. yaklaşık 15 yıldır yapay zeka alanında çalışıyorum. veriyle, modellerle, sistemlerle..
ve şimdi karşımda, dünyanın en karmaşık öğrenme makinesi var: henüz birkaç günlük, hiçbir şey bilmeyen ama her şeyi öğrenmeye programlanmış bir insan.
yıllardır insan beynini “modellemeye” çalışan işler yaptım. şimdi de belki hayatımda ilk kez, bunu kendi kendine yapacak birinin bu kadar yakınındayım. müthiş bir gözlem fırsatı!
ilk başta biraz absürd gelse de, bunların arasında bir bağlantı kurmak mümkün mü acaba diye düşünmeye başladım.. en azından mesleki açıdan ve babasal açıdan profesyonel bir şekilde bu süreci ele almayı denemek istiyorum.
etiketlediğimiz binlerce veri, eğittimiz yüzlerce model, çözdüğümüz onlarca problem.. okuduğumuz makaleler, blog postlar, haberler. hepsi günün sonunda tek bir soruya yanıt vermek içindi. “bir sistem, nasıl öğrenir?”
bu soruya verilen cevaplar değişti.. araçlar değişti.. ama esas yaklaşım büyük ölçüde hep aynı kaldı. iyi öğrenen sistemler, genellikle iyi genelleme yapar. genelleme yaparsa, daha önce hiç görmediği durumlarla başa çıkabilir.
idil henüz iki haftalık. görme mesafesi birkaç on santimetreyle sınırlı. seslerden önce korkuyor, sonra alışıyor. her gün bir şeylerin biraz daha fazlasını kaydediyor — yüzümü, sesimi, ışığın değişimini. nöronları, hiçbir mühendis müdahalesi olmadan, kendi mimarisini kuruyor. adeta bir reinforcement learning agentı.
bunu bir metafor olarak kullanmak kolay olurdu ama beni asıl meşgul eden şey metafor değil. benim bugünden dert etmeye başladığım şey, yıllarca modellerin başarımını arttırmak için kullandığımız o yöntemleri idil’in öğrenme süreçlerini desteklemek için nasıl kullanabileceğim.. ya da kullanabilecek miyim?
model eğitimde ilk gerekirimiz hiç şüphesiz verinin kalitesi. büyük veri, bol veri, kocaman veri her zaman o kadar iyi veri anlamına gelmiyor nitekim. gürültülü, kendi tekrarlayan, bir tarafı kayırmaya müsait nitelikte verilerle eğittiğimiz modeller belirli başlı eşik değerlerde takılıyor.
bebekler için de bu durumun bir varsayımın ötesine geçeceğini düşünüyorum. uyaran bolluğu, uyaran kalitesi değildir. umarım buradan yapacağım somut çıkarımlar, ekran süresi gibi tartışmaların da kökünü kazır.
peki, idil’in etrafındaki dünya ona zengin mi yoksa gürültülü mü görünüyor? bunu nasıl anlayabiliriz? madem zengin bir veri sunmamız gerekiyor, buradaki zenginliği nasıl ölçeceğiz? ben bir süre bu soruya yanıt bulmaya ve objektif gözlemlerime devam edeceğim gibi görünüyor.
konuşmalar, sorular, sessizlik anları, müzik, kitaplar, yürüyüşler. bunların hepsinin bir kalitesi var şüphesiz. şu kontrastı yüksek aynalı kitaplar falan.. her biri düşünülmüş ve boşu boşuna reyonlara konulmamış ürünler olsa gerek.
kafamda aktif olarak dönen düşüncelerden birisi de bu halüsinasyon konuları ve confussion matrix’imizin durumlarının ne olacağı.. çünkü bir şeyler eğiten herkes bilir ki, modelimizin ne öğrendiği kadar ne öğrenmediği de müthiş önemlidir. iyi eğitilen bir model, doğru cevabı ezberlemez. doğru cevabı nerede araması gerektiğini öğrenir. bu da aslında az önce tartıştığımız genelleme konusunun bir parçası.
bence tüm bu yapay zeka tartışmalarındaki en romantik, en devrimci hareketlerden birine de değinmeden geçmeyeceğim. özellikle, az veriyle büyük problemleri çözme süreçlerimizde genelleme kapasitesini arttırmak için zaman zaman hatalı etiketlenmiş verileri de eklerdik. ve mucizevi şekilde bu yöntem çalışırdı. aynı hayat gibi değil mi? çok iyi planlanan şeylerin zaman zaman belirsizlikle, hatalarla, düzeltmelerle yoğrulduğunda tahmin edilenden daha başarılı olması gibi aynı..
The Unreasonable Effectiveness of Noisy Data for Fine-Grained Recognition
işler alevlenmeden, birkaç şeyi araya sıkıştırmakta da fayda var. her şeyi aşırı optimize etmeye çalışan ebeveyn olmak gibi bir niyetim kesinlikle yok. sadece doğru sorular sorup, olanı biteni anlamak istiyorum. tamamıyla içgüdülerimle yönettiğim babalık sürecimde, eksik kaldığım yerleri de tanımlamak istiyorum.
idil’e her şeyin cevabını vermek istemiyorum. soruların nasıl sorulduğunu göstermek istiyorum. bu, teoride güzel bir cümle. pratikte ne anlama geldiğini henüz bilmiyorum. ama önümde idil ile birlikte uzunca bir zaman var. başaracağımıza hiç şüphem yok.
bu yazı bir tanıtım yazısı aynı zamanda. bundan sonra, bu iki dünyanın —yapay zeka ve ebeveynlik— kesişim noktalarını yazmaya çalışacağım. bazen teknik olacak, bazense çok daha hissiyatsal.. bazen idil’in bir haftalık gelişimiyle ilgili bir gözlem, beni veri dağılımları hakkında düşündürecek. bazen bir makine öğrenmesi kavramı, bana kötü bir ebeveynlik kararı aldığımı fark ettirecek.
ikisini her seferinde birbirine bağlamak zorunda değilim. ama zorunda olmadığım şeyleri yazmak, hep daha ilginç olmuştur.
idil iki haftalık. ben de bu rolde iki haftalığım. ikimiz de ne yaptığımızı tam bilmiyoruz. bu her halükarda çok heyecan verici değil mi?
PS: pirsig’in zen ve motorsiklet bakım sanatı’nı okuduktan sonra, ben de çocuğumla bir yolculuk hikayesi yazmalıyım demiştim. yanis varoufakis’in kızımla ekonomi sohbetleri ise bu yolculuğun fiziksel olmasa da olabileceğini ispat etmişti. buradan, ilham veren iki büyüğümüze de selamlar, saygılar. ve sevgili igumm olur da substack yok olup gitmezse, babandan sana böyle de bir anı kaldı.


