kızımla yapay zeka sohbetleri #2

bir baba, kızının beşiğine astığı oyuncağa bakıp bir anda "sinyal mi bu, gürültü mü" diye düşünmeye başlarsa ne olur

May 14, 2026

idil’in beşiğinin üstündeki dönence bir akşam kendi kendine dönmeye başladı — bir haftada bitirdiğimiz piller değişmişti, artık benim kurcalamama gerek yoktu. o akşam fark ettim ki idil ona pek bakmıyordu. dönenceden sarkan kelebek kanatlı ayıcıklar dönüyor, müzik çalıyor, renkli figürler yavaşça geçiyordu gözünün önünden — ama bakışları oradan kayıp gidiyordu. ama elimle uzanıp dokunduğumda, ya da yüzümü ona çevirip bir şeyler mırıldandığımda, gözleri hemen o tarafa kayıyordu, birkaç saniye orada kalıyordu.

aynı hareket, aynı renkler, neredeyse aynı ses. tek fark, birinin bana bağlı olması, diğerinin olmaması.

*bazen fark etmek, sadece bakmayı bırakıp gerçekten izlemekle başlıyor.*

bu küçük gözlem, aslında idil daha doğmadan bile kafamda dönen bir soruyu netleştirdi: idil’e sunduğumuz şey ne kadar “veri”, ne kadar “gürültü”?

yaklaşık 15 yıldır yapay zeka alanında çalışıyorum — modellerle, verilerle, sistemlerle. bu tuhaf, uykusuz günlerde mesleki refleksim durmadan devreye giriyor. idil’in etrafına astığımız her oyuncak, açtığımız her müzik, okuduğumuz her kitap, aslında bir veri toplama kararı gibi görünmeye başladı bana. hangi veriyi topluyoruz, hangi kalitede, hangi yoğunlukta?

etiketlediğimiz binlerce veri noktası, eğittiğimiz yüzlerce model, çözmeye çalıştığımız onlarca problem — hepsi günün sonunda tek bir soruya yanıt vermek içindi: bir sistem nasıl öğrenir? bu soruya verilen cevaplar yıllar içinde değişti, araçlar değişti, ama esas yaklaşım büyük ölçüde aynı kaldı: iyi öğrenen sistemler genellikle iyi genelleme yapar; genelleme yaparsa, daha önce hiç görmediği durumlarla başa çıkabilir.

model eğitiminde ilk gereksinim hiç şüphesiz verinin kalitesi. büyük veri, bol veri, kocaman veri her zaman iyi veri anlamına gelmiyor. gürültülü, kendini tekrarlayan, bir tarafı kayıran verilerle eğitilen modeller belirli eşik değerlerde takılıp kalıyor — ne kadar veri eklersen ekle, performans platoya oturuyor.

bebekler için de benzer bir şey geçerli olmalı diye düşündüm önce. uyaran bolluğu, uyaran kalitesi değildir — dedim kendi kendime, biraz da kendimi ikna etmek için.

sonra araştırmalara baktım ve tahminimden daha ilginç bir tablo çıktı karşıma.

yenidoğan araştırmalarında öne çıkan kavramlardan biri contingent responsiveness — yani bir uyaranın bebeğin kendi eylemine veya ilgisine tepki olarak gelmesi. bir çalışmada bebeklerin dikkatinin, görüntünün en çok bilgi taşıyan bölgelerine esnek biçimde yöneldiği, göz hareketleriyle etkileşimli (gaze-contingent) bir düzenekte gösterilmiş; bebekler pasif biçimde izlemiyor, bakışlarını değişen koşullara göre aktif olarak ayarlıyorlar. yani bebek, kendisine gelen sinyalin kendi eylemiyle ilişkili olup olmadığını fark edebiliyor — sanki kendi reward sinyalini arıyor gibi. bu, denetimli öğrenmedeki sabit etiketten çok, pekiştirmeli öğrenmedeki ödül fonksiyonuna benziyor: bebek edilgen bir alıcı değil, ortamı kendi eylemleriyle test eden bir ajan.

bir başka derleme ise daha net bir ayrım yapıyor: beşik dönenceleri gibi pasif, tekrarlayan uyaranların dil gelişimini hızlandırdığına dair hiçbir kanıt yok; dil gelişimini asıl süründüren şey, bakıcının bebeğin ipuçlarına verdiği contingent — anlık, karşılıklı — tepkiler. dönencenin pillerini değiştirmesek de, sonuç değişmiyor. bir dönencenin “gerekli” olmaması bir şey, “faydalı” olmaması başka bir şey — asıl fark, doğru zamanda, doğru gelişim penceresinde gelen uyaranın beyinde ölçülebilir bir etki bırakması.

bu da tam idil’in dönenceye bakmayışını açıklıyor aslında. dönence, kaliteli ya da niteliksiz olmaktan öte, konudan bağımsız (irrelevant) bir sinyal üretiyor artık — idil’in ne yaptığından bağımsız, sabit bir döngü. benim sesim ya da dokunuşum ise onun bakışına, hareketine cevap veriyor. istatistiksel dille söylersek: biri idil’in davranışıyla ilintili, diğeri değil.

pekiştirmeli öğrenme (reinforcement learning) tarafında bunun bir karşılığı var: bir ajan, ortamı keşfederken (exploration) rastgele hareketler dener, hangi eylemin hangi ödülü getirdiğini öğrenir; zamanla bildiği en iyi stratejiyi kullanmaya (exploitation) kayar. ama bu geçiş, ortamdan gelen sinyal tutarlı ve eyleme bağlıysa anlamlı olur. eğer ödül, ajanın ne yaptığından bağımsız rastgele geliyorsa, ajan hiçbir zaman öğrenemez — çünkü öğrenecek bir örüntü yoktur, sadece gürültü vardır.

idil’i izlerken bunu gözümde canlandırıyorum: o da küçük bir keşif döngüsünde. bir sesi tekrar duymak için ağlıyor, bir yüzü görmek için başını çeviriyor, bir dokunuşu tekrar hissetmek için kıpırdanıyor. her seferinde ortamın ona nasıl cevap verdiğini test ediyor. eğer cevap tutarlıysa — ağladığında biri geliyorsa, başını çevirdiğinde bir yüz oradaysa — bu, öğrenilebilir bir örüntü. eğer cevap rastgeleyse, ne kadar sık tekrarlanırsa tekrarlansın, öğrenilecek bir şey yok demektir.

burada işler benim beklediğimden daha ilginç bir yere gidiyor, çünkü “gürültülü veri her zaman kötüdür” önermesi de tam doğru değil. az veriyle büyük problemleri çözmeye çalıştığımız projelerde, genelleme kapasitesini arttırmak için bilerek hatalı etiketlenmiş veri eklerdik — ve mucizevi şekilde işe yarardı, yeter ki ölçek yeterince büyük olsun.

The Unreasonable Effectiveness of Noisy Data for Fine-Grained Recognition

yani gürültü, belli bir hacimde ve belli bir bağlamda modeli daha kırılgan değil, daha dayanıklı hale getirebiliyor — tıpkı hayatın çoğu iyi planlanmış şeyin, biraz belirsizlik ve hatayla yoğrulduğunda beklenenden daha başarılı çıkması gibi. idil’in dünyası da tamamen steril, tamamen “temiz” olmak zorunda değil belki — ufak tutarsızlıklar, beklenmedik sesler, planlanmamış anlar da onun genelleme kapasitesine katkı sağlıyor olabilir.

bunu kendi üzerimde de test ediyorum aslında. mükemmel, öngörülebilir, hiç sapmayan bir rutin kurmaya çalışsam — her ağlamaya aynı saniyede aynı tepkiyi versem, her gün birebir aynı sesle, aynı tonla konuşsam — belki idil için daha “temiz” bir sinyal üretirdim. ama muhtemelen daha kırılgan bir model de yetiştirirdim: sadece o tek örüntüyü tanıyan, ondan sapan her şeyi anlamlandıramayan bir sistem. benim tutarsızlıklarım, yorgunluğum, bazen geç kalan tepkilerim — bunlar da bir tür gürültü, ama belki de idil’in gerçek dünyayla, gerçek insanlarla başa çıkmasını sağlayacak gürültü.

asıl mesele verinin hacmi ya da temizlik de değil, neyin hangi bağlamda işe yaradığını bilmek. bu da beni ikinci bir kavrama getiriyor: bir modelin ne öğrendiği kadar, ne öğrenmediğini bilmek de önemli. confusion matrix, tam olarak bunun için var — modelin nerede, hangi sınıfı hangi sınıfla karıştırdığını gösteren bir harita. iyi eğitilen bir model doğru cevabı ezberlemez, doğru cevabı nerede arayacağını öğrenir; hatalarının haritasını çıkarmak, doğrularının listesini çıkarmaktan çoğu zaman daha öğreticidir.

*bir modelin nerede yanıldığını bilmek, nerede haklı olduğunu bilmekten daha çok şey anlatır.*

bunun bir de tehlikeli yüzü var: halüsinasyon. bir model, elinde yeterli veya güvenilir sinyal olmadığında, “bilmiyorum” demek yerine kendinden emin bir şekilde yanlış bir cevap üretebiliyor — çünkü çoğu model, belirsizliği ifade etmek üzere değil, her koşulda bir çıktı üretmek üzere eğitiliyor. confusion matrix’in gösteremediği asıl şey de bu: bir modelin ne zaman “bilmiyorum” demesi gerektiğini bilip bilmediği.

idil için de benzer bir soru var kafamda. bir bebek, eline yetersiz ya da tutarsız sinyal geldiğinde, kendi küçük dünyasında bir tür “halüsinasyon” üretiyor olabilir mi — yanlış bir örüntüyü, sanki gerçekmiş gibi içselleştirebilir mi? bunun kesin bir cevabını henüz bilmiyorum, ama soru kendini sormaya değer buluyor. belki de erken çocukluktaki bazı korkular ya da beklenmedik tepkiler, tam olarak bu: eksik veriyle kurulmuş, aşırı genelleştirilmiş bir örüntü. bir köpeğin sesinden korkan bir bebeğin, aslında “her ani ve yüksek ses tehlikelidir” gibi çok geniş bir kuralı, çok az örnekten çıkarmış olması gibi.

idil’in etrafındaki dünya ona zengin mi görünüyor, yoksa sadece kalabalık mı — bunu hâlâ bilmiyorum. ama artık en azından hangi soruyu sormam gerektiğini biliyorum: bu uyaran, idil’in yaptığı bir şeye mi cevap veriyor, yoksa idil ne yaparsa yapsın aynı mı kalıyor?

konuşmalar, sorular, sessizlik anları, müzik, kitaplar, yürüyüşler — hepsinin ortak bir özelliği olmalı, ve sanırım bu özellik hacim değil, cevap verme kapasitesi. şu kontrastı yüksek aynalı kitaplar bile, idil’in bakışına göre sayfa çevrilirse anlam kazanıyor; kendi başına dönen bir dönenceden farklı olarak. bir kitap rafı dolusu oyuncak, tek başına hiçbir şey öğretmiyor — ama aynı oyuncaklardan biri, idil’in uzattığı elin, çevirdiği başın karşılığı olarak devreye girdiğinde, birden bir veri noktasına dönüşüyor.

bu beni biraz rahatlatıyor açıkçası, çünkü “en pahalı, en gelişmiş, en çok uyaran içeren” ürünleri araştırmaktan kendimi alıkoyuyor. asıl mesele ürünün karmaşıklığı değil, benim ya da merve’nin o ürünle idil’in eylemine ne kadar cevap verdiğimiz. en basit bir ahşap kaşık bile, doğru anda, doğru tepkiyle sunulduğunda en “akıllı” oyuncaktan daha zengin bir sinyal taşıyabilir.

her şeyi aşırı optimize etmeye çalışan bir ebeveyn olmak gibi bir niyetim yok. sadece doğru soruları sorup, olan biteni anlamak istiyorum. idil’e her şeyin cevabını vermek istemiyorum — soruların nasıl sorulduğunu göstermek istiyorum. bu, teoride güzel bir cümle. pratikte ne anlama geldiğini henüz bilmiyorum.

idil’in dünyasını zenginleştirmek, ona daha fazla şey sunmak değilmiş demek ki — ona sunduğumuz şeylerin, onun kendi hareketine, bakışına, sesine ne kadar cevap verdiğini arttırmakmış. bir modelin performansını arttırmak için veri hacmini değil, verinin sinyal taşıma kapasitesini arttırdığımız gibi. ve tıpkı o noisy-data makalesinin gösterdiği gibi, mükemmel temizlik de tek başına bir amaç değil — belirsizliğin, hatanın, plansız anın da kendine göre bir katkısı olabiliyor, yeter ki temel sinyal sağlam olsun.

peki idil büyüdükçe, onun için hangi “gürültü” aslında gizli bir sinyal taşıyor olacak — ve ben bunu nasıl ayırt edeceğim?

belki de bu sorunun cevabı, hiçbir zaman tek bir formülde durmayacak. bir modelin doğru veri dağılımını bulması nasıl sürekli bir süreçse, idil’in dünyasındaki sinyali gürültüden ayırmak da tek seferlik bir karar değil, haftalar ve aylar boyunca yeniden kalibre edeceğim bir şey olacak sanırım.

kızımla yapay zeka sohbetleri

Bu post hakkında tartışma

Daha fazlasına hazır mısınız?