Zeka Üzerine, Altay Cem Meriç’e Karşı
Birkaç gündür süregelen ırklar ve gruplar arası zeka farklılıkları tartışmalarında, ACM, “hayır biz metodoloji biliyoruz” diyerek ilginç bir “eleştiri listesi” paylaştı.
ACM’nin neden kendi kapasitesinin üstündeki işlere karışmaması gerektiğini göstereceğim.
⦁ Sözde-analiz nedir?
ACM’nin arkadaşının yazdıkları, Thomas Bouchard’ın yine tam da bu konu üzerine bahsettiği “sözde-analiz” tanımına epey uyuyor. Direkt Bouchard’dan alıntılayarak:
“Herediteryen1 araştırmalara getirilen pekçok eleştirinin asli unsuru, hem test edilen modellerin her varsayımının karşılanması hem de olası tüm hataların elenmesi bakımından, aşırı bir titizlik aranmasıdır. Alakalı olabilecek veya olamayacak birçok varsayım ve potansiyel hatalar sıralanıp uzun uzadıya tartışılır. Hataya sebep olabilecek potansiyel faktörlere dair tartışma uzadıkça, eleştirmenler bunların hakikaten hata kaynağı olduğu sonucuna varmaya yatkınlaşırlar. Bölüm özeti veya sonuç kısmına gelindiğinde eleştirmenler tartışılan dizayndan herhangi bir şey öğrenmenin imkansız olduğunu vurgularlar. Fakat çoğunlukla, varsayımların ihlalinin olası etkileri hakkında oldukça şey biliyoruzdur… Dahası, potansiyel sistematik hataların etkileri test edilebilir. Fakat ne yazık ki eleştirmenler bunu çok nadir yapmaktadır.” (Modgil & Modgil, 1987: 68-69)
ACM’nin arkadaşının tartışması birebir sözde-analize uygun düşmekte. Neden bu sonuçların doğru olmayacağına dair birçok varsayımda bulunulup hiçbiri gerekçelendirilmiyor, veri sunulmuyor, test edilmiyor ve bunların kümülatif etkisinin bu genetik-farklılık tezini zayıflatacağı ima ediliyor. Fakat ben eleştirmenler gibi tembel olmadığım ve “kaçak dövüşmediğim” için tek tek her varsayım ve iddiaya hem teori hem veriyle yanıt vereceğim.
⦁ Spesifik eleştiriler
“Jensen, zeka testlerinin okul ve iş performansıyla olan ilişkisi için en iyi tahmincinin “g yükü” olduğunu belirtiyor, “g”, genel zeka faktörünü ifade eder. Ancak ”g” faktörünün gerçekten ne kadar genel veya evrensel olduğu konusunda tartışmalar bulunmaktadır.”
Burada “g faktörünün ne kadar genel olduğu konusunda tartışma bulunmaktadır” derken ne kast edildiğini anlayamadım açıkçası, zira g faktörü, psikometrik testlere verilen yanıtlar arasındaki korelasyonları faktör analizine tabi tuttuğumuzda ortaya çıkan bir örtük (latent) faktör. Evrensellik iddiası için de, “bu konuda tartışma bulunmaktadır” denilene kadar literatür ne diyor diye bakılabilirdi zira bu halihazırda test edilmiş bir soru. (Warne et al., 2019), Batı dışındaki 31 ülkede yapılmış zeka testi çalışmalarını (örneklem sayısı: 97) faktör analizine tabi tuttuğunda, testlerin tıpkı Batı örneklemlerinde olduğu gibi, benzer seviyede bir örtük tek faktör ortaya çıkardığını ortaya koyuyor.
“…Böylece, Spearman’in g’si, incelediğimiz 31 ülkeden gelen 97 veri kümesinden en az 94’ünde ortaya çıktı, geri kalan üç veri kümesinde de sonuçlar tartışmaya açıktı. Bu veri kümeleri, g kültürel bir inşa olsaydı ortaya çıkması en düşük ihtimalli kültür ve ülkelerden geldiği için, genel bilişsel kabiliyetin muhtemelen evrensel bir insani nitelik olduğu sonucuna varıyoruz.” (İtalikler yazarlara ait)
Zaten, beynin ve zekanın evrimini göz önüne alınca, bizim önvarsayımımız bir genel zeka varsa bunun evrensel bir faktör olduğu şeklinde olmalı.
“Jensen’in argümanı, bir testin “g yükü”nün, o testin okul ve iş performansıyla olan ilişkisi hakkında en iyi bilgiyi sağlayacağıdır. Ancak bu, testlerin objektif ve kültürlerarası olarak adil olduğu varsayımına dayanmaktadır.”
Testler ve yanlılıktan bahsedecektim fakat iddia teorik olarak doğrudan yanlış. Bir test, kültürel olarak adil olmasa bile alternatifler arasında en iyi bilgiyi sağlayabilir gayet zira alternatifleri daha kötü olabilir. Bunun dışında, “testler” deyip açmamak biraz işin tuhaf bir tarafı. Hangi testlerden bahsediyoruz? Mesela şu tartışmadaki skorlar sadece Raven-tarzı testler üzerinden gitmiyor, bunun yanında uluslararası akademik testleri de kapsıyor zira IQ testleri ile PISA tarzı testlerin ulusal çapta korelasyonu, örneklem kalitesi arttıkça 1’e yaklaşıyor. (Lynn & Meisenberg, 2009) Yani farklı milletleri karşılaştırmak için illa hepsine WAIS çözdürmek zorunda değiliz zira bu tür akademik testler de g’yi ölçüyor ve standart IQ testleriyle değişken olarak kullanılabilecek derecede yüksek korelasyona sahip, hatta bunlar birbirlerine dönüştürülebiliyorlar bile (Rindermann, 2007; Jones & Potrafke, 2014; Pokropek et al., 2022) Bu tür testlerin psikometrik yeterliliği zaten tekrar tekrar ölçülüyor, her bir akademik test için analizler hem dergilerde hem de ilgili kurumlarca yayınlanıyor.
Eğer bahsedilen testler çalışmada kullanılan ABD-içi testler içinse, testlerin kültürel göreceliği, nesnelliği vesaire Arthur Jensen, 800 sayfalık Bias in Mental Testing (1980) kitabını yazdığı zamandan bu yana tartışılmıyor. Hatta, APA’nın 1997 senesinde, zeka çalışmaları alanında uzmanlara, bu konulara aşina olmayan sıradan vatandaşı bilgilendirmek amacıyla yazma görevi verdiği bir bilgilendirme metni/makale vardır, “Intelligence: Known and Unknowns” başlığıyla yayınlanmıştır bu makale ve burada testlerde herhangi bir bias/yanlılık olmadığı, testlerin her etnisite için eğitimde, iş alanında vb. aynı öngörü geçerliliğine sahip olduğu söylenmektedir, dahası aynı makalede g’nin de zeka alanının asli teorisi olduğundan bahsedilmektedir. (Niesser et al., 1997) O zamandan bu yana bu konularda, tüm bunları tasdikleyen çalışmaların dışında bir şey yayınlanmış değil. Zaten yakın zamanda yayınlanmış olan, zeka alanında yayın yapmış uzmanlar üzerinden yapılmış olan görüş anketi de bunu gösteriyor.
“Tablo Verileri: Tabloda beş farklı ülkeden örnek büyüklüğü, ortalama IQ skoru ve reaksiyon süresi ölçümleri sunulmuştur. Ancak bu verilerin toplandığı kontekst ve örneklem gruplarının tam olarak nasıl seçildiği belirtilmemiştir.”
Bahsedilen tablo, (Jensen & Rushton, 2005)’ten alınma ve şu:
Tablonun altında ne yazıyor, benim İngilizcem çok yeterli değil anlamak için de sanki bana tablonun kaynağı veriliyormuş gibi geldi. Sanıyorum o kaynağa gidersek de nasıl toplandığını görebiliriz.
Reaksiyon Süresi ve IQ: Tabloda reaksiyon sürelerinin IQ ile ilişkisi gösterilmiştir. Ancak reaksiyon süresinin zeka ile doğrudan bir ilişkisi olduğunu iddia etmek, basit ve çok boyutlu olmayan bir zeka anlayışını desteklemektedir.”
Zerre bilgi sahibi olunmayan konularda konuşma devam ediyor. Bana bir tane, 1 tane, zeka araştırmacısı getirebilecek olan var mı “Reaction Time zeka ile ilgili değildir” diyecek? Zeka sahası için “doğal seçilim evrimsel sürecin parçasıdır” derecesinde temel bir bilgi için de kaynak vermek zorunda olmak her ne kadar üzücü olsa da (Der & Deary, 2017)’in highlights kısımlarından direkt aktarım yaparsam:
“Tepki Süresi ve genel bilişsel kabiliyet arasında, yaşla yükselen büyük bir korelasyon mevcut. Basit Tepki Süresi ile GBK ilişkisi ise daha kompleks [non-lineer].”
Tepki süresi konusunda teorik ve verisel referans kitabı, yine Arthur Jensen’in Clocking the Mind: Mental Chronometry and Individual Differences’ıdır. Jensen, entelektüel yaşamının son zamanlarını “psikometrinin fethetmesi gereken son sınırı” olarak gördüğü tepki süresine adamıştı zira tepki süresi testleri alışılagelmiş IQ testlerinin aksine ordinal ölçek değil mutlak ölçektir. Öğrenmeye oradan başlayabilirsiniz fakat kitap biraz teknik olduğu için sıkılabilir okuyucu, uyarayım.
Kültürel ve Sosyoekonomik Faktörler: Tabloda sunulan ülkeler arasındaki farklılıkların nedenleri üzerine detaylı bir inceleme yapılmamıştır. Bu farklılıkların arkasında yatan sosyoekonomik, eğitimsel veya kültürel faktörler gibi diğer potansiyel etkenler göz ardı edilmiştir”
Ya okunulan makale anlanamıyor ya da bu yorumu yapan arkadaş doğrudan yalan söylüyor. O makaleyi baştan sona okuyan kimse şu cümleyi kurmaz zira herediteryen tezin ne olduğundan, nasıl test edilebileceğinden, çevresel etkenlerle ilişkisinden vb. uzun uzadıya bahseden, alternatif hipotezleri değerlendiren bir makale. Dahası, bu sözde-analizcilik can sıkıyor zira sürekli “ya şöyleyse ya böyleyse şunu da analiz edin bunu da analiz edin” diye gezenlerin entelektüel tembelliği göz kamaştırıyor. Tezleri için elli farklı noktadan delil getiren (Warne, 2021; Fuerst et al., 2023), genetik karışım çalışmaları, moleküler genetik çalışmaları, meta-analizler, adaptasyon çalışmaları, Scarr-Rowe hipotezi testleri, küresel veri toplama, beyin tarama çalışmaları vb. akla gelebilecek her şekilde herediteryen hipotezi test etmeye çalışan taraf herediteryenlerken, çevreci kamptakiler “ya şöyleyse ya böyleyse” demekten ileri bir şey yapmıyor, kalkıp bir sonuç ortaya koymuyor ve hâlâ ısrarla gelip çalışma ve yanıt talep etme hakkı görüyorlar kendilerinde. Biraz da siz koyun elinizi taşınızın altına, olmaz mı? Oturup dataset çıkarın, faktör analizi yapın, admixture analysis yapın, ikiz çalışmalarına bakın, psikometrik testlerin niteliklerini test edin. Ama hayır, olur mu, “belki şu etkiliyor olabilir” deyip çekilmek varken neden tüm bu yükün altına girsinler? (Tam da bu konuda ileri okuma: Forty Years Squandered By Iq Environmentalists)
“Spearman’in hipotezi, zekâ testlerindeki ırksal farklılıkların, genellikle “g” olarak adlandırılan genel zekâ faktörüyle ilişkili olduğunu öne sürer. Bu hipoteze göre, bir zekâ testinin “g” yüklemesi ne kadar yüksekse, o testte ırksal gruplar arasındaki fark da o kadar belirgin olacaktır. Bu hipoteze yönelik eleştiriler şunlardır: Gözlemsel Korelasyon ve Nedensellik: Spearman’in hipotezi temelde bir korelasyon ilişkisi sunmaktadır. Ancak korelasyon, nedenselliği göstermez. Bu nedenle, “g” yüklemeleri ile ırksal farklar arasındaki ilişkinin nedenini kesin olarak belirlemek zordur.”
Bu ne demek? Faktör analizinin ne olduğunu, g’nin bu testlerden nasıl çıkarıldığını, varyasyon açıklamayla ilişkili olduğunu anlamıyor musunuz da “korelasyon nedensellik değildir” tarzı midwitliğe bağlayabiliyorsunuz? “Korelasyon, nedensellik değildir”in, testin genel zeka ölçüm kabiliyeti arttıkça test sonuçlarında gruplar arası farkların artmasının doğruluğu veya yanlışlığıyla ne gibi bir ilgisi olabilir?
“G” Kavramının Belirsizliği: “G” faktörünün gerçekte neyi temsil ettiği konusunda geniş bir tartışma vardın Bazı araştırmacılar, “g” faktörünün gerçek bir bilişsel yetenek olup olmadığını veya sadece test sonuçlarının bir yansıması olup olmadığını sorgulamıştır.”
g kavramının tam olarak nesinin belirsiz olduğunu anlayamadım. Reel bir latent faktör olduğunu biliyoruz, moleküler genetik çalışmaları sağolsun doğrudan kanıta dahi sahibiz g’nin varlığına. (la Fuente et al., 2019) Zaten Carroll’ın mihenktaşı sayılabilecek Human Cognitive Abilities: A Survey of Factor-Analytic Studies (1993)’ünden sonra g’den şüphe eden kalmadı sayılır. Bunu, yukarıda zikrettiğim ankette aynı tabloda da görebilirsiniz.
Sürekli olarak “x tanımlanamıyor, eleştiriler var, kompleks” vb. demek hakiki bir analiz veya eleştiri değil, tekrar tekrar belirtmek istiyorum. Açıp bu alanın kalesi olan Intelligence dergisini, baktığınızda, her sayıda, başlığında “general intelligence” kelimesi geçen en az bir veya iki makale yayınlanıyor. Neden sanki ortada bir konsensus yokmuş, her şey şüpheliymiş, araştırmacılar ne yaptığını bilmiyormuş, söylediğiniz şeylere yanıt vermemişler gibi davranıyorsunuz?
Açıkçası ekran görüntülerinde geri kalan şeyler de aynı tarzda sözde-eleştiriler. Spesifik yanıt verilebilecek bir şey yok. Sürekli aynı şeyler tekrarlanıyor.
Sonuç olarak; çocuk veya mürit kandırmak kolay, hele de “ben bunu uzman arkadaşıma gönderdim” diyerek fakat böyle entelektüel madrabazlıklara gerek yok. Ortadaki tartışmaya dürüstçe dahil olabiliyorsanız öyle olun, olamıyorsanız kendi sınırınızı bilip çekilmek daha iyi.
Yazar: Sıfır Hipotezi
KAYNAKÇA
De La Fuente, J., Davies, G., Grotzinger, A. D., Tucker-Drob, E. M., & Deary, I. J. (2019). Genetic “General Intelligence,” Objectively Determined and Measured [Preprint]. Genetics. https://doi.org/10.1101/766600
Der, G., & Deary, I. J. (2017). The relationship between intelligence and reaction time varies with age: Results from three representative narrow-age age cohorts at 30, 50 and 69 years. Intelligence, 64, 89–97. https://doi.org/10.1016/j.intell.2017.08.001
Fuerst, J., Shibaev, V., & Kirkegaard, E. O. W. (2022). A Genetic Hypothesis for American Race/Ethnic Differences in Mean g: A Reply to Warne (2021) with Fifteen New Empirical Tests Using the ABCD Dataset [Preprint]. PsyArXiv. https://doi.org/10.31234/osf.io/ge4zu
Lynn, R., & Meisenberg, G. (2010). National IQs calculated and validated for 108 nations. Intelligence, 38(4), 353–360. https://doi.org/10.1016/j.intell.2010.04.007
Modgil, S., & Modgil, C. (2006). Arthur Jensen, consensus and controversy. Falmer Press.
Neisser, U., Boodoo, G., Bouchard, T. J., Boykin, A. W., Brody, N., Ceci, S. J., Halpern, D. F., Loehlin, J. C., Perloff, R., Sternberg, R. J., & Urbina, S. (1996). Intelligence: Knowns and unknowns. American Psychologist, 51(2), 77–101. https://doi.org/10.1037/0003-066X.51.2.77
Pokropek, A., Marks, G. N., Borgonovi, F., Koc, P., & Greiff, S. (2022). General or specific abilities? evidence from 33 countries participating in the PISA assessments. Intelligence, 92, 101653. https://doi.org/10.1016/j.intell.2022.101653
Rindermann, H. (2007). The g‐factor of international cognitive ability comparisons: The homogeneity of results in PISA, TIMSS, PIRLS and IQ‐tests across nations. European Journal of Personality, 21(5), 667–706. https://doi.org/10.1002/per.634
Rindermann, H., Becker, D., & Coyle, T. R. (2020). Survey of expert opinion on intelligence: Intelligence research, experts’ background, controversial issues, and the media. Intelligence, 78, 101406. https://doi.org/10.1016/j.intell.2019.101406
Rushton, J. P., & Jensen, A. R. (2005). Thirty years of research on race differences in cognitive ability. Psychology, Public Policy, and Law, 11(2), 235–294. https://doi.org/10.1037/1076-8971.11.2.235
Warne, R. T. (2021). Between-Group Mean Differences in Intelligence in the United States Are >0% Genetically Caused: Five Converging Lines of Evidence.
Warne, R. T., & Burningham, C. (2019). Spearman’s g found in 31 non-Western nations: Strong evidence that g is a universal phenomenon. Psychological Bulletin, 145(3), 237–272. https://doi.org/10.1037/bul0000184
Herediteryen: “Heredity” yani “kalıtsallık”tan gelen ve “gruplar arası zeka farklarının önemsiz olmayan derecede genetik ile belirlendiğini söyleyen” kişilere verilen isim.