Allison Whitten
Yıllardır, birçok yapay zeka meraklısı ve araştırmacı makine tahsilinin çağdaş tıbbı değiştireceğine dair kelamlar verdi. Kanser, kalp marazı ve psikiyatrik bozukluklar üzere durumları teşhis etmek için binlerce algoritma geliştirildi. Şimdiyse, algoritmalar artık CT taramaları ve akciğerlerin X-ray manzaralarındaki desenleri tanıyarak Covid-19’u tespit etmek üzere eğitiliyorlar.
Bu modellerin büyük kısmı hangi hastaların en ağır sonuçlarla karşılaşacağını ve kimlerin teneffüs cihazına muhtaçlık duyacağını iddia etmeyi amaçlıyor. Heyecan hissedilir raddede yüksek; şayet modeller doğruysa, hekimlere, hastaları test etme ve korona virüsüne yakalanan hastaları tedavi etme hususlarında büyük bir ilerleme sağlayabilirler.
ACI GERÇEKLER
Ne var ki gerçek Covid-19 hastalarının tedavisi için yapay zeka destekli ilaç ihtimali şimdilik çok uzakta üzere görünüyor. Dünyanın dört bir yanından bir küme istatistikçi, makine tahsili modellerinin büyük çoğunluğunun kalitesinden ve hastanelerin yakın devranda bunları tasarrufa alması durumunda neden olabilecekleri zararlardan dolayı kaygı duyuyorlar.
Hollanda’da bulunan Utrecht Üniversitesi Tıp Merkezi’nde tıbbi istatistikçi olarak hizmet yapan Maarten van Smeden, “Bu bizi çok korkutuyor; zira modellerin tıbbi kararlar almak için kullanılabileceğini biliyoruz” diyor. “Eğer model berbatsa, tıbbi kararlar olumsuz etkilenebilir. Bu yolla da hastalara zarar görebilir.”
Van Smeden, Covid-19 modellerini standart hale getirilmiş ölçütler kullanarak kıymetlendirmek üzere toplanan ve milletlerarası araştırmacılardan oluşan geniş bir ekibin yürüttüğü bir girişime liderlik ediyor. Girişim, BMJ’de (Britanya Tıp Bülteni/ç.n.) üzerindeki birinci canlı (online) inceleme; yani 40 kişilik bir hakem kümesinden oluşan (ve büyüyen) ekip, yeni modeller piyasaya sürüldükçe incelemelerini canlı biçimde güncelliyor.
Şu ana dek, Covid-19 makine öğrenme modelleri hakkındaki değerlendirmeleri olumlu değildi: Geniş bir yelpazedeki araştırma ortamlarında çalışan bilirkişilerin ve önemli bir done birikiminin eksikliğinden ötürü külfet yaşanıyor. Öte yandan, yeni Covid-19 algoritmalarının karşı zıdda kaldığı sıkıntılar hiç de yeni değil: Tıbbi araştırmalarda kullanılan yapay zeka modelleri yıllardan beridir derin kusurlar barındırıyor ve van Smeden üzere istatistikçiler yaşanan gelgiti bilakis çevirmek için alarm çanını çalıyor.
‘ZORLA ALINAN’ DATALAR
Covid-19 salgınından evvel, Vanderbilt Üniversitesi’nde biyoistatistikçi olan Frank Harrell, mevcut tıbbi yapay zeka modelleriyle ilgili yaygın görülen sıkıntılar hakkında tıbbi araştırmacılarla görüşmeler yapmak üzere devlet umumunda seyahat ediyordu. Sıkça, bu sorunu tanımlamak için ünlü bir ekonomistten bir satır ödünç alıyor: Tıp araştırmacıları ‘bir itiraf elde edene kadar donelere azap etmek için’ makine tahsilini kullanıyorlar.
Sayılar Harrell’ın tezini destekliyor ve tıbbi algoritmaların büyük kısmının temel kalite standartlarını zar sıkıntı karşıladığını ortaya koyuyor. Ekim 2019’da, İngiltere’de bulunan Birmingham Üniversitesi’nden Xiaoxuan Liu ve Alastair Denniston liderliğindeki bir araştırma ekibi, modaya iyi fakat çetin bir soruyu yanıtlamayı hedefleyen birinci sistematik tahlili yayınladı: Makineler, hastaları teşhis etmede insan tabipler kadar ve velev onlardan daha iyi olabilirler miydi? Makine öğrenme algoritmalarının birçoklarının, tıbbi görüntüleme aracılığıyla illetler tespit edilirken insan hekimlerle eşit olduğu sonucuna vardılar. Bununla birlikte, daha sağlam ve şok edici bir bulgu laf konusuydu; 2012’den bu yana yayınlanan hastalık tespit algoritmaları hakkında yapılan yekun 20 bin 530 çalışmanın lakin yüzde birinden daha azı, tahlillerine dahil edilecek kadar metodolojik olarak titizdi.
Araştırmacılar, yapay zeka çalışmalarının büyük çoğunluğunun iç karartıcı bir kalitede olmasının, tıp sahasında yapay zekanın son devirlerde ölçüsüz ağırlığa maruz kalmasıyla direkt bağlı olduğuna inanıyorlar. Bilim kişileri çalışmalarına git gide daha fazla yapay zeka eklemek istiyor ve tıp mecmuaları de yapay zeka kullanan çalışmaları her zamankinden daha fazla yayınlamak istiyorlar. Denniston, “Yayına giren çalışmaların kalitesi, başlığında yapa zeka olmayan bir çalışmayla kıyaslandığında bile beklediğimiz kadar iyi değil” diyor.
Ve evvelki algoritmalarda görülen temel kalite meseleleri Covid-19 modellerinde de ortaya çıkıyor. Covid-19 hakkındaki makine öğrenme algoritmalarının sayısı süratle arttıkça, bu ortamda esasen var olan tüm meselelerden oluşan bir mikrokozmos haline geliyorlar.
KUSURLU MUHABERE
Tıpkı öncülleri üzere, yeni Covid-19 modellerinin kusurları da şeffaflık eksikliğiyle başlıyor. İstatistikçiler sadece sınırlı bir Covid-19 yapay zeka çalışmasının araştırmacılarının bile aslında ne yaptığını anlamaya çalışırken çetin devranlar geçiriyorlar; zira haberler birden fazla sefer kendi yayınlarında dahi belgelenmiş değil. Van Smeden, “O kadar istenilmeyen rapor ediliyorlar ki, bırakın bu modellerin çıktı olarak ne sunduklarını, girdi olarak neleri barındırdığını bile tam olarak anlayamıyorum” diyor. “Bu, fecî bir durum.”
Van Smeden’in ekibi, belgelendirme eksikliğinden ötürü, birinci etapta modelin oluşturulması için gereken donelerin nereden sağlandığından emin olamıyor; bu durum, modelin, illetin ciddiyeti hakkında yanlışsız teşhisler yahut iddialar yapıp yapmadığını değerlendirmelerini zorlaştırıyor. Bu da modelin yeni hastalara uygulandığında yanlışsız sonuçlar verip vermeyeceği hususunda bir belirsizlik yaratıyor.
Yaygın rastlanan bir sair sorun, makine tahsili algoritmalarının eğitiminin büyük ölçüde olgu gerektirmesi ancak van Smeden, ekibinin gözden geçirdiği modellerin çok az olgu kullanıldığını söz ediyor. Karmaşık modellerin milyonlarca değişken içerebileceğini söylüyor ve bu durum, hakikat bir teşhis yahut hastalık ilerlemesi modeli oluşturmak için binlerce hastayla ilgili data kümelerinin kullanılmasının gerekli olduğu mealine geliyor. Buna rağmen, van Smeden, var olan yüzlerce modelden pek birçoklarının bu geniş meydana yaklaşmayı bile başaramadığını söylüyor.
Bununla birlikte, done kümelerinin küçük olmasının sebebi, dünya çapındaki Covid-19 vakalarının eksik olması değil. Van Smeden, bundan ziyade, araştırmacılar arasındaki işbirliği eksikliğinin, ekiplerin kendi küçük olgu kümelerine güvenmelerine yol açtığını söylüyor. Bu durum, tıpkı devranda, çeşitli sahalarda çalışan araştırmacıların birlikte çalışmadığını gösteriyor ve araştırmacıların klinik bakımı ilerletme konusunda gerçek bir talihi olan modeller geliştirme ve ince ayarlar yapma kabiliyetinde büyük ve yavuz bir köstek oluşum ediyor.
Van Smeden’in de belirttiği üzere, “Yalnızca modelleyicinin bilirkişiliği yetmiyor, birebir devranda istatistikçilerin, epidemiyologların ve klinisyenlerin de nitekim yararlı bir şeyi gerçekleştirmek için birlikte çalışması gerekiyor”. Van Smeden, son olarak, yapay zeka araştırmacılarının bir salgın sırasında bile hep kaliteyi sürat ile dengelemesi gerektiğini işaret ediyor. Neticede, beğenilmeyen modeller olan süratli modeller, vakit kaybına neden oluyor.
Van Smeden “Bizler istatistik polisi olmak istemiyoruz” diyor. “İyi modeller bulmak istiyoruz. Şayet ortada iyi modeller varsa, bence ziyadesiyle yardımcı olabilirler.”
Metnin aslı Discover Magazine sitesinden alınmıştır. (Çeviren: Tarkan Tufan)
Gazete Duvar






