06 Nisan 2025
İki haftalık aranın ardından tekrar merhaba. Ülkedeki son gelişmelerle ilgili, verilere dayalı bir yazı yazmak istiyordum, fakat halihazırda bu minvalde yazılar yazıldığı için onları tekrar etmek istemedim. O nedenle bu hafta yine bu köşenin ağırlığını oluşturan yapay zekâ üzerinden ilerlemek istedim. Ancak önümüzdeki haftalarda verinin de bollaşacağı varsayımıyla tekrar bugünlere yönelik bir yazı yazmak mümkün olabilecek.
İçinde bulunulan sürecin gündem yoğunluğu nedeni ile başka konuların pek konuşulma imkânı olmuyor elbette. Ancak bu demek değil ki başka alanların gündemi sakin. Hele ki konu yapay zekâ ise.
Geçtiğimiz günlerde Bill Gates, yapay zekâ alanındaki ilerlemelerin tıp ve eğitim gibi birçok geleneksel görevde insanlığın rolünü önemli ölçüde azaltacağını ve bu sismik değişimin 10 yıldan kısa bir süre içinde gerçekleşebileceğini öngördü. Tabii bu haberden hemen sonra sosyal medya platformlarında etkileşim almak için kullanan kimi sosyal medya kullanıcıları ki “bazıları” büyük harfle yazmayı da severler, bu haberi paylaştı.
Yine geçtiğimiz haftalarda bu konuda alana dair sahip oldukları bilgi seviyesiyle takipçi sayıları arasında ters ilişki olan kimi sosyal medya kullanıcılarının ne denli zararlı olabileceğini söylemiştim ki son zamanlarda yayınlanan bir çalışma bu konuda savımı destekler nitelikte oldu.
Büyük dil modellerinin en büyük ve çözümü neredeyse imkânsız bir sorunu var; halüsinasyon. Halüsinasyon, büyük dil modellerinin başta sorunsuz görünen ama aslına yalan ya da uydurma olarak ürettikleri çıktılara verilen ad. Bu konsepte yönelik daha fazla temel seviyede fikir edinmek isterseniz, yine bu köşede yazmış olduğum “Dil modellerinin çözülmesi zor sorunu: Yalancılık” başlıklı yazıyı okuyabilirsiniz.
Bu uydurma ve yalan bilgiler bazen oldukça önemsiz etkiye sahip olurken, insan veya insanların hayatını doğrudan etkileyecek konularda oldukça ciddi ve olumsuz etkiye sahip olabilirler, sağlık gibi. Aşağıda yer alan grafik, üç dil modelinin sağlık alanındaki halüsinasyonlarını ve uzmanlarca ayrılmış şekilde bu halüsinasyonların etkilerini gösteriyor. Görüldüğü gibi üç popüler dil modeli de belirli ölçüde halüsinasyona sebep olabilirken bu halüsinasyonlardan kimileri ölümcül etkiye sahip olabiliyor. Düşük bir oran olsa da buradaki her bir oranın insan sağlığını işaret ettiğini unutmamak lazım.
Yukarıdaki grafik, Mart ayında MIT, Harvard Tıp Fakültesi, Washington Universitesi, Carnegie Mellon Üniversitesi, Seul Ulusal Üniversite Hastanesi, Google, Kolombiya Üniversitesi ve Johns Hopkins Üniversitesinden bir grup araştırmacının yayınladığı ve büyük dil modellerinin çözülemez sorunu olan halüsinasyonun, sağlık hizmetlerindeki etkisini incelediği çalışmadan alındı. Çalışma oldukça uzun ve kapsamlı, o nedenle tamamen bu çalışmayı özetleyebilmem bu sütunun sınırları dahilinde zor olabilir, ancak olabildiğinde özlü bir şekilde ana mesajı vermeye çalışacağım.
Çalışma farklı etki ve konulara sahip pek çok halüsinasyonu, tıbbi halüsinasyon olarak adlandırıyor ve özelliklerine göre belirli kategorilere ayırıyor. Örneğin bir dil modeline, bir hastanın alerjileri sorulduğunda ve modelin bu alerjilere rağmen alerjik olduğu bir ilacı güvenli olarak önermesi bir giriş çakışmalı halüsinasyon örneği olarak adlandırılıyor. Bu tür bir halüsinasyon, modelin kendisine verilen talimatlar veya verilerle doğrudan çelişen bir çıktı üretmesiyle karakterizedir. Bir diğer yaygın tür olan muhakeme halüsinasyonları ise, modelin mantıksal akıl yürütme sürecindeki hatalar sonucu ortaya çıkarken ve yanlış klinik kararlara veya önerilere yol açabilme potansiyeli taşıyor. Örneğin, modelin kalp yetmezliğinin nedenini açıklarken, "Kalp yetmezliğinin temel nedeni akciğer enfeksiyonlarıdır" şeklinde mantıklı görünen ancak yanlış bir açıklama yapması gibi. Bu, modelin bilgiyi doğru bir şekilde işlemesine rağmen, yanlış çıkarımlar yapması anlamına geliyor kısacası.
Bir başka halüsinasyon türü olan hafıza kaynaklı halüsinasyonlar ise modelin eğitim verilerindeki bilgileri yanlış hatırlaması veya tamamen uydurması sonucu oluşuyor. Bir tıbbi dil modelinin güncel hipertansiyon kılavuzları istendiğinde, "2023 HPC kılavuzlarına göre, X ilacıyla başlayın" şeklinde var olmayan veya güncel olmayan bir protokolü alıntılaması buna örnek olarak verilebilir.
Yukarıda verilen örneklere ek olarak klinik pratikte sıkça karşılaşılabilecek karar verme halüsinasyonları, hipertansiyonu olan hamile bir hastaya ilaç konusunda tavsiye veren dil modelinin, aslında zararlı olan X ilacını önermesi gibi, modellerin uygunsuz veya hatalı tedavi planları önermesiyle sonuçlanırken, tanı halüsinasyonları ise hastanın semptomları veya test sonuçlarıyla uyumlu olmayan yanlış teşhislerin ortaya çıkmasına neden olabilir. Mesela tahlil sonuçları zatürree ile tutarsız olan bir hasta için zatürree teşhisinin konması gibi.
Tıbbi halüsinasyonlar sadece bununla da sınırlı değil. Büyük dil modelleri, onaylanmamış ilaçların, yanlış dozajların veya hatalı ilaç etkileşim bilgilerini sunarak ilaçlarla ilgili de halüsinasyonlar üretebiliyor. Y hastalığı için aslında etkinliği onaylanmamış X ilacının, etkinmiş gibi önerilmesi buna örnek olarak verilebilir. Bunlara ek olarak daha karmaşık halüsinasyon türleri arasında, eğitim verilerindeki önyargılardan kaynaklanan önyargı kaynaklı halüsinasyonlar ve var olmayan araştırmalara atıfta bulunarak kanıta dayalı tıp prensiplerini zedeleyen araştırma halüsinasyonları sayılabilir. Ayrıca, metin ve tıbbi görüntüler gibi farklı veri türlerinin birlikte işlendiği durumlarda ortaya çıkan çok modlu entegrasyon halüsinasyonları da mevcuttur; bu tür hatalar, örneğin bir röntgen görüntüsünde olmayan bir durumu metin açıklamasında belirtmek şeklinde görülebilir.
Tüm bu halüsinasyon türlerinin, tıbbi dil modellerinin potansiyel kullanım alanlarının genişliği göz önüne alındığında, hasta güvenliği ve klinik karar verme süreçleri açısından özellikle hasta güvenliği başta olmak üzere ciddi riskler oluşturacağını tahmin etmek güç değil. Yanlış tanı ve tedavi kararları, doğrudan hastaların zarar görmesine neden olabilir. Örneğin, yanlış bir tanı doğru tedavinin gecikmesine yol açarken, hatalı ilaç dozajları veya yan etkiye sahip ilaçların önerilmesi yaşamı tehdit eden sonuçlar doğurabilir. Ayrıca, halüsinasyonlar klinik iş akışlarında da aksaklıklara neden olabilir ve sağlık profesyonellerinin dil modellerine olan güvenini azaltabilir. Sağlık alanında halüsinasyonların keza yaratabileceği etik ve hukuki sorunları da göz ardı edilemez; yanlış bilgilendirme sonucu hastalara zarar verilmesi durumunda ciddi sorunlar ortaya çıkabilir.
Peki bu sorun çözülebilir mi? Teknik açıdan basit bir yanıtı var bu sorunun, daha önce de verdiğim gibi. Çözülemez, ancak azaltılabilir. Zincirleme düşünme gibi çıkarım teknikleri, modellerin eğitim verilerinin kalitesinin arttırımı ya da gelişmiş model yöntemleri ve eğitim sonrası yöntemler, dil modellerinin sağlık alanındaki tıbbi halüsinasyon oranlarını azaltabilir. Ama bu teknik ilerlemeler, bu sorunun tek bir çözümü olamaz. Aynı zamanda açık, etik ve düzenleyici kılavuzların da ivedilikle geliştirilmesi gerekli.
Elbette tıbbi dil modellerinin kesinlikle potansiyel faydaları yadsınamaz olsa da, halüsinasyon risklerinin tam olarak anlaşılması ve etkili önlemlerin alınması, bu teknolojilerin güvenli ve etik bir şekilde sağlık hizmetlerine entegrasyonu için hayati önem taşıyor. Fakat, her şeye rağmen bu sorunların azalsa da hep var olacağını ve sağlık gibi insan yaşamını doğrudan etkileyen konularda en ufak bir hatanın bile kimi zaman çok pahalıya mâl olabileceğini hatırlamak gerekiyor. Dolayısıyla 10 sene içerisindeki potansiyel ilerlemelerin bile bu sorunu çözemeyeceğini düşündüğümüzde Bill Gates’in bu savı ne kadar güvenilir, bir soru işareti olarak kalmalı diye düşünüyorum. Özellikle bu kişilerin kar sağlama amacıyla kendi çıkarlarına yönelik toplumu ve iş dünyasını etkileme potansiyellerini de düşününce bu soru işaretinin büyüklüğünü arttırmanın gerekli olduğu fikrindeyim. O nedenle yazının başında bahsettiğim gibi, özellikle yapay zekâ alanındaki gelişmeleri takip eden, ancak konuya dair derinlemesine araştırma yapmayan kullanıcıların, özellikle sosyal medyada kimi akademik ünvanlıların her konunun uzmanı olamayacağını bilmesi, bu profillerin “ben demiştimcilik” demek için, biraz önce bahsettiğim yönelim riskini bilmeden de olsa arttırabileceklerini unutmaması, onların her söylediğini de koşulsuz kabul etmemesi gerekiyor.
Son olarak, #MahirPolatıSerbestBırakın
Referanslar
Kim, Y., Jeong, H., Chen, S., Li, S. S., Lu, M., Alhamoud, K., Mun, J., Grau, C., Jung, M., Gameiro, R., Fan, L., Park, E., Lin, T., Yoon, J., Yoon, W., Sap, M., Tsvetkov, Y., Liang, P., Xu, X., . . . Breazeal, C. (2025, February 26). Medical hallucinations in foundation models and their impact on healthcare. arXiv.org. https://arxiv.org/abs/2503.05777
Ozancan Özdemir kimdir? Ozancan Özdemir, lisans ve yüksek lisans derecelerini ODTÜ İstatistik Bölümü'nden aldı. Yüksek lisans döneminde aynı zamanda Anadolu Üniversitesi yerel yönetimler bölümünden mezun oldu. Bir süre ODTÜ İstatistik Bölümü'nde araştırma görevlisi olarak çalışan Özdemir, şu günlerde Groningen Üniversitesi Bernoulli Enstitüsü'nde finans ve yapay zekâ alanındaki doktora çalışmalarını sürdürüyor. Pandemi döneminde bir grup öğrenciyle birlikte gönüllü bir oluşum olan VeriPie adlı güncel veri gazetesini kurdu. Araştırma alanları yapay öğrenme ve derin öğrenme uygulamaları, zaman serisi analizi ve veri görselleştirme olan Ozancan Özdemir, ayrıca yerel yönetimler ve veriye dayalı politika geliştirme konularında da çeşitli platformlarda yazılar yazmaktadır. |
Tüm çocukların adil ve eşit bir ortamda büyüdüğü, özgüvenlerinin yüksek ve sosyal becerilerinin gelişmiş olduğu, temel eğitime sorunsuz bir şekilde ulaştığı, ekonomik kaygıların pençesine düşmek zorunda kalmadığı bir ülke yaratmak zorundayız. Bu ülkemin çocuklarının ve elbette tüm çocukların, doğal bir hakkı
Yapay zekâ, bilgiyi hızlıca edinmeyi sağlasa da, bu bilgiyi içselleştirme sürecini azaltabilir. Çünkü biz kullanıcılar, bu araçları kullanıldıkça hafızalarımızı dışarıya emanet etme alışkanlığı geliştirebiliyor ve bunun sonucunda, bazı bireyler kendi hafızalarının zayıfladığını hissedebiliyoruz
Kim ki size bir dil modeli için şöyle uçuyor, böyle kaçıyor, acccayip ve süper gibi ifadelerde bulunuyorsa kulak ardı etmek faydalı olabilir. Çünkü modellerin süreçleri, başta eğitim verileri, şeffaf bir şekilde kamu ile paylaşılmadıkça modellerin gerçekten uçup kaçtığını bilmemiz mümkün olmayacak
© Tüm hakları saklıdır.