ChatGPT, üniversite öğrencilerinden daha iyi ahlaki muhakeme yapıyor: İşte ilginç araştırmanın sonuçları
  1. Anasayfa
  2. Haberler

ChatGPT, üniversite öğrencilerinden daha iyi ahlaki muhakeme yapıyor: İşte ilginç araştırmanın sonuçları

0
Hangi büyük lisan modelinin (LLM) en düzgün olduğunu belirlemek için ekseriyetle, bir makinenin yanlışsız bilgiyi alıp alamayacağına, mantıksal akıl yürütme gerçekleştirip gerçekleştiremeyeceğine yahut insan gibisi yaratıcılık gösterip gösteremeyeceğine bakılıyor. Lakin yakın vakitte Georgia State Üniversitesi‘nden bir araştırma takımı, LLM’lerin ahlaki kararlar konusunda insanlara karşı nasıl performans sergilediğini araştırdı.

Yakın vakitte Nature’ın Scientific Reports mecmuasında yayınlanan “Değiştirilmiş bir Ahlaki Turing Testinde yapay etmenlere yönelik atıflar” isimli çalışmada araştırmacılar, ChatGPT 4 tarafından verilen ahlak yargıların kalite açısından insanlardan daha üstün olarak algılandığını buldu. 

Çalışmada araştırmacılar, birinci defa 2000 yılında önerilen Ahlaki Turing Testinin değiştirilmiş bir versiyonunu kullandılar. Araştırmacılar, başlangıçta psikopatların ahlaki akıl yürütmelerini pahalandırmak için tasarlanmış 10 ahlaki senaryodan oluşan bir dizi ile işe başladılar. Bu senaryolar, ahlaki açıdan neredeyse tartışmasız yanlış olan örneklerden sadece toplumsal gelenekleri ihlal eden senaryolara kadar değişiyor.

Felsefe öğrencilerinin yanıtlarıyla karşılaştırıldı

Büyük lisan modellerine çeşitli örnekler verilerek, bu aksiyonların neden yanlış olup olmadığı soruldu. İnsan ile karşılaştırma için 10 ahlaki senaryonun her birisi için ideolojiye giriş dersinde üniversite öğrencilerinden oluşan bir grupta en yüksek puan alan yanıtlar kullanıldı.

İnsan ve yapay zekanın ahlaki akıl yürütmesini karşılaştırmak için, 299 yetişkinden oluşan temsili bir örnekten her bir karşılık çiftini (biri ChatGPT’den, biri insandan) on ahlaki boyuta nazaran değerlendirmesi istendi:
  • Hangi cevap ahlaki açıdan daha faziletlidir?
  • Hangi karşılık daha güzel bir beşere benziyor?
  • Hangi karşılık daha sağlam görünüyor?
  • Hangi cevap daha zeki görünüyor?
  • Hangi karşılık daha adil görünüyor?
  • Hangi cevaba daha çok katılıyorsunuz?
  • Hangi karşılık daha şefkatlidir?
  • Hangi karşılık daha mantıklı görünüyor?
  • Hangi karşılık daha taraflı görünüyor?
  • Hangi karşılık daha duygusal görünüyor?

En kıymetlisi, iştirakçilere başlangıçta yanıtların bilgisayar tarafından oluşturulduğu söylenmedi. Katılımcıların büyük çoğunluğu araştırmacılara lisans seviyesindeki iki insan karşılıklarını karşılaştırdıklarını düşündüklerini söyledi. Her bir cevabın izafi kalitesini değerlendirdikten sonra iştirakçilere bunlardan birinin bir büyük lisan modeli tarafından yapıldığı söylendi ve bilgisayar tarafından üretilmiş olduğunu düşündükleri cevabı belirlemeleri istendi.

Katılımcılar yapay zekanın yanıtlarını daha hakikat olarak değerlendirdi

Kör testte iştirakçiler, LLM’nin değerlendirmesine insanlarınkinden daha fazla katıldı. Birebir vakitte, yapay zekanın cevapları ortalamada istatistiksel olarak manalı derecede “daha faziletli, daha zeki, daha adil, daha sağlam, daha yeterli bir insan ve daha rasyonel” olarak değerlendirildi. Fakat insan ve yapay zekanın cevapları, his, şefkat yahut önyargı açısından değerlendirildiğinde bariz bir farkın olmadığı görüldü.

Testin ikinci kısmında iştirakçiler, hangi cevabın bilgisayar tarafından oluşturulduğunu, makul senaryoya bağlı olarak %58 ile %82 ortasında yanlışsız halde tespit edebildiler.  Araştırmacılar, insanların LLM’leri tespit etmek için yapısal olarak emsal olan yapay zeka karşılıklarındaki bağlam ipuçlarını (kelime seçimi ve uzunluğu gibi) kullandıklarını kestirim ediyor.

Arastırmacılar insanların, bilgisayar tarafından verilen karşılıkların daha uygun olması gerektiğine dair bir ön yargıdan ötürü yapay zekanın ahlaki yargılarını seçmiş olabileceğini belirtiyor. 

Yapay zekanın ahlaki yargıları, şoförsüz araçlarda karar verme üzere gerçek dünyadaki durumlar için değerli uygulama alanları bulabilir. Pekala bu sonuçlar ChatGPT’nin ortalama bir üniversite öğrencisinin düzeyinde yahut üzerinde ahlaki muhakeme yeteneklerine sahip olduğunu mu gösteriyor?

Alan Turing muhtemelen o denli olduğunu söylerdi. Araştırmacıların belirttiği üzere, ünlü bilgisayar bilimcisinin ünlü testi şunu öne sürüyor: “Eğer bir makine zekasının çıktısı bir insanınkiyle eşleşiyorsa (veya onu aşıyorsa), o vakit tüm pratik hedefler açısından o makine akıllıdır.”

Yapay zeka sahiden daha ahlaklı mı?

Ancak ahlaki bir bilmeceye cevap olarak yanlışsız sözleri bilmek, bir şeyi ahlaki yapan şeyin ne olduğuna dair doğuştan bir anlayışa sahip olmakla tıpkı şey değil. Araştırmacılar ayrıyeten, hatalı psikopatların, ahlaki davranışlar göstermese de, farklı toplumsal ve ahlaki yanlışlar ortasında ayrım yapabildiklerini gösteren evvelki bir çalışmaya da atıfta bulunuyor. Araştırmacılar, yapay zekanın insanlardan daha rasyonel ve zeki olarak değerlendirildiğini, fakat daha duygusal yahut şefkatli olmadığını belirterek psikopat benzetmesini genişletiyor.

Bu, bir yapay zekanın, rastgele bir gerçek anlayış yahut ahlaki yargı belirtisi olmadan başka birçok mevzu hakkında yaptığı üzere, ahlak konusunda da ikna edici bir halde saçma şeyler söyleyebileceği endişesini beraberinde getiriyor. Beşerler, bu yanlış değerlendirmelere güvenerek ortaya makus sonuçlar çıkabilir. Münasebetiyle araştırmacılar bu büyük lisan modellerinin ahlaki durumlar için yapacağı değerlendirmeler konusunda dikkatli olunması gerektiğini belirtiyor.

Reaksiyon Göster
  • 0
    alk_
    Alkış
  • 0
    be_enmedim
    Beğenmedim
  • 0
    sevdim
    Sevdim
  • 0
    _z_c_
    Üzücü
  • 0
    _a_rd_m
    Şaşırdım
  • 0
    k_zd_m
    Kızdım

info@teknovivo.com

Yazarın Profili
Paylaş

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir