Pazar lideri Google'ın (geçtiğimiz yılki aksak başlangıcından sonra) yapay zeka tarafından oluşturulan arama sonuçlarına daha fazla yönelmesi ve OpenAI gibi benzer şirketlerin de bu yenilikçi teknolojiyi denemesiyle, yapay zekanın çevrimiçi aramanın geleceği olduğu kanısı oturmaya başladı.
Teknoloji yazarı Kit Eaton, Inc. için kaleme aldığı yazısında bunun, sektörden bağımsız olarak hemen hemen her şirketteki çalışanlar için sonuçları olacağını belirtiyor: Zira bilgi aramak internet deneyiminin çok temel bir parçası. Ancak Columbia Üniversitesi Dijital Gazetecilik Tow Merkezi'nin Columbia Journalism Review'da yer alan yeni çalışması, en azından şimdilik çok dikkatli olunması gerektiğini, birkaç büyük AI arama aracının ciddi doğruluk sorunları olduğunu vurguluyor.
Çalışma, ChatGPT, Perplexity, Google'ın Gemini'si, Microsoft'un Copilot'u ve sektörü altüst eden Çinli DeepSeek dahil olmak üzere sekiz farklı AI arama aracına odaklandı; teknoloji haber sitesi Ars Technica'nın bildirdiğine göre, her AI bir haber hikayesi hakkında sorgulandığında yanıtların doğruluğuna odaklandı. Çalışmadan elde edilen en büyük sonuç, tüm AI'ların şaşırtıcı derecede kötü ve sorguların yüzde 60'ını yanlış yanıtlamasıydı.
Elbette hepsi kötü değil: Perplexity'nin yaklaşık yüzde 37'si yanlıştı, ChatGPT'nin ise yüzde 67'lik bir hata oranı vardı. Elon Musk'ın Grok 3 modeli en kötü puanı aldı, %94 oranında yanlıştı - belki de hiç kimse için şaşırtıcı değil, zira Musk modeli rakip yapay zekalardan daha az güvenlik kısıtlamasıyla sınırlandırılmış olarak tanıttı. (Milyarderin gerçeklere ve ifade özgürlüğüne karşı biraz serbest bir tavrı var) Daha da kötüsü, araştırmacılar bu arama araçlarının premium, ücretli sürümlerinin bazen ücretsiz alternatiflerinden daha kötü performans gösterdiğini belirtti.
AI aramasının, AI sohbet robotu kullanmaktan biraz farklı olduğunu belirtmekte fayda var. AI araması, genellikle arama motorunun sorgunuzu yazdıktan sonra sizin için aramayı yapmaya çalıştığını, çevrimiçi olarak bulduklarından önemli olduğunu düşündüğü ayrıntıları özetler, böylece verilerin geldiği orijinal makaleyi okumak zorunda kalmazsınız.
Ancak buradaki sorun, ne tartışılırsa tartışılsın her zaman gerçeği biliyormuş gibi görünen (aşırı özgüvenli mesai arkadaşları gibi) bu AI modellerinin de bir sorguyu bilmediklerini kabul etmekten hoşlanmamaları gerçeği etrafında dönüyor.
Çalışmanın yazarları, bir haber hikayesindeki sorguya cevap olarak güvenilir bilgi bulamadıklarında "hayır" demek yerine, AI'nın sıklıkla uydurma, makul görünen ancak aslında yanlış cevaplar sunduğunu belirtti. Bu çalışma tarafından tespit edilen bir diğer sorun ise, bu AI arama sonuçlarının yanında atıflar sunduğunda bile (görünüşte kullanıcıların daha sonra bu kaynak siteleri ziyaret ederek ayrıntıları iki kez kontrol edebilmeleri veya verilerin doğru olup olmadığını doğrulayabilmeleri için) bu atıf bağlantılarının genellikle orijinal yayıncıların sürümleri yerine içeriğin kopya sürümlerine yönlendiriyor olması... Bazen bu bağlantılar var olmayan web adreslerine yönlendiriyordu; Gemini ve Grok 3 atıflarının yarısından fazlasında bunu yaptı.
Bu neden önemli?
Deney biraz dar bir alandaydı, çünkü haber makalelerine dayanıyordu ve araştırmacılar çevrimiçi bulunan diğer içerikler için AI arama sonuçlarının doğruluğunu derinlemesine incelemedi. Bunun yerine, gerçek haber parçalarından alıntıları AI araçlarına girdiler ve ardından başlık ve diğer ayrıntılar dahil olmak üzere bilgileri özetlemelerini istediler.
AI'nın bazı sıkıcı ofis görevlerini hızlandırabileceğini ve çalışanların verimliliğini artırabileceğini biliyoruz. Ve AI aramasının, bazen zahmetli bir iş olabilen geleneksel web aramasının yerini alarak norm haline gelebileceği anlaşılıyor.
Ancak örneğin, bir içeriğe eklemek için arka plan bilgisi aranıyorsa veya yeni bir projeye başlamadan önce çevrimiçi kaynaklar taranıyorsa, AI arama araçlarının sunduğu sonuçlara güvenme konusunda çok dikkatli olmak gerekiyor.
Yani AI'nın çıktısını kontrol etmek için çalışma sisteminde bilgili ve tecrübeli çalışanlara olan ihtiyacın kesin olduğu yeniden kanıtlandı.
(Odatv.com)
![]() |
![]() |
![]() |
![]() |
|||||
|
|
![]() Küfür, hakaret içeren; dil, din, ırk ayrımı yapan; yasalara aykırı ifade ve beyanda bulunan ve tamamı büyük harflerle yazılan yorumlar yayınlanmayacaktır. Neleri kabul ediyorum: IP adresimin kaydedileceğini, adli makamlarca istenmesi durumunda ip adresimin yetkililerle paylaşılacağını, yazılan yorumların sorumluluğunun tarafıma ait olduğunu, yazımın, yetkililerce, fikrim sorulmaksızın yayından kaldırılabileceğini bu siteye girdiğim andan itibaren kabul etmiş sayılırım. |
![]() |
||||||||||||
|
||||||||||||
![]() |
||||||||||||
![]() Koç ![]() 21 Mart - 20 Nisan
|
||||||||||||
![]() |
||||||||||||
|
||||||||||||
![]() |
||||||||||||
|
||||||||||||
![]() |