OpenAI’dan CriticGPT: GPT-4’ün hatalarını GPT-4 bulacak

OpenAI, ChatGPT tarafından üretilen koddaki hataları belirlemek için tasarlanmış yeni bir yapay zeka modeli olan CriticGPT’yi tanıttı. CriticGPT, insanların büyük dil modeli (LLM) çıktılarını daha doğru hale getirmelerine yardımcı olan “insan …

28 Haziran 2024 14:36

OpenAI, ChatGPT tarafından oluşturulan programlama kodunu inceleyen insan eğitmenlere yardımcı olmak için CriticGPT’yi geliştirdiklerini söylüyor. Firma, ChatGPT kodunu gözden geçirmek için CriticGPT’den yardım alan insanların, yardım almayanlardan %60 oranında daha iyi performans gösterdiklerini belirtiyor.

GPT-4’ün hataları GPT-4’e emanet

OpenAI aynı zamanda Force Sampling Beam Search (FSBS) adını verdikleri yeni bir teknik de geliştirdi. Bu yöntem en basit haliyle CriticGPT’nin daha ayrıntılı kod incelemeleri yazmasına yardımcı oluyor. Araştırmacılar FSBS ile CriticGPT’nin sorunları ararken ne kadar kapsamlı olacağını ayarlayabiliyor, aynı zamanda gerçekte var olmayan sorunları ne sıklıkla uydurabileceğini de kontrol edebiliyor.

İlginç bir bulgu da var

OpenAI, kod üzerindeki deneylere ek olarak, LLM eleştirmenlerinin genel yardımcı görevlerde nasıl performans gösterdiğini de araştırdı ve ilginç bir şekilde CriticGPT’nin yeteneklerinin kodun ötesine geçtiğini keşfetti. OpenAI, daha önce insanlar tarafından kusursuz olarak değerlendirilen ChatGPT eğitim verilerinin bir alt kümesinde CriticGPT’yi test etti. İlginç bir şekilde CriticGPT, buradaki vakaların yüzde 24’ünde hatalar buldu. OpenAI, bunun CriticGPT’nin kod dışı görevlere genelleme potansiyelini gösterdiğini ve dikkatli insan değerlendirmesinin bile gözden kaçırabileceği ince hataları yakalama yeteneğini vurguladığını düşünüyor.

CriticGPT mükemmel değil

En nihayetinde CriticGPT modeli de GPT-4 üzerinde inşa edilmiş bir yapay zeka. Bu nedende diğer tüm modeller gibi CriticGPT’nin de bazı sınırlamaları bulunuyor. Bu sınırlamaların başında modelin halen halüsinasyon görmesi geliyor. CriticGPT daha dar ve kaliteli bir veri kümesinde eğitilse de modellerin en doğal çalışma prensipleri nedeniyle daha az yapıyor olsa bile halüsinasyonlardan kurtulamıyor. Haliyle bunlar da insanların yanlış etiketlemeler yapmasına neden oluyor. Eğer bu konuda daha fazla bilgi almak istiyorsanız aşağıdaki içeriğimizi mutlaka okuyunuz:

Bununla birlikte CriticGPT, oldukça kısa olan ChatGPT cevapları üzerinde eğitildi. Bu da uzun ve karmaşık görevleri değerlendirmede performansını düşürüyor. Ayrıca bazen hatalar tek bir yerde olmayabiliyor. CriticGPT, belirli bir yerde tespit edilebilen hataları belirlemede oldukça iyi olsa da gerçek dünyadaki hatalar bir cevabın birçok bölümünde olabiliyor. Ek olarak OpenAI, CriticGPT’nin bir yere kadar yardımcı olabileceğini söylüyor. Bir görev veya yanıt son derece karmaşıksa, model yardımı alan bir uzman bile bunu doğru bir şekilde değerlendiremeyebilir.

ETİKETLER: Chatgpt, Hatalar, Hataları, İnsan, Kod, Modeli̇, Openaı, Tarafından, Yardımcı

Romeo

YORUMLAR

[ Yoruma cevap yazmaktan vazgeç ]

Henüz yorum yapılmamış. İlk yorumu yukarıdaki form aracılığıyla siz yapabilirsiniz.

TEKNOLOJİ GÜNCEL TÜMÜ

30 Haziran 2024 21:52

Audi, iki milyondan fazla otomobiline ChatGPT getiriyor

Audi, yaklaşık 2 milyon aracına OpenAI tarafından geliştirilen üretken yapay zeka ChatGPT’yi getireceğini açıkladı.

30 Haziran 2024 21:52

Sony ZV-E10 II vlog kamerasının çıkış tarihi belli oldu

Sony ZV-E10 II'nin, popüler A6700'de bulunana benzer bir 26 MP APS-C CMOS sensöre sahip olması bekleniyor. Bu sensör yükseltmesi, birinci nesil ZV-E10'a kıyasla gelişmiş görüntü kalitesi ve performansa dönüşecektir. Sony yeni...

30 Haziran 2024 21:50

CPU Delid Nedir, Ne İşe Yarar?

Delid Nedir?

30 Haziran 2024 21:36

OnePlus 12 ve OnePlus Open Android 15 Beta 2’yi alıyor

OnePlus, Android 15 Beta 2 sürümünü OnePlus 12 ve OnePlus Open modelleri için kullanıma sundu.

30 Haziran 2024 21:36

Meizu’nun yeni manyetik güç bankası çok konuşulacak

Meizu, yüksek kapasiteli ve manyetik özellikli yeni güç bankası ile dikkat çekiyor. Bu güç bankasının sunduğu diğer özellikler neler?

30 Haziran 2024 21:36

Microsoft, Rus hacker saldırısında daha fazla e-postanın ele geçirildiğini açıkladı

Microsoft, Rus hacker grubu Midnight Blizzard tarafından gerçekleştirilen saldırının boyutlarını genişlettiğini duyurdu.

30 Haziran 2024 21:36

Steam Kullanıcılarının Hiç Oynamadıkları Oyunlara Bir Ülke Ekonomisi Kadar Para Harcadığı Ortaya Çıktı

PCGN tarafından gerçekleştirilen bir araştırma, Steam kullanıcılarının oynamadıkları oyunlara âdeta bir servet harcadığını gözler önüne serdi.

30 Haziran 2024 21:22

Yeni AMD X870 Anakartlar Gecikmeli Olarak Piyasaya Sürülecek

Computex 2024’te güncel CPU’lar ile birlikte X870E ve X870 yonga setleri de duyurulmuştu. Ryzen 9000 “Zen 5” masaüstü işlemcilerini perakende pazara sürmeye hazırlanan AMD, yeni anakartları biraz gecikmeli olarak, Eylül...

GÜNDEM GÜNCEL