OpenAI'nin derin öğrenmeyi ölçeklendirme çabasındaki en son dönüm noktası olan GPT-4 ortaya çıktı. GPT-4, dünyadaki bir çok insandan daha az yetenekli olsa da, çeşitli profesyonel ve akademik ölçütlerde insan düzeyinde performans sergileyen, görüntü ve metin girişlerini kabul eden, metin çıktıları yayan büyük bir çok modlu model.

OpenAl,  GPT-4'ü yinelemeli olarak uyumlu hale getirmek için uzun bir zaman harcayarak, gerçeklik, yönetilebilirlik ve korkulukların dışına çıkmayı reddetme konularında şimdiye kadarki en iyi sonuçları, kendi tabirleriyle; “Mükemmel olmaktan uzak olsa da” elde etmeyi başardılar.

Son iki yılda, tüm derin öğrenme yığınlarını yeniden oluşturarak ve Azure ile birlikte sıfırdan bir bilgisayar tasarlamışlar. Bir yıl önce, GPT-3.5'i sistemin ilk "test çalıştırması" olarak eğitmişler. Bazı hatalar bulup düzelterek teorik temelleri geliştirmişler. GPT-4 eğitim çalışması, benzeri görülmemiş bir şekilde istikrarlı neticelenmiş ve eğitim performansını önceden doğru bir şekilde tahmin edebilecek ilk büyük model olmuş. 

GPT-4'ün metin girişi özelliği,  ChatGPT ve API (bekleme listesiyle birlikte) aracılığıyla kullanıma sunuluyor.  Görüntü girişi özelliğini daha geniş kullanılabilirlik için hazırlamak amacıyla, başlamak için tek bir iş ortağıyla yakın işbirliği yapılıyor. Ayrıca, yapay zeka modeli performansının otomatik olarak değerlendirilmesine yönelik çerçeve olan OpenAI Evals da açık kaynak olarak kullanıyor.

GPT-4'ün Yetenekleri

Sıradan bir sohbette, GPT-3.5 ile GPT-4 arasındaki fark çok az gibi görünebilir. Gerçek fark ise; görevin karmaşıklığı yeterli bir eşiğe ulaştığında ortaya çıkıyor: GPT-4 daha güvenilir, yaratıcı ve GPT-3.5'ten çok daha incelikli talimatları işleyebiliyor.

İki model arasındaki farkı anlamak için, orijinal olarak insanlar için tasarlanmış sınavları simüle etmek de dahil olmak üzere çeşitli kriterler üzerinde testler gerçekleşmiş. Halka açık en son testleri kullanarak (Olimpiyatlar ve AP ücretsiz yanıt soruları söz konusu olduğunda) veya deneme sınavlarının 2022-2023 sürümlerini satın alarak ilerleme kaydetmişler.  Bu sınavlar için özel bir eğitim yapılmamış. Model, eğitim sırasında sınavlardaki sorunların küçük bir kısmını görmüş ancak sonuçların temsili olduğunu düşünüyorlar. Ayrıntılar için teknik rapora, OpenAl’ın linkinden ulaşabilirsiniz.

https://openai.com/research/gpt-4

Ayrıca GPT-4'ü makine öğrenimi modelleri için tasarlanmış geleneksel kıyaslamalarda değerlendirmişler. GPT-4, karşılaştırmalı değerlendirmeye özel işçilik veya ek eğitim protokolleri içerebilen çoğu son teknoloji (SOTA) modelin yanı sıra mevcut büyük dil modellerinden önemli ölçüde daha iyi performans gösterdiğini fark etmişler. 

Mevcut birçok makine öğrenimi karşılaştırma testi İngilizce olarak yazılmış. Diğer dillerde ilk yetenek duygusunu elde etmek için, 57 konuyu kapsayan 14.000 çoktan seçmeli problemden oluşan bir paket olan MMLU karşılaştırmasını Azure Çeviri kullanarak çeşitli dillere çevirmişler. Test edilen 26 dilden 24'ünde GPT-4, Letonca, Galce ve Swahili gibi düşük kaynaklı diller dahil olmak üzere GPT-3.5 ve diğer LLM'lerin (Chinchilla, PaLM) İngilizce performansından daha iyi performans göstermiş. 

Destek, satış, içerik denetimi ve programlama gibi işlevler üzerinde büyük etkisi olan GPT-4 dahili olarak da kullanılıyor. Uyum stratejilerinin ikinci aşamasını başlatarak yapay zeka çıktılarını değerlendirmede insanlara yardımcı olmak için de devreye sokmaya başlamışlar.

Görsel girişler

GPT-4, salt metin ayarına paralel olarak kullanıcının herhangi bir vizyon veya dil görevi belirlemesine olanak tanıyan bir metin ve resim istemini kabul edebiliyor. Spesifik olarak, serpiştirilmiş metin ve resimlerden oluşan girdiler verildiğinde metin çıktıları (doğal dil, kod vb.) üretiyor. GPT-4, metin ve fotoğraf içeren belgeler, diyagramlar veya ekran görüntüleri dahil olmak üzere çeşitli alanlarda, sadece metin girişlerinde olduğu gibi benzer yetenekler sergiliyor. Ayrıca, sadece metin içeren dil modelleri için geliştirilen test zamanı teknikleriyle, birkaç atış ve düşünce zinciri yönlendirmesi dahil olmak üzere artırılabilir. Görüntü girdileri hâlâ bir araştırma ön izlemesi ve herkese açık değil.

GPT-4'ün performansını, onu dar bir standart akademik vizyon ölçütleri paketi üzerinde değerlendirerek ön izleme gerçekleştiriliyor. Bununla birlikte, modelin üstesinden gelebileceği yeni ve heyecan verici görevleri sürekli olarak keşfedildiği için şu andaki rakamlar, yeteneklerinin kapsamını tam olarak temsil etmiyor. Yakında daha fazla analiz ve değerlendirme rakamlarının yanı sıra test zamanı tekniklerinin etkisinin kapsamlı araştırmasını yayınlamayı planlıyorlar.

Aslına bakarsanız OpenAl şu anda tam bir kapalı kutu. Başta Google olmak üzere rakiplerine ayrıntılı bilgi vermemek için elinden geleni yapıyor. Kim bilir belki GPT- 5 halihazırdadır…

 

 

 

HIZLI - KOLAY - GÜVENİLİR - SÜRDÜRÜLEBİLİR - HATASIZ


Go To Top