İçindekiler
OpenAI bugün, 12 Eylül’de, “akıl yürütme” işlevine sahip bir dizi yapay zekanın ilki olacak o1 adlı yeni modelini duyurdu. Bu model daha karmaşık sorunları çözmek üzere tasarlanmıştır ve sorgulara insanlardan daha hızlı yanıt verebilmektedir. O1’in piyasaya sürülmesine, geliştirilmesinin ilk aşamasını vurgulayan “ön sürüm” (o1-preview) etiketi eşlik ediyor. Şirket, o1-preview’a ek olarak, daha düşük bir fiyatla satışa sunulacak olan o1-mini’nin daha küçük bir versiyonunu da tanıttı. Geliştirme sırasında “Strawberry” kod adıyla anılan model şimdi fizik, kimya ve biyoloji gibi disiplinlerde daha yüksek karmaşıklıktaki görevlere yönelik olarak tasarlandı.
“Muhakeme” yeteneğine sahip yapay zeka modeli
o1 modelinin ana özelliği “akıl yürütme” yeteneğidir. Eğitim verilerindeki kalıpların basit bir şekilde tekrarlanmasına dayanan önceki versiyonların aksine, o1, sistemin ödüller ve cezalar yoluyla öğrendiği ve performansını kademeli olarak artırdığı bir takviye yöntemi kullanılarak eğitilmiştir. Model, insan düşünme sürecini taklit ederek problemleri adım adım çözmesini sağlayan “muhakeme zinciri” olarak bilinen yöntemi kullanıyor.
OpenAI, bu yeni yaklaşımla modelin daha doğru hale geldiğini iddia ediyor. OpenAI’nin araştırma müdürü Jerry Tworek, o1’in daha az “halüsinasyon” – modelin güvenilir olmayan gerçekler yarattığı hatalar – ürettiğini, ancak henüz bunlardan tamamen kurtulamadığını belirtti. Bununla birlikte model, programlama ve matematik gibi daha karmaşık görevleri önceki versiyonlara göre çok daha iyi yerine getiriyor ve düşünce akışını açıklayabiliyor.
“OpenAI araştırma başkanı Bob McGrew şunları söyledi: “Muhakeme fonksiyonu üzerinde aylardır çalışıyoruz çünkü bunun önemli bir atılım olduğunu düşünüyoruz. – Bu, modellerin gerçekten karmaşık sorunları çözmesine olanak tanıyacak yeni bir aşama, ki bu da insan düzeyinde zekaya ulaşmak için gerekli.”
OpenAI, modelin arayüzünü akıl yürütme adımlarını gösterecek şekilde tasarlamıştır. Özellikle o1, insan muhakemesi yanılsaması yaratmak için “düşünüyorum” ve “merak ediyorum” gibi ifadeler kullanıyor. Ancak şirketin de vurguladığı gibi bu, yapay zekayı insan düşüncesiyle eşitleme girişiminden ziyade modelin görevleri nasıl daha derinlemesine analiz ettiğini göstermenin bir yoludur.
Lisansüstü düzeyde performans
OpenAI, o1’in fizik, kimya ve biyoloji gibi disiplinlerde lisansüstü düzeydeki problemleri çözebileceğini iddia ediyor. Bu da modeli özellikle bilimsel ve eğitsel amaçlar için kullanışlı kılıyor. Dahası, Codeforces gibi çevrimiçi programlama yarışmalarında model, katılımcılar arasında 89. yüzdelik dilime ulaşarak yüksek performansını vurgulamıştır.
o1, GPT’nin önceki sürümlerine göre çoklu görev ve karmaşık bilgi işlemde önemli ölçüde daha iyidir. Matematik ve programlama testlerinde model, önceki modellerden önemli ölçüde daha iyi performans göstererek olağanüstü sonuçlar ortaya koymuştur. Örneğin, Uluslararası Matematik Olimpiyatı’nda o1 görevlerin %83’ünün üstesinden gelirken GPT-4o sadece %13’ünün üstesinden gelebilmiştir.
o1 ne yapabilir
- Oyun oluşturma: o1, tek bir taleple karmaşık koşullara sahip hazır bir oyun oluşturabilir. Modelin gereksinimleri analiz edebilmesi ve oyun mekaniklerini, kuralları ve hatta temel kodu kendi başına üretebilmesi, onu oyun geliştiricileri için vazgeçilmez bir araç haline getiriyor.
- Kuantum denklemlerini çözme: Model, tüm çözüm sürecini göstererek kuantum fiziği denklemlerini çözebilir. Özellikle araştırma ve eğitim için yararlı olan cevaba götüren adımları açıklayabilir.
- Mantık bulmacaları: o1, tıpkı bir insanın yapacağı gibi adım adım çözümler sunarak karmaşık mantık bulmacalarını ele alır. Yeni bir muhakeme sistemi sayesinde model, karar verme sürecini göstererek çok adımlı problemlerde en uygun çözümleri bulmasını sağlar.
- Hiyeroglif Çevirisi: Model, metnin edebi karakterini koruyarak hiyeroglifleri çevirebilir, bu da dil engellerini silmeye yardımcı olur. Sadece metni çevirmekle kalmaz, aynı zamanda stilistik doğruluğu ve kültürel bağlamı da korur, bu da onu edebi çeviriler ve bilimsel metinlerle çalışmak için kullanışlı hale getirir.
o1’in ayırt edici bir özelliği, yaklaşımlarını karmaşık durumlara uyarlama yeteneğidir. Eğitim sayesinde bu model hataları tanımayı ve cevaplarını geliştirmeyi öğrenerek analitik görevlerde avantaj sağlamıştır. “Muhakeme” üzerine yapılan vurgu, yapay zekanın çok adımlı sorunlara daha derin ve daha düşünülmüş bir süreçle yaklaşmasını sağlıyor; bu da daha çok metin oluşturmaya ve yüzeysel görevlere odaklanan önceki sürümlerden oldukça farklı.
Yeni fırsatlar ve kısıtlamalar
Etkileyici başarılarına rağmen o1, GPT-4o modeline kıyasla bazı sınırlamalara da sahiptir. Birçok kullanıcı için önemli olan web tarama, dosya indirme veya görüntü işleme gibi özellikleri desteklemez. Ayrıca o1, gelişmiş GPT-4o özelliklerini kullanan geliştiriciler ve şirketler için bir engel oluşturabilecek araç çağırma, akış ve sistem mesajı özelleştirme için API desteği içermez.
Önemli bir fark, API aracılığıyla o1 kullanmanın yüksek maliyetidir. GPT-4o nispeten uygun fiyatlar sunarken, o1’i kullanmanın maliyeti 1 milyon giriş jetonu için 15 dolar ve 1 milyon çıkış jetonu için 60 dolardır, bu da kitlesel benimseme için daha az çekici hale getirir.
Güvenlik ve etik hususlar
o1’in yetenekleri arttıkça, OpenAI güvenlik önlemlerini güçlendiriyor. Bu çabanın bir parçası olarak OpenAI, modelin yüksek güvenlik standartlarını karşılamasını sağlamak ve kötü niyetli faaliyet riskini en aza indirmek için federal kurumlarla aktif olarak çalışıyor ve daha sıkı iç protokoller uyguluyor. o1 modeli, hata ve tehlikeli sonuçlara varma olasılığını azaltmaya yardımcı olacak şekilde etik ve standartlar göz önünde bulundurularak geliştirilmiştir.
Model kullanılabilirliği
Bugünden itibaren ChatGPT Plus ve Team aboneliği kullanıcıları, model seçicideki o1-preview seçeneğini seçerek o1 modeline erken erişim sağlayabilirler. STEM görevlerine daha fazla odaklananlar için, teknik soruları ele almak ve matematik ve fen problemlerini daha hızlı ve daha verimli bir şekilde çözmek için özel olarak tasarlanmış bir o1-mini sürümü mevcuttur.
Her iki model de önümüzdeki hafta ChatGPT Kurumsal ve Eğitim kullanıcılarına sunulacak ve böylece erişim daha geniş bir kitleye yayılacak. Geliştiriciler de API aracılığıyla bu modelleri kullanarak prototip oluşturmaya başlayabilecekler, ancak ilk aşamalarda hız ve diğer sınırlamalar geçerli olacak.
OpenAI, o1 serisi modellerin sadece bir başlangıç olduğunu belirtiyor. GPT-4o’nun tamamen yerini alması amaçlanmasa da, şirket yeni özellikler ekleyerek ve yeteneklerini geliştirerek modeli düzenli olarak güncellemeyi ve geliştirmeyi planlıyor. Bu da muhakeme modellerinin yeteneklerinin daha da artmasını ve daha geniş bir uygulama yelpazesine entegre edilmesini beklememizi sağlıyor.