İçindekiler
Çin’den çıkan bir yıllık bir girişim, OpenAI, Google ve Anthropic’in sistemlerinin talep ettiği güç, soğutma ve eğitim masraflarının çok azını kullanırken ChatGPT’nin performansına rakip olan bir sohbet robotunu piyasaya sürdükten sonra yapay zeka endüstrisini kasıp kavuruyor. Deepseek’in V3 ve R1 modelleri hakkında bilmeniz gereken her şeyi ve şirketin neden Amerika’nın yapay zeka hedeflerini temelden sarsabileceğini burada bulabilirsiniz.
DeepSeek nedir?
DeepSeek (teknik olarak “Hangzhou DeepSeek Yapay Zeka Temel Teknoloji Araştırma A.Ş., Ltd.”), Nisan 2023’te ana şirketi High-Flyer için bir yapay zeka laboratuvarı olarak kurulan Çinli bir yapay zeka girişimidir. Mayıs ayında DeepSeek kendi şirketine dönüştü (High-Flyer yatırımcı olarak kalmaya devam etti) ve DeepSeek-V2 modelini piyasaya sürdü. V2, ByteDance, Tencent ve Baidu gibi diğer önde gelen Çinli yapay zeka firmalarıyla aynı düzeyde, ancak çok daha düşük bir işletme maliyetiyle performans sunuyordu.
Şirket bunu Aralık 2024’te V3’ün piyasaya sürülmesiyle takip etti. V3’ün 671 milyar parametreli bir model olduğu ve eğitilmesinin 2 aydan kısa sürdüğü bildirildi. Dahası, Jeffries’in yakın zamanda yaptığı bir analize göre, DeepSeek’in “eğitim maliyeti sadece 5,6 milyon ABD Dolarıdır (2 $ / 800 saat kiralama maliyeti varsayıldığında). Bu da Meta’nın Llama’sının maliyetinin %10’undan daha az.” Bu rakam Google, Microsoft, xAI ve OpenAI gibi ABD firmalarının modellerini eğitmek için harcadıkları yüz milyonlarca ila milyarlarca doların çok küçük bir kısmı.
Benchmark testleri V3’ün performansını GPT-4o ve Claude 3.5 Sonnet ile aynı seviyeye getirmiştir. Aralık 2024’te The Hill‘de yayınlanan bir köşe yazısında DeepSeek’in başarısı Amerika’nın “Sputnik Anı” olarak nitelendirildi.
DeepSeek Kasım 2024’te R1-Lite-Preview modelini piyasaya sürdü ve yeni modelin OpenAI’nin o1 akıl yürütme modelleri ailesinden daha iyi performans gösterebileceğini (ve bunu çok daha düşük bir fiyata yapabileceğini) iddia etti. Şirket, R1 modelinin, göreve bağlı olarak, OpenAI’nin o1’ine göre 20 ila 50 kat daha ucuz olduğunu tahmin ediyor.
DeepSeek daha sonra Ocak 2025’te DeepSeek-R1 ve DeepSeek-R1-Zero’yu piyasaya sürdü. R1 modeli, o1 rakibinden farklı olarak açık kaynak kodludur, yani herhangi bir geliştirici onu kullanabilir. Bu nedenle V3 ve R1, piyasaya sürüldüklerinden bu yana popülerlikte patlama yaşadı ve DeepSeek’in V3 destekli AI Asistanı, uygulama mağazalarının en üstünde ChatGPT’nin yerini aldı. Risk sermayedarı Marc Andreesen, kısa bir süre önce sosyal medyada yaptığı bir paylaşımda DeepSeek’in sohbet robotunu “şimdiye kadar gördüğüm en şaşırtıcı ve etkileyici buluşlardan biri” ve “dünyaya derin bir armağan” olarak nitelendirdi.
DeepSeek ne yapabilir?
Açık kaynaklı büyük bir dil modeli olarak DeepSeek’in sohbet robotları ChatGPT, Gemini ve Claude’un yapabildiği her şeyi yapabilir. Buna metin, ses, görüntü ve video oluşturma da dahildir. Dahası, DeepSeek’in Janus Pro olarak adlandırılan yeni multimodal model ailesinin, bir çift endüstri kıyaslamasında DALL-E 3’ün yanı sıra PixArt-alpha, Emu3-Gen ve Stable Diffusion XL’den daha iyi performans gösterdiği bildiriliyor. o1’e rakip olan DeepSeek-R1, karmaşık muhakeme görevlerini yerine getirmek için özel olarak tasarlanırken, sorunlara adım adım çözümler üretiyor ve bir sorunu çözerken muhakeme sürecini adım adım açıkladığı “mantıksal düşünce zincirleri” oluşturuyor. @Alexios Mantzarlis
DeepSeek’in ürünlerinin yapamadığı şey Tienanmen Meydanı hakkında konuşmak. Ya da Sarı Şemsiye protestoları. Ya da Başkan Xi Jinping’in Winnie the Pooh’ya olan benzerliği. Temel olarak, Çin Komünist Partisi tarafından yasak kabul edilen bir konu ise, DeepSeek’in sohbet robotları bu konuya değinmeyecek veya anlamlı bir şekilde etkileşime girmeyecektir.
DeepSeek’i kimler kullanabilir?
Açık kaynaklı bir LLM olarak DeepSeek’in modeli herhangi bir geliştirici tarafından ücretsiz olarak kullanılabilir. OpenAI, o1’e erişmek için gereken Pro aboneliği için aylık 200 dolar ücret alıyor. DeepSeek’in modelleri web üzerinden, şirketin API’si aracılığıyla ve mobil uygulamalar aracılığıyla kullanılabilir. Kullanmak için DeepSeek web sitesinde ücretsiz bir hesap açmanız gerekecek, ancak şirket “DeepSeek hizmetlerine yönelik büyük ölçekli kötü niyetli saldırılara” yanıt olarak yeni kayıtları geçici olarak durdurdu. Mevcut kullanıcılar oturum açabilir ve platformu normal şekilde kullanabilir, ancak yeni kullanıcıların DeepSeek’i kendileri için ne zaman deneyebilecekleri konusunda henüz bir açıklama yok.
DeepSeek neden birdenbire bu kadar büyük bir mesele haline geldi?
ChatGPT’nin Kasım 2023’te piyasaya sürülmesinden bu yana, Amerikan YZ şirketleri daha büyük, daha güçlü, daha geniş, daha fazla güç ve kaynak yoğun büyük dil modelleri oluşturmaya odaklandı. OpenAI, Microsoft, Anthropic ve Google gibi şirketler, daha uygun maliyetli ve enerji tasarruflu LLM’ler inşa etmeye çalışmak yerine, Amerikan geleneğinde olduğu gibi, soruna absürt miktarlarda para ve kaynak aktararak teknolojinin ilerlemesini kaba kuvvetle sağlamayı uygun gördüler. Yalnızca 2024 yılında xAI CEO’su Elon Musk’ın YZ girişimleri için kişisel olarak 10 milyar dolardan fazla harcama yapması bekleniyordu. OpenAI ve ortakları, ABD genelinde yeşil enerji tesislerinin ve YZ veri merkezlerinin inşasını büyük ölçüde hızlandıracak 500 milyar dolarlık Project Stargate girişimini duyurdu. CEO Sundar Pichai’ye göre Google, Gemini platformunu 2025 yılı boyunca ölçeklendirmeye öncelik vermeyi planlıyor ve bu hedef doğrultusunda bu yıl milyarlarca dolar harcaması bekleniyor. Meta, Ocak ayı ortasında yaptığı açıklamada, yapay zeka gelişimi için bu yıl 65 milyar dolar kadar harcama yapacağını duyurmuştu.
DeepSeek, tüm dünyaya bunların hiçbirinin aslında gerekli olmadığını gösterdi – son aylarda Amerikan ekonomisini canlandırmaya yardımcı olan ve Nvidia gibi GPU şirketlerini Ekim 2023’te olduklarından katlanarak daha zengin hale getiren “Yapay Zeka Patlaması” bir aldatmacadan başka bir şey olmayabilir. Ayrıca, geçtiğimiz yıl Çin’e önde gelen GPU’ların sevkiyatının defalarca yasaklanmasına rağmen, ABD’nin yapay zekada gerçekte ne kadar lider olduğu da sorgulanıyor.
Truist’te analist olan Keith Lerner CNN’e verdiği demeçte, “Sonuç olarak, ABD’nin üstün performansı teknoloji ve ABD şirketlerinin yapay zekada sahip olduğu liderlik tarafından yönlendirildi” dedi. “DeepSeek modelinin piyasaya sürülmesi, yatırımcıların ABD şirketlerinin sahip olduğu liderliği, ne kadar harcama yapıldığını ve bu harcamaların kâra (ya da aşırı harcamaya) yol açıp açmayacağını sorgulamasına yol açıyor.”
Kısacası DeepSeek, Amerikan yapay zeka endüstrisini kendi oyununda yenerek, mevcut “ne pahasına olursa olsun büyüme” mantığının artık geçerli olmadığını gösterdi. Raymond James yarı iletken analisti Srini Pajjuri CNBC’ye verdiği demeçte, “DeepSeek’in ABD’li hiper ölçekleyiciler kadar fazla bilgi işleme erişimi olmadığı açık ve bir şekilde son derece rekabetçi görünen bir model geliştirmeyi başardı” dedi.Eğer Çinli bir startup OpenAI’nin en son ve en iyi modeli kadar iyi çalışan bir yapay zeka modeli geliştirebilirse ve bunu iki aydan kısa bir sürede ve 6 milyon dolardan daha az bir fiyata yapabilirse, Sam Altman artık ne işe yarar?
Third Seven Capital’de piyasa stratejisti olan Michael Block CNN’e verdiği demeçte, “DeepSeek tehdidinin gerçek olup olmadığını zaman gösterecek – hangi teknolojinin işe yarayacağı ve büyük Batılı oyuncuların nasıl yanıt vereceği ve gelişeceği konusunda yarış devam ediyor,” dedi. “Piyasalar Trump 2.0 döneminin başlangıcında fazla rehavete kapılmıştı ve geri çekilmek için bir bahane arıyor olabilirler – ve burada harika bir bahane buldular.”
DeepSeek daha yeni başlıyor. En son gelişmelerden haberdar olmak istiyorsanız, DeepSeek haberleri derlememizi yer imlerine eklediğinizden emin olun.