Fransız yapay zeka girişimi Mistral, Salı günü yeni 'Mistral 3' ailesini duyurdu. Bu geniş model ailesi, çok modlu ve çok dilli yeteneklere sahip büyük bir sınır modeli ile çevrimdışı çalışabilen, tamamen özelleştirilebilir dokuz küçük modeli içeriyor. Bu lansman, açık ağırlıklı dil modelleri ve Avrupa odaklı yapay zeka sohbet botu Le Chat'i geliştiren Mistral'in, Silikon Vadisi'nin kapalı kaynaklı sınır modelleriyle rekabette yakalamaya çalıştığı bir dönemde geldi.
YENİ NESİL YAPAY ZEKA MODELLERİ TANITILDI
Eski DeepMind ve Meta araştırmacıları tarafından kurulan iki yıllık girişim, bugüne kadar yaklaşık 2,7 milyar dolar topladı ve 13,7 milyar dolarlık bir değerlemeye ulaştı. Bu rakamlar, OpenAI (500 milyar dolarlık değerlemeyle 57 milyar dolar topladı) ve Anthropic (350 milyar dolarlık değerlemeyle 45 milyar dolar topladı) gibi rakiplerinin topladığı rakamlarla karşılaştırıldığında oldukça mütevazı kalıyor. Ancak Mistral, özellikle kurumsal kullanım senaryoları için daha büyük olanın her zaman daha iyi olmadığını kanıtlamaya çalışıyor. Mistral'in kurucu ortağı ve baş bilim insanı Guillaume Lample, TechCrunch'a yaptığı açıklamada, "Müşterilerimiz bazen ince ayar yapmak zorunda olmadıkları çok büyük (kapalı) modellerle başlamaktan memnun oluyorlar... ancak bunları dağıttıklarında pahalı ve yavaş olduğunu fark ediyorlar. Sonra daha küçük modelleri daha verimli bir şekilde kullanmak için ince ayar yapmamız için bize geliyorlar." dedi. Lample ayrıca, "Pratikte, kurumsal kullanım senaryolarının büyük çoğunluğu, özellikle ince ayar yapıldığında küçük modellerle çözülebilecek şeylerdir." diye ekledi.
KÜÇÜK MODELLERİN ÜSTÜNLÜĞÜ VURGULANDI
İlk kıyaslama karşılaştırmaları, Mistral'in daha küçük modellerini kapalı kaynaklı rakiplerinin oldukça gerisinde gösterse de, Lample bu durumun yanıltıcı olabileceğini belirtti. Büyük kapalı kaynaklı modeller kutudan çıktığı gibi daha iyi performans gösterebilir, ancak gerçek kazanımlar özelleştirme ile elde edilir. Lample, "Birçok durumda, kapalı kaynaklı modellere denk veya hatta onları geride bırakabilirsiniz." dedi. Mistral'in 'Mistral Large 3' adlı büyük sınır modeli, OpenAI'nin GPT-4o'su ve Google'ın Gemini 2'si gibi daha büyük kapalı kaynaklı yapay zeka modellerinin önemli yeteneklerine yetişirken, aynı zamanda birçok açık ağırlıklı rakibiyle de rekabet ediyor. Large 3, tek bir pakette çok modlu ve çok dilli yeteneklere sahip ilk açık sınır modellerinden biri olarak Meta'nın Llama 3'ü ve Alibaba'nın Qwen3-Omni'si ile eşdeğer seviyede yer alıyor. Birçok şirket şu anda etkileyici büyük dil modellerini ayrı küçük çok modlu modellerle eşleştiriyor. Large 3 ayrıca, 256k bağlam penceresi boyunca verimli akıl yürütme sağlayan 41B aktif parametre ve 675B toplam parametreye sahip "granular Mixture of Experts" mimarisine sahip. Bu tasarım, hem hızı hem de yeteneği bir araya getirerek uzun belgeleri işlemesine ve karmaşık kurumsal görevler için aracılık eden bir asistan olarak işlev görmesine olanak tanıyor. Mistral, Large 3'ü belge analizi, kodlama, içerik oluşturma, yapay zeka asistanları ve iş akışı otomasyonu için uygun olarak konumlandırıyor. Yeni küçük modeller ailesi olan 'Ministral 3' ile Mistral, küçük modellerin sadece yeterli değil, aynı zamanda üstün olduğu iddialı bir açıklama yapıyor. Bu seri, üç farklı boyutta (14B, 8B ve 3B parametre) ve üç farklı varyantta (Temel, Talimat ve Akıl Yürütme) dokuz farklı, yüksek performanslı yoğun model içeriyor. Mistral, bu serinin geliştiricilere ve işletmelere ham performans, maliyet verimliliği veya özel yetenekler arayışında modelleri tam ihtiyaçlarına göre eşleştirme esnekliği sağladığını belirtiyor. Şirket, Ministral 3'ün diğer açık ağırlıklı liderlerle aynı veya daha iyi puanlar aldığını ve eşdeğer görevler için daha verimli olduğunu iddia ediyor. Tüm varyantlar görsel işlemeyi destekliyor, 128K-256K bağlam pencerelerini yönetiyor ve diller arasında çalışıyor.



