Microsoft, DeepSeek R4 ile rekabet edecek süper çıkarımsal bir yapay zeka modeli olan Phi-1'ü piyasaya sürdü

Özet:

Microsoft, 4 milyar ve 14 milyar parametreyle eğitilen Phi-3.8 çıkarımsal yapay zeka modellerini kullanıma sundu.
Phi-4 çıkarım modelleri küçük boyutlarına rağmen DeepSeek R1 ve o3-mini gibi çok daha büyük modellerle rekabet ediyor.
Microsoft, Phi-4 çıkarım modellerinin küçük boyutları sayesinde Windows Copilot+ işletim sistemini çalıştıran bilgisayarlarda çalışabileceğini söylüyor.

Microsoft, Phi-4-reasoning, Phi-4-reasoning-plus ve Phi-4-mini-reasoning olmak üzere üç yeni tümdengelimli yapay zeka modelini piyasaya sürdü. Bunlar Windows bilgisayarlar ve mobil cihazlar gibi terminal cihazlar için tasarlanmış küçük dil modelleridir. Phi-4-muhakeme yapay zeka modeli 14 milyar parametre ile eğitildi ve karmaşık çıkarım görevlerini gerçekleştirebiliyor.

Phi-4-muhakeme-artı modeli aynı temel modeli kullanır, ancak daha yüksek doğruluk sağlamak için Phi-1.5-muhakeme modeline kıyasla yaklaşık 4 kat daha fazla belirteç sayısı içeren ek bir çıkarım süresi hesaplaması kullanır. Phi-4-muhakeme modellerinin küçük boyutlarına rağmen, aşağıdaki gibi daha büyük modellerle rekabet edebilirler: DeepSeek R1 671B ve o3-mini.

GPQA standardında, Phi-4-reasoning-plus-14B modeli %69.3'lük bir puan elde ederken, o3-mini %77.7. AIME 2025 sınavında ise Phi-4-muhakeme-artı-14B %78, o3-mini ise %82.5 puan alıyor. Microsoft'un küçük modelinin, boyut olarak çok daha büyük olan ana çıkarım modellerine oldukça yakın olduğu görülmektedir.

Microsoft, Phi-4 çıkarım modellerinin denetlenen ince ayar yoluyla eğitildiğini söylüyor.OpenAI o3-mini'den dikkatlice düzenlenmiş çıkarım gösterileri hakkında. Ayrıca Microsoft, “Model, doğru veri biçimlendirmesinin ve yüksek kaliteli sentetik veri kümelerinin, daha küçük modellerin daha büyük modellerle rekabet etmesine olanak sağladığını göstermektedir.".

Bunun dışında, sadece 4 milyar parametre ile eğitilen daha küçük Phi-3.8-mini-muhakeme modeli, birçok 7B ve 8B modelinden daha iyi performans gösteriyor. AIME 24, MATH 500 ve GPQA Diamond gibi ölçütlerde Phi-4-mini-reasoning-3.8B modeli, o1-mini ile neredeyse aynı sonuçları vererek rekabetçi sonuçlar sunuyor. Tamamlandı"AyarlaPhi-4-mini modeliDeepseek-R1 modeli tarafından üretilen sentetik verileri doğru bir şekilde kullanmak".

Microsoft'un Phi modelleri Windows bilgisayarlarda halihazırda doğal olarak kullanılıyor. Yardımcı Pilot+ PC'lerDahili nöral işlem biriminden faydalanır. Phi-4 çıkarım modellerinin cihaz üzerindeki yapay zeka performansını nasıl iyileştireceğini görmek ilginç olacak.

Derin Arama