Microsoft, ChatGPT kadar güçlü küçük AI modelini tanıttı: Telefonlarda çalışabilir
  1. Anasayfa
  2. Haberler

Microsoft, ChatGPT kadar güçlü küçük AI modelini tanıttı: Telefonlarda çalışabilir

0
Günümüzde kullandığımı Microsoft Copilot, OpenAI ChatGPT yahut Google Gemini üzere yapay zeka araçları ve bunlara dayanak veren modeller, devasa kapasitelere sahip bulutlarda barındırılıyor. Bu modeller milyarlar, hatta trilyonlarca parametrelere sahipler ve doğal olarak bu halleriyle akıllı telefonlar yahut bilgisayarlarda çalışmaları mümkün değil. Microsoft ise piyasadaki en büyük lisan modelleriyle emsal bir performans sunabilen küçük boyutlu Phi-3 Mini modelini tanıttı.

Microsoft Phi-3 Küçük rakiplere meydan okuyor

Microsoft’un üzerinde çalıştığı üç kompakt yapay zeka lisan modelinden birisi olan Phi-3 Küçük, 3,8 milyar parametrelik tartıya sahip. Microsoft, bu aileyi yakında Phi-3 Small (7 milyar parametre) ve Phi-3 Medium (14 milyar) ile tamamlamayı hedefliyor. Microsoft, Phi-3 Mini’nin küçük olmakla birlikte kendi boyutunun 10 katı büyüklüğündeki öteki devasa modeller kadar güçlü olduğunu belirtiyor.

Microsoft tarafından paylaşılan ve üstteki görselde görebileceğiniz sayılara nazaran Phi-3 Mini’nin, ChatGPT’ye güç veren 175+ milyar parametreli GPT-3.5, Mistral’in Mixtral 8x7B modeli ve Anthropic’in Claude 3 Sonnet modeli ile rekabet edebildiği görülüyor. Unutmayın, Phi-3 Küçük, akıllı telefonlar üzere aygıt üzerinde çalışan, bulut ilişkisi gerektirmeyen bir AI modeli.

Genellikle daha “zeki” yapay zeka modelleri için daha fazla parametreye gerek duyuluyor. Yapay zekadaki parametreler, modelin eğitim sırasında öğrendiği değişkenlerdir. Bunlar, modelin varsayımlarda bulunmak yahut kararlar almak için kullandığı iç değişkenlerdir. Daha fazla parametre çoklukla sorgularınızın daha akla yatkın anlaşılması manasına gelir. Bununla birlikte hesaplama talepleri de paralel olarak artar.

Öte yandan Microsoft’un araştırmacıları, eğitim datalarının kendisini iyileştirerek Phi-3 Mini’de şaşırtan sonuçlar elde ettiklerini belirtiyor. Günümüzün devasa AI modelleri, internetteki ve kütüphanelerindeki “her şey” ilet eğitiliyor. Bu bilgi kümesinin içerisinde faydalı şeyler kadar faydasız şeyler de olabiliyor. Microsoft ise Phi-3 Mini’yi yüksek kaliteli web içeriği ve evvelki Phi modellerinden geliştirilen sentetik olarak oluşturulmuş malzemeden oluşan son derece seçkin bir bilgi kümesiyle eğitti. Bu da modelin performansının, boyutuna nazaran güçlü olmasını sağladı. Kısaca nicelikten fazla niteliğe odaklanıldı.

Bu ortada model ayrıyeten bir seferde 4.000 token‘a kadar bağlamı işleyebiliyor ve 128k token‘lık özel bir versiyonu da mevcut. Microsoft bu modeli Azure, Hugging Face ve Ollama’da açık kaynak olarak kullanıma sundu. Firma, Phi-3 Small (7B parametreleri) ve Phi-3 Medium’u (14B parametreleri) da yakında piyasaya sürmeyi planlıyor.

Reaksiyon Göster
  • 0
    alk_
    Alkış
  • 0
    be_enmedim
    Beğenmedim
  • 0
    sevdim
    Sevdim
  • 0
    _z_c_
    Üzücü
  • 0
    _a_rd_m
    Şaşırdım
  • 0
    k_zd_m
    Kızdım

info@teknovivo.com

Yazarın Profili
Paylaş

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir