Yerli Girişim VNGRS’ten Türkçe Büyük Dil Modeli: Kumru

Kumru’lar gibi Sohbete Hazır Mıyız?

Yazılım, bulut ve yapay zekâ alanlarında faaliyet gösteren Türk teknoloji girişimi VNGRS, tamamen Türkçe için geliştirilen büyük dil modeli Kumru LLM’yi resmen tanıttı.

7,4 milyar parametre ile geliştirilen Kumru, Türkçe dil yapısına özgü biçimde sıfırdan eğitilen ilk yerli büyük dil modeli olarak öne çıkıyor. En dikkat çekici özelliklerinden biri ise, yalnızca 16 GB VRAM kapasitesine sahip standart GPU’larda bile sorunsuz çalışabilmesi

💬 ChatGPT Alternatifi Yerli Model

Kumru, metin işleme, özetleme, kurumsal soru-cevap sistemleri ve doğal dil anlama gibi görevlerde ChatGPT benzeri performans sunuyor.
Dil bilgisi düzeltme, belge özetleme, makine çevirisi, metin sınıflandırması ve doğal dil çıkarımı gibi 26 farklı görev türünde test edildi. Model, yalnızca Türkçe odaklı olsa da İngilizce metinleri anlamada ve kod yazmada da yüksek performans gösteriyor.

⚙ Eğitim Süreci: 500 GB Veri ve 300 Milyar Token

Kumru’nun ön eğitim süreci 45 gün sürdü. Eğitim, NVIDIA’nın H100 ve H200 GPU’ları üzerinde gerçekleştirildi ve 500 GB’lık veri seti kullanıldı.
Modelin temelinde Mistral-v0.3 mimarisi bulunurken, eğitim sürecinde Meta’nın LLaMA-3 modeli de referans olarak kullanıldı.

Ön eğitim sonunda 300 milyar token’le eğitilen Kumru, ardından 1 milyon örnekle ince ayar (fine-tuning) aşamasından geçirildi. Böylece modelin Türkçe metinlerde doğruluk, akıcılık ve bağlamsal anlama yetenekleri üst düzeye çıkarıldı.

💻 Şirket İçi Kullanım İçin Erişilebilir Maliyet

Kumru’nun öne çıkan bir diğer yönü, yüksek donanım gerektirmemesi.
Model, sadece 16 GB VRAM’e sahip bilgisayarlarda yerel olarak çalışabiliyor. Bu sayede şirketler, verilerini dış sistemlere taşımadan yerel sunucularında yapay zekâ çözümleri geliştirebiliyor. Bu da özellikle veri güvenliği ve regülasyon hassasiyetine sahip finans kurumları için büyük avantaj sunuyor.

🔓 Açık Kaynaklı Küçük Versiyon: Kumru-2B

VNGRS, Kumru’nun daha hafif bir versiyonunu da açık kaynak olarak erişime açtı.
Kumru-2B, aynı mimariyi 2 milyar parametreyle sunuyor ve sadece 4,8 GB bellekle çalışabiliyor. Bu sürüm, mobil cihazlar veya düşük donanımlı sistemlerde bile çalıştırılabiliyor.

Model, Hugging Face platformu üzerinden indirilebiliyor ve geliştiricilere Türkçe için optimize edilmiş bir temel sağlıyor.

🚀 Türkçe Yapay Zekâ Ekosistemine Güçlü Katkı

VNGRS’in Kumru projesi, Türkiye’nin yapay zekâ üretiminde kendi dilinde bağımsızlık kazanması yolunda önemli bir adım olarak değerlendiriliyor.
Yerli dil modellerinin gelişimi, hem finans ve kamu sektörü gibi veri gizliliği yüksek alanlarda kullanım potansiyelini artırıyor hem de yerli AI ekosisteminin küresel rekabette konumunu güçlendiriyor.

Kaynak: Türkiye Gazetesi