Yerli Türkçe yapay zeka modeli Cosmos T1

Cosmos T1: Yerli Türkçe Yapay Zekâ Modeli Ne Vadediyor?

Esra Ayça Paslı15 dakika

Yapay zekâ modelleri son yıllarda hayatımızın hemen her köşesine sızdı; müşteri destek botlarından kod tamamlama araçlarına, arama motorlarından ofis uygulamalarına kadar uzanan geniş bir yelpazede LLM’lerin (Large Language Model) imzasını görüyoruz. Ancak bu gelişimin önemli bir kısmı İngilizce merkezli ilerledi. Türkçe ise dil yapısının karmaşıklığı, eklemeli söz dizimi ve görece sınırlı veri setleri nedeniyle çoğu zaman "ikinci sınıf vatandaş" muamelesi gördü.

Tam da bu noktada Yıldız Teknik Üniversitesi’ndeki Cosmos araştırma ekibinin geliştirdiği Cosmos T1 önemli bir boşluğu doldurmaya aday. 9 milyar parametreli, Türkçe odaklı ve açık kaynak ağırlıklarıyla sunulan bu model; hem akademik hem de kurumsal dünyada Türkçe doğal dil işleme için yeni bir temel katman haline gelebilir.

Bu yazıda Cosmos T1’i teknik bülten tarzında tekrar etmekten ziyade, onu geliştirici ve ürün ekipleri için anlamlı kılan noktaları ele alacağım: Neden Türkçe’ye özel bir modele ihtiyaç vardı? Cosmos T1’in mimarisi neyi hedefliyor? Performans iddiaları pratikte ne ifade ediyor? Açık ağırlıklar ve on-premise kullanım hangi sorunları çözüyor? Ve en önemlisi; bu model Türkiye’de yapay zekâ ekosistemi için ne tür kapılar açabilir?

Neden Türkçe’ye odaklanan yerli bir LLM’e ihtiyaç vardı?

Türkçe, sondan eklemeli bir dil. Kelimeler yüklem, zaman, kişi, olumsuzluk ve pek çok anlam katmanını ekler aracılığıyla alıyor. Aynı kökten türetilmiş kelimeler, bağlam içinde çok farklı roller üstlenebiliyor. İngilizce merkezli eğitilmiş büyük modeller elbette Türkçe metinleri de bir yere kadar işleyebiliyor; fakat:

  • İnce anlam farklarını,
  • Günlük konuşma diliyle resmi dili,
  • Argo ve deyimleri,
  • Kültürel referansları,
  • Yerel kurumsal jargonu

çoğu zaman yüzeysel düzeyde anlıyorlar. Bunun iki temel nedeni var: Eğitim verisinin ağırlıklı olarak İngilizce olması ve model mimarisinin erken aşamada İngilizce odaklı optimize edilmesi.

Yerli ve Türkçe odaklı bir model geliştirmek, sadece "bizim de modelimiz olsun" motivasyonuyla açıklanamaz. Asıl kritik olan:

  • Hassas verilerin ülke sınırları içinde kalabilmesi,
  • Kurumların kendi veri setleriyle ince ayar (fine-tuning) yapabilmesi,
  • Dil ve kültür bağlamında daha isabetli sonuçlar üretebilmesi.

Cosmos T1, bu noktada "Türkçe’yi ana vatandaş" kabul eden bir yaklaşım sunuyor.

9 milyar parametreli bir model ne anlama geliyor?

LLM dünyasında parametre sayısı tek başına kalite göstergesi değil; ama modelin kapasitesi hakkında önemli bir işaret. 9 milyar parametre, günümüz standartlarında:

  • Çok büyük bulut modelleri (70B, 175B, 400B+) kadar ağır olmayan,
  • Ama küçük yardımcı modeller (1–3B) kadar da sınırlı kalmayan

orta ölçekli bir denge noktası demek. Bu ölçek:

  • Kurumsal sunucularda, güçlü GPU’larla on-premise koşmayı mümkün kılacak kadar "hafif",
  • Türkçe'nin zengin morfolojisini ve çok sayıda kullanım bağlamını kapsayacak kadar "zengin".

Özellikle finans, sağlık, savunma ve kamu kurumları için bu boyut, hem performans hem maliyet tarafında makul bir kompromi sunuyor.

Cosmos T1’in dayandığı temel: Gemma 2 üzerine Türkçe odaklı bir katman

Cosmos T1, Google’ın Gemma 2 model ailesini temel alıyor. Bu, sıfırdan her şeyi yeniden icat etmek yerine, güçlü ve modern bir mimariyi Türkçe’ye göre yeniden eğitmek anlamına geliyor. Özetle yaklaşım şöyle:

  • Gemma 2’nin kanıtlanmış transformer altyapısı kullanılıyor,
  • Üzerine Türkçe odaklı eğitim verisi ve görevler ekleniyor,
  • Amaç, Türkçe’de "düşünebilen" bir türev model üretmek.

Buradaki "düşünebilmek" ifadesi pazarlama cümlesi olarak değil, teknik bir tasarım tercihi olarak ele alınmalı. Cosmos ekibinin vurguladığı nokta; modelin sadece doğrudan cevap üretmesi değil, cevap öncesi bir akıl yürütme (chain-of-thought) sürecini Türkçe olarak içselleştirmesi.

Bu, özellikle matematiksel ve mantıksal görevlerde fark yaratıyor. Model, problemi adım adım çözmeye çalıştığında:

  • Aradaki düşünme zinciri gözlemlenebilir,
  • Hata analizi yapmak daha kolay hale gelir,
  • Kullanıcıya "neden bu cevaba ulaştığını" anlatmak mümkün olur.

Kurumlar için bu şeffaflık, kara kutu modellerle aralarındaki güven uçurumunu kapatmaya yardımcı olabilir.

Türkçe GSM8K başarımı neden önemli bir sinyal?

Cosmos T1, Türkçe GSM8K testinde yaklaşık %77,4 doğruluk oranına ulaşıyor. Bu oran, özellikle 70 milyar parametreli Llama-3.1-70B ve Gemma-2-9B gibi daha büyük veya benzer ölçekli modellere göre dikkate değer bir avantaj sağlıyor.

Peki GSM8K nedir ve neden bu kadar konuşuluyor?

GSM8K, matematiksel problem çözme görevlerini içeren bir veri seti. İlk versiyonları İngilizce için tasarlanmış olsa da, Türkçe uyarlamalarıyla birlikte:

  • Okuduğunu anlama,
  • Mantıksal ilişki kurma,
  • Adım adım çözüm üretme,
  • Sonucu doğru biçimde ifade etme

gibi yetenekleri ölçmek için güzel bir kriter haline geldi. Yani sadece dil bilgisi değil, muhakeme gücü de test ediliyor.

Cosmos T1'in burada yakaladığı skor, parametre sayısından bağımsız olarak iki şeyi gösteriyor:

  1. Türkçe veri seti ve görev tasarımı başarılı: Model, dilin yapısını ve problem tiplerini iyi öğrenmiş.
  2. Düşünme zinciri yaklaşımı fayda sağlıyor: Önce akıl yürütüp sonra cevap üretme stratejisi, salt "hemen cevap ver" kurgusuna göre daha etkili.

Bu da Cosmos T1’i, özellikle eğitim teknolojileri, sınav hazırlık sistemleri ve hesaplama ağırlıklı müşteri hizmetleri botları için güçlü bir aday yapıyor.

200 milyardan fazla Türkçe token: Veri tarafındaki iddia

Bir dil modelinin kalitesi, büyük ölçüde eğitildiği veriyle belirlenir. Cosmos T1'in eğitim sürecinde 200 milyar token’dan fazla Türkçe veri işlenmiş olması, iki açıdan kritik:

  1. Kapsam genişliği: Haber metinleri, teknik dokümanlar, kitaplar, soru-cevap setleri, forum konuşmaları ve daha pek çok kaynağın bir araya gelmesi, dilin farklı kullanımlarını kapsama imkânı sunar.
  2. Türkçe’ye özgü yapıların öğrenilmesi: Ek-fiiller, birleşik zamanlar, deyimsel yapılar, kısaltmalar ve konuşma dili ifadeleri gibi konular sadece sınırlı veriyle öğrenilemez.

Elbette veri kalitesi, sadece miktarla ilgili değil. Gürültülü, tekrar eden, yanlı veya düşük kaliteli içeriklerle dolu bir veri yığını, bazen faydadan çok zarar getirebilir. Cosmos ekibi burada özellikle:

  • Masked Language Modeling (MLM) teknikleriyle Türkçe’ye özgü zorluklara odaklandığını,
  • Dilin morfolojik yapısını anlamak için özel ön işleme adımları uyguladığını,
  • Eğitimi 12 katmanlı decoder-only transformer mimarisiyle optimize ettiğini

vurguluyor. Bu da modelin, sadece cümle düzeyinde değil, ek düzeyinde de Türkçe’yi yakalamaya çalıştığı anlamına geliyor.

Mimari açıdan: 12 katmanlı decoder-only transformer

Transformer mimarisi, günümüz LLM’lerinin de-facto standardı. Cosmos T1, bu mimarinin decoder-only tasarımını kullanıyor. Yani:

  • Girdi metinleri sağdan sola değil soldan sağa işleniyor,
  • Model, önceki token’lara bakarak bir sonraki token’ı tahmin ediyor,
  • Otoregresif üretim sayesinde metin tamamlama, soru-cevap ve diyalog görevlerinde rahatlıkla kullanılabiliyor.

12 katmanlı yapı, hem eğitim süresini hem de çıkarım maliyetini kontrol altında tutmaya yardımcı oluyor. Bunun anlamı:

  • Kurum içi GPU kümelerinde çalıştırmak daha mümkün,
  • Bulut maliyetleri, ultra büyük modellere kıyasla daha tahmin edilebilir,
  • Gecikme kritik olan sohbet botu, çağrı merkezi asistanı gibi senaryolarda daha akıcı deneyim sunma potansiyeli.

Türkçe’nin eklemeli yapısı düşünüldüğünde, tokenizer ve embedding düzeyinde yapılan optimizasyonlar da en az katman sayısı kadar önemli. Herhangi bir kelimenin onlarca farklı hâlini anlamlı biçimde temsil edebilmek, özellikle düşük kaynaklı dillerde kritik bir mesele.

Açık kaynak ağırlıklar ve on-premise kullanımın önemi

Cosmos T1’in belki de en stratejik özelliği, model ağırlıklarının açık olarak sunulması ve kurum içi (on-premise) kurulumlara uygun olması. Bu yaklaşım, özellikle şu kurum tipleri için oyunun kurallarını değiştiriyor:

  • Bankalar ve finans kuruluşları,
  • Sigorta ve sağlık şirketleri,
  • Savunma ve kamu kurumları,
  • Kritik altyapı yöneten enerji ve telekom operatörleri.

Bu kurumlar, verilerini regülasyonlar gereği bulut tabanlı kapalı servislere emanet etmek istemeyebiliyor. Özellikle:

  • Sağlık kayıtları,
  • Finansal işlem geçmişi,
  • Operasyonel risk raporları,
  • Stratejik proje dökümanları

gibi veriler, dış servis sağlayıcılarla paylaşılmak istenmeyebiliyor. Cosmos T1 gibi açık kaynak, indirilebilir ağırlıklara sahip bir model, bu sorunu şu şekilde çözüyor:

  • Model, kurumun kendi veri merkezinde veya özel bulutunda çalıştırılabiliyor.
  • İnce ayar süreci (fine-tuning) tamamen şirket içinde yürütülebiliyor.
  • Hassas veriler, ağ dışına hiç çıkmadan yapay zekâdan fayda sağlanabiliyor.

Bu da "veri egemenliği" kavramını somut bir avantaja dönüştürüyor.

ChatGPT gibi servislerle fark nerede başlıyor?

Cosmos T1 gelişimini anlatırken yapılan önemli vurgulardan biri, bu modelin ChatGPT gibi kapalı kutu servislerle aynı kulvarda değerlendirilmemesi gerektiği. Aradaki temel farklar şöyle özetlenebilir:

  1. Hizmet modeli: ChatGPT ve benzeri servisler, çoğunlukla SaaS (Software as a Service) olarak tüketiliyor. Yani siz modele API üzerinden erişiyorsunuz. Cosmos T1 ise indirilebilir ağırlıklarıyla "şirket içinde çalıştırılan yazılım bileşeni" rolüne daha yakın.
  2. Veri kontrolü: Kapalı servislerde veri işleme ve saklama politikaları sağlayıcı tarafından belirleniyor. Cosmos T1’de kurum, verinin geçtiği tüm katmanların sahibi olabiliyor.
  3. Şeffaflık: Cosmos T1 tarafında, yanıtın nasıl üretildiğine dair düşünme zinciri Türkçe olarak gözlenebiliyor. Bu, hata ayıklama ve güven inşası için büyük avantaj.
  4. Dil ve kültür odağı: ChatGPT çok dilli olsa da, Türkçe çoğu zaman İngilizce’ye göre ikincil düzeyde optimize ediliyor. Cosmos T1 ise tasarım itibarıyla Türkçe’yi merkeze alıyor.

Bu tabloda "kim daha iyi?" sorusu yerine, "hangi bağlamda hangisi daha uygun?" sorusunu sormak daha sağlıklı. Küresel, çok dilli bir ürün için ChatGPT gibi modeller muhtemelen hâlâ güçlü seçenekler. Ancak Türkçe ağırlıklı, regülasyonlu ve veri hassasiyeti yüksek alanlarda Cosmos T1 gibi modeller ciddi fark yaratabilir.

Hugging Face ve web arayüzü üzerinden erişim

Cosmos T1, iki farklı kanaldan erişilebilir durumda:

  1. Hugging Face üzerinden model ağırlıkları ve teknik detaylar,
  2. Cosmos LLM web arayüzü üzerinden deneme ve etkileşim imkânı.

Bu ikili yapı hem geliştiriciler hem de meraklı kullanıcılar için iyi bir başlangıç noktası. Geliştiriciler:

  • Modeli doğrudan indirip kendi ortamlarında çalıştırabilir,
  • Farklı prompt şablonları ve görev tiplerini test edebilir,
  • Kendi veri setleriyle deneysel fine-tuning çalışmaları yapabilir.

Daha geniş kullanıcı kitlesi ise:

  • Web arayüzü üzerinden modelin Türkçe performansını görebilir,
  • Sohbet, soru-cevap, özetleme ve metin dönüştürme gibi görevleri deneyebilir,
  • "Bu model benim işimde neleri kolaylaştırabilir?" sorusuna somut örnekler bulabilir.

Bu erişim kolaylığı, yerli modeller için en kritik engellerden biri olan "görünür olma" sorununu da azaltıyor.

Cosmos T1’in güçlü olduğu muhtemel kullanım alanları

Modelin mimarisi, eğitim verisi ve Türkçe odaklı yaklaşımı düşünüldüğünde Cosmos T1 özellikle şu alanlarda öne çıkabilir:

1. Kurumsal bilgi tabanları ve iç arama

Şirket içi dokümanlar, prosedürler, toplantı notları ve proje raporları; genellikle büyük ve dağınık bilgi yığınlarıdır. Cosmos T1, bu tür içerikleri:

  • Anlamsal olarak indeksleyerek,
  • Konu bazlı özetler çıkararak,
  • Çalışan sorularına bağlamlı yanıtlar üreterek

kurumsal aramayı çok daha akıllı hale getirebilir.

2. Müşteri destek asistanları

Türkçe diyaloglarda doğru tonu yakalamak, teknik terimleri doğru çevirmek ve kültürel bağlamı anlamak; müşteri deneyimi açısından kritiktir. Cosmos T1:

  • Sektör spesifik veriyle ince ayarlandığında,
  • CRM ve destek sistemleriyle entegre edildiğinde,
  • Çok kanallı (web, mobil, çağrı merkezi) asistanlara güç verdiğinde

çağrı merkezi yükünü ciddi biçimde azaltabilir.

3. Eğitim ve sınav hazırlık platformları

GSM8K benzeri testlerdeki başarım, özellikle:

  • Ortaöğretim ve üniversite seviyesinde matematik problemleri,
  • Mantık ve muhakeme soruları,
  • Açık uçlu yanıt gerektiren ödevler

için modelin güçlü bir yardımcı olabileceğini gösteriyor. Doğru sınırlar ve etik kurallarla birlikte kullanıldığında, Cosmos T1 öğrencilere açıklamalı çözümler, adım adım rehberlik ve kişiselleştirilmiş çalışma planları sunabilir.

4. Hukuk ve mevzuat analizi

Türkçe’nin uzun cümleli, karmaşık hukuk metinlerinde doğru anlaşılması zorlu bir problemdir. Yerli bir LLM:

  • Maddeleri özetleyip yeniden ifade etme,
  • İlgili maddeleri bir araya getirme,
  • Dokümanlar arasında atıf ilişkisi çıkarma

gibi görevlerde kurumlara ciddi zaman kazandırabilir. Burada da veri gizliliği sebebiyle on-premise çalışma yeteneği kritik hale gelir.

Zorluklar ve dikkat edilmesi gereken noktalar

Cosmos T1’in getirdiği yenilikler kadar, beraberinde getirdiği sorumluluklar da var. Özellikle:

  • Model önyargıları: Eğitim verisindeki toplumsal önyargılar modelde yeniden üretilebilir. Bu yüzden hassas alanlarda insan gözetimi ve ek filtreleme katmanları şart.
  • Güncellik: Modelin bilgi kesim tarihi, gerçek dünyayla arasında zaman farkı oluşturur. Bu, özellikle hızla değişen konularda dikkatle yönetilmeli.
  • Altyapı gereksinimi: 9B parametreli bir modeli üretim ortamında verimli çalıştırmak, GPU kaynakları ve yazılım optimizasyonu gerektirir.
  • Kullanım rehberi: Kurum içi ekiplerin modeli nerede, nasıl ve hangi sınırlar içinde kullanacağını netleştiren politikalar hazırlanmalı.

Yani, güçlü bir yerli modelin varlığı tek başına yeterli değil; etrafında sağlıklı bir kullanım ekosistemi kurmak da en az model kadar önemli.

Türkiye yapay zekâ ekosistemi için ne ifade ediyor?

Cosmos T1, tek başına tüm ihtiyaçları çözecek "sihirli model" değil. Ancak birkaç açıdan sembolik ve pratik anlam taşıyor:

  1. Akademi-sanayi işbirliği için somut bir örnek: Üniversite kökenli bir ekibin, endüstrinin kullanabileceği nitelikte bir model üretmesi, diğer araştırma grupları için cesaret verici.
  2. Yerel veriyle model geliştirme kültürü: Türkçe’nin ve Türkiye’ye özgü veri setlerinin ciddiye alındığı bir örnek sunuyor.
  3. Regülasyon çağında veri egemenliği: Özellikle KVKK ve sektör bazlı regülasyonların yoğunlaştığı bir dönemde, kurumlara "yerli ve kontrol edilebilir" bir seçenek sunuyor.
  4. Topluluk gelişimi: Açık kaynak olması, hem araştırmacıların hem de bağımsız geliştiricilerin bu model etrafında yeni araçlar, wrapper’lar ve uygulamalar geliştirmesine olanak tanıyor.

Uzun vadede bu tür projeler, sadece tekil model başarılarıyla değil; yetişen insan kaynağı, oluşan bilgi birikimi ve ortaya çıkan yan projelerle ölçülecek.

Sonuç: Cosmos T1, Türkçe için güçlü bir başlangıç noktası

Cosmos T1, 9 milyar parametreli, Türkçe’ye odaklı ve açık kaynak ağırlıklara sahip bir yapay zekâ modeli olarak, Türkiye’deki kurumlar ve geliştiriciler için önemli bir seçenek sunuyor. Yüksek GSM8K başarımı, Türkçe’nin morfolojik zorluklarına yönelik özel tasarımı, Gemma 2 tabanlı modern mimarisi ve on-premise kuruluma uygun yapısıyla; hem teknik hem stratejik açıdan dikkate değer bir adım.

Bu modelin gerçek değeri, önümüzdeki yıllarda:

  • Hangi ürünlere gömüleceği,
  • Hangi kurumsal dönüşümlerin parçası olacağı,
  • Hangi araştırma ve yan projelere ilham vereceği

ile daha net ortaya çıkacak. Ancak bugün için bile şunu söylemek mümkün: Cosmos T1, "Türkçe için dünya standartlarında bir LLM mümkün mü?" sorusuna verilen ikna edici bir yanıt. Doğru şekilde sahiplenildiğinde, sadece bir model olmanın ötesine geçip, Türkiye’nin yapay zekâ hikâyesinde önemli bir kilometre taşı haline gelebilir.