Skip to content

NexusAI-tddi/NexusAI

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

10 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

NexusAI

NexusAI

📂 Proje Tanımı:

Günümüzde yapay zeka, farklı dillerdeki metinleri anlama ve işleme konusunda büyük ilerlemeler kaydetmiştir. Ancak, açık kaynaklı base modellerin çok az Türkçe veriyle eğitilmesi sonucunda modeller Türkçe anlama ve konuşmada sıkıntılar yaşamaktadır.

Bunun sonucunda NexusAI, Türkçe anlama ve konuşması gelişmis bir model eğitmiştir.

Bu modelle birlikte, diğer yapay zeka modelleriyle hızlı bir şekilde çalıştırıldığında, karşımıza hem Türkçe anlayıp konuşabilen hem de resimleri anlayabilen bir ürün ortaya çıkmış olacaktır.

💡 Projenin Kullanım Alanları ve Sağladığı Çözümler

  • Büyük dil modelleri, çeşitli modeller sayesinde resim yorumlayabilir hale gelir.

  • Dil modelinin güçlü yazı performansı etkilenmez, görsel analiz yapılabilir.

  • Kurumsal yazılımlar, sağlık ve güvenlik sektörlerinde rahatlıkla kullanılabilir.

Görsel analiz yapabilen modeller, kişiselleştirme ve müşteri memnuniyetini üst seviyelere çıkararak daha etkili ve verimli çözümler sunar.

📊 Veri Seti

Türkçe modelin eğitimi için OpenOrca veri setinin Türkçe’ye çevirilmiş versiyonu kullanılmıştır.

Bu veri setine bu bağlantıyı kullanarak ulaşabilirsiniz: NexusAI-tddi/OpenOrca-tr-1-million-sharegpt

Geliştirilen bütün sistemi test etmek için kullanılan veri seti

Bütün modelin test edilmesi için VisIT-Bench veri setinin Türkçe’ye çevirilmiş versiyonu kullanılmıştır.

Bu veri setine bu bağlantıyı kullanarak ulaşabilirsiniz: NexusAI-tddi/VisIT-Bench-tr

Veri setini işlemek için kullanılan kodu dataset klasörünün içinde bulabilirsiniz.

🔧 Yöntem ve Teknikler:

QLoRa: Önceden eğitilmiş LLM'deki ağırlık parametrelerinin hassasiyetini 4 bit hassasiyete indirgeyerek kullanmaya yarar. LoRA'nın özel bir hâlidir.

Flash Attention: Özellikle büyük dil modellerinin verimliliğini artırmak ve bellek gereksinimlerini azaltmak için tasarlanmış bir dikkat algoritmasıdır.

Cosine Similarity: İki vektör arasındaki açıya dayalı benzerliği ölçen bir benzerlik metriğidir.,

⛏️ Kullanılan Modeller

👁️ Nesnelerin Algılanması:

  • YOLOv8: Fotoğraftaki nesnelerin algılanması için YOLOv8 modeli kullanılmıştır. YOLOv8 Github Repo

📸 Nesnelerin ve Fotoğrafın Açıklamasının Oluşturulması:

  • Moondream2: Fotoğrafın tamamı ve nesnelerin açıklamasının oluşturulması için kullanılmıştır. Moondream2 Modeli

🤖 Büyük Dil Modeli

  • Qwen2-72B-Instruct, base model olarak kullanıldı.

🤖 Model Eğitimi

Modelin Eğitim Tekniği:

Eğitim Kütüphanesi:

Base Model

Önceden eğitilmiş Qwen2-72B-Instruct modelini diğer modellere kıyasla, Türkçe için daha uygun bulduk.

Eğitim ile ilgili daha fazla bilgi ve konfigürasyonumuz için training klasörüne bakabilirsiniz.

🔍 Değerlendirme

Aşağıdaki confusion matrix'ten gerekli değerlendirmeleri çıkarabilirsiniz.

asil

🏆 Sonuçlar

Eğitilen Türkçe büyük dil modeli ve işlenen veri seti, Hugging Face organizasyon hesabında paylaşılmıştır.

Proje, görsellerle ile ilgili çeşitli metriklerde ve gerçek hayat uygulamalarında üstün performans göstermiştir.

Bu projenin, hem Türkçe dilinde olması hem de görsel anlayabilmesi özellikleri sayesinde, birçok sektörde aktif olarak kullanılabileceği sonucuna varılmıştır.

🎥 Demo Uygulaması

Sohbet tabanlı bu arayüzde, metin ve görsel girişler kolaylıkla yapılabilmektedir.

  • Huggingface Spaces: Demo uygulamamızı Huggingface Spaces'de barındırıp, geliştiriyoruz. Huggingface Spaces Sayfası
  • Gradio Framework: Arayüzümüz geliştirilirken, Python tabanlı Gradio framework'ü kullanılmıştır. Gradio PyPI

Demo ile ilgili daha fazla bilgi için demo-app klasörüne bakabilirsiniz.

Demo Videosu

Media1.mp4

About

Turkish Vision Language Model Development And Research

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published