llama

30 milyar veri kümesinden beslenen her ağırlık q2_k kuantizasyon seviyesiyle 2 bitlik formatta temsil edildiği için modelim aklını kaybetti:
https://www.youtube.com/shorts/aTo2wqkQ0jM

meğerse q4_k, q2_k den daha stabil çalışıyor, yazılanları daha iyi algılıyor ve daha nokta atışı yanıtlar veriyormuş!

296

11.08.2024 22:59

ellerim bos gonlum hos

2 entry daha

üye ol

bilgiyi bilenden, öğrenmek isteyene taşıyan sözlüğe sen de katıl.

e-posta ile üye ol

zaten üye misin? giriş yap

Gündemdeki Haberler

lanet kel pornosu izleyen adam

Güncel Önemli Başlıklar

ateizm galatasaray devlet bahçeli