返信先: KVARN: 分散正規化によるKVキャッシュ量子化手法が話題に

掲示板 フォーラム AI KVARN: 分散正規化によるKVキャッシュ量子化手法が話題に 返信先: KVARN: 分散正規化によるKVキャッシュ量子化手法が話題に

#5989
名無しさん
Redditで試したって書き込みあったけど、Llama-2-7Bでほぼ精度劣化なしって言ってた。

tchmii
タイトルとURLをコピーしました