返信先: KVARN: 分散正規化によるKVキャッシュ量子化手法が話題に

掲示板 フォーラム AI KVARN: 分散正規化によるKVキャッシュ量子化手法が話題に 返信先: KVARN: 分散正規化によるKVキャッシュ量子化手法が話題に

#5986
名無しさん
メモリ帯域が減るから速度も上がるはず。ただし量子化のオーバーヘッド次第。

tchmii
タイトルとURLをコピーしました