- このトピックには15件の返信、5人の参加者があり、最後に名無しさんにより1年前に更新されました。
15件の返信を表示中(うち親返信4件)
-
投稿者投稿
-
-
名無しさん話題の「FlashMemory-DeepSeek-V4: Lightning Index Ultra-Long Context via Lookahead Sparse Attention」について。DeepSeek V4に新たな注意機構を導入し、超長文コンテキストを効率的に処理できるようになったらしい。ローカルLLM界隈ではコスパやプライバシーの面からも注目されてるけど、実際の精度や速度はどうなん?
-
名無しさんLookahead Sparse Attentionって名前からしてかっこいいけど、実際の効果はどうなんだろう。ベンチマーク見たい。
-
名無しさんそうそう、特に長文処理の速度が気になる。従来のフルアテンションだとメモリ爆発するからね。
-
名無しさん確かに。FlashMemoryって名前からしてメモリ効率良さそう。でもLookaheadのオーバーヘッドが気になる。
-
-
-
名無しさんDeepSeekは中国製だからデータ収集が心配って声もあるけど、ローカルで動かす分には問題ないかな。
-
名無しさん中国製でもオープンならコード確認できるし、プライバシーは自分で制御できるんじゃない?
-
-
名無しさんLlamaやMistralと比べてどうなんだろう。DeepSeek V4のベンチマークスコアまだ出てない?
-
名無しさんRedditのスレでも議論になってたけど、まだプレリリース段階みたい。実際に試した人のレポート待ちだね。
-
名無しさん試すにしてもVRAMが足りない…。40GB以上必要とか書いてなかった?
-
名無しさん量子化バージョンが出れば24GBでもいけるかも。FP16だと確かに厳しい。
-
名無しさん個人的にはコード生成で使いたい。長いコードベースを読ませるのに良さそう。
-
名無しさんLookahead Sparse Attentionがコードの依存関係をうまく捉えられるかどうかだな。従来のTransformerより賢いのか?
-
名無しさん論文読んだ感じだと、スパースパターンが長距離依存をキャッチしやすい設計らしい。でも実装次第。
-
名無しさんローカルLLMは進化が速いから、すぐに次の手法が出てきそう。とりあえず試せる環境が欲しい。
-
-
-
-
-
名無しさんAPIで使うならともかく、自前で動かすのはコスト面でまだ敷居が高いな。
-
名無しさんでもRTX5090とか出たら一気に敷居下がるかも。期待して待つわ。
-
-
-
投稿者投稿
15件の返信を表示中(うち親返信4件)
関連するAIトピック
- AIと人間の見分けがつくか? – DeepSeek新バージョンを追加したゲームの話題18件の返信最終更新 2025年10月26日 02:40
- DeepSeekが本当のオープンAI?実際に使ってみた感想21件の返信最終更新 2025年10月27日 02:20
- DeepSeek R1-0528-Qwen3-8Bが無限ツールループに陥る問題、対処法ある?20件の返信最終更新 2025年10月26日 00:54
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2025年10月27日 09:07
- DeepSeek-R1-0528-Qwen3-8B を試した人の感想27件の返信最終更新 2025年10月26日 19:01