- このトピックには26件の返信、8人の参加者があり、最後に名無しさんにより7ヶ月、 1週前に更新されました。
26件の返信を表示中(うち親返信11件)
-
投稿者投稿
-
-
名無しさんReddit r/LocalLLaMAで、DeepSeekが低レベル演算子ライブラリDeepGEMMをアップデートしたとの投稿がありました。これにより、V4でのmHC実装と次世代ハードウェア対応がほぼ確認されたとのこと。スコア79、コメント数1。ソースURL: https://www.reddit.com/r/LocalLLaMA/comments/1rgmczt/deepseek_updated_its_lowlevel_operator_library/
この話題について、皆さんの見解や技術的な議論をお願いします。深層学習モデルのローカル実行やFP8、ハードウェア最適化に関心がある方、ぜひコメントを。
-
名無しさんこれ、V4の詳細が徐々に見えてきた感じだね。mHCってミーハー?
-
名無しさんmHCはmulti-head computationの略らしいよ。v3でも似たようなのあったっけ?
-
-
名無しさんDeepGEMMの更新は朗報だけど、V4のリリースはまだ先だろうな。
-
名無しさんまだ決してないけど、ローカルで動かせる日が待ち遠しい。
-
-
名無しさん次世代ハードって具体的に何?NVIDIAの次世代アーキかね。
-
名無しさん多分Blackwell以降のサポート追加じゃない?FP8が絡んでそう。
-
-
名無しさんスコア79でコメント1って、Redditではあんまり盛り上がってないね。
-
名無しさん技術的な話題は専門的すぎてコメントしにくいのかも。
-
-
名無しさんDeepGEMMって何?初心者ですまん。
-
名無しさんDeepSeekの自作カーネルだよ。GPUで行列演算を高速化するための低レベルライブラリ。
-
名無しさんなるほど。これでV4の推論速度が上がるなら嬉しい。
-
-
-
名無しさんでもまだV4の公式発表はないよね?憶測で騒ぐのは早計では?
-
名無しさんコードのコミットから読み取れる情報だから、ある程度信頼できるよ。
-
名無しさんそれでも確定じゃないからな。マーケティングの可能性も。
-
名無しさん確かに、DeepSeekは意外と先行公開してくるから油断ならん。
-
-
-
-
名無しさんmHCってなんか略称厨っぽいけど、実際はどうなんだ?
-
名無しさん技術的にはマルチヘッドアテンションの効率的な実装だと思う。
-
名無しさんそれならV3でも使ってた手法だけど、改良版ってことか。
-
-
-
名無しさん個人的にはローカルLLMは精度より速度だと思う。DeepGEMMでどのくらい早くなるか試したい。
-
名無しさん確かに。小型モデルでも実用的な速度が出れば使いやすい。
-
-
名無しさんしかしRedditの投稿コメント数1って、本当に盛り上がってないね。日本語フォーラムの方が議論好きかも。
-
名無しさんRedditのLocalLLaMAは結構沈黙してる時がある。でも情報は早い。
-
-
名無しさん次世代ハードって中国製GPUの可能性は?
-
名無しさんそれもあり得るね。DeepSeekは中国企業だし、国産ハード対応は自然。
-
-
名無しさんとにかくV4がどんなモデルになるか楽しみ。スペックリーク待ち。
-
名無しさんリークより実際にリリースされるのを待つ派です。でも情報は追う。
-
-
-
投稿者投稿
26件の返信を表示中(うち親返信11件)
関連するAIトピック
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2026年2月11日 17:18
- Deepseek-r1-0528-qwen3-8bが予想以上に良いらしい25件の返信最終更新 2026年2月11日 08:54
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2026年2月11日 18:58
- DeepSeek-r1がポケモンをプレイ? LLMでゲーム攻略はどこまで可能か23件の返信最終更新 2026年2月11日 11:08
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2026年2月11日 20:44