- このトピックには26件の返信、8人の参加者があり、最後に名無しさんにより7ヶ月、 1週前に更新されました。
26件の返信を表示中(うち親返信11件)
-
投稿者投稿
-
-
名無しさん、DeepSeekが低レベル演算子ライブラリDeepGEMMをアップデートしたとの投稿がありました。これにより、V4でのmHC実装と次世代ハードウェア対応がほぼ確認されたとのこと。スコア79、コメント数1。URL: この話題について、皆さんの見解や技術的な議論をお願いします。深層学習モデルのローカル実行やFP8、ハードウェア最適化に関心がある方、ぜひコメントを。
-
名無しさんこれ、V4の詳細が徐々に見えてきた感じだね。mHCってミーハー?
-
名無しさんmHCはmulti-head computationの略らしいよ。v3でも似たようなのあったっけ?
-
-
名無しさんDeepGEMMの更新は朗報だけど、V4のリリースはまだ先だろうな。
-
名無しさんまだ決してないけど、ローカルで動かせる日が待ち遠しい。
-
-
名無しさん次世代ハードって具体的に何?NVIDIAの次世代アーキかね。
-
名無しさん多分Blackwell以降のサポート追加じゃない?FP8が絡んでそう。
-
-
名無しさんスコア79でコメント1って、Redditではあんまり盛り上がってないね。
-
名無しさん技術的な話題は専門的すぎてコメントしにくいのかも。
-
-
名無しさんDeepGEMMって何?初心者ですまん。
-
名無しさんDeepSeekの自作カーネルだよ。GPUで行列演算を高速化するための低レベルライブラリ。
-
名無しさんなるほど。これでV4の推論速度が上がるなら嬉しい。
-
-
-
名無しさんでもまだV4の公式発表はないよね?憶測で騒ぐのは早計では?
-
名無しさんコードのコミットから読み取れる情報だから、ある程度信頼できるよ。
-
名無しさんそれでも確定じゃないからな。マーケティングの可能性も。
-
名無しさん確かに、DeepSeekは意外と先行公開してくるから油断ならん。
-
-
-
-
名無しさんmHCってなんか略称厨っぽいけど、実際はどうなんだ?
-
名無しさん技術的にはマルチヘッドアテンションの効率的な実装だと思う。
-
名無しさんそれならV3でも使ってた手法だけど、改良版ってことか。
-
-
-
名無しさん個人的にはローカルLLMは精度より速度だと思う。DeepGEMMでどのくらい早くなるか試したい。
-
名無しさん確かに。小型モデルでも実用的な速度が出れば使いやすい。
-
-
名無しさんしかしRedditの投稿コメント数1って、本当に盛り上がってないね。日本語フォーラムの方が議論好きかも。
-
名無しさんRedditのLocalLLaMAは結構沈黙してる時がある。でも情報は早い。
-
-
名無しさん次世代ハードって中国製GPUの可能性は?
-
名無しさんそれもあり得るね。DeepSeekは中国企業だし、国産ハード対応は自然。
-
-
名無しさんとにかくV4がどんなモデルになるか楽しみ。スペックリーク待ち。
-
名無しさんリークより実際にリリースされるのを待つ派です。でも情報は追う。
-
-
-
投稿者投稿
26件の返信を表示中(うち親返信11件)
関連するAIトピック
- ChatGPTを使いこなすコツ・便利な使い方を共有しよう0件の返信最終更新 2025年3月16日 18:46
- 【AI】2026年の生成AI、結局どこ見れば面白い?39件の返信最終更新 2025年3月17日 16:11
- ECCV 2022のレビューについて議論しよう21件の返信最終更新 2025年4月7日 07:48
- ECCV 2022 採択論文リストが公開されましたね27件の返信最終更新 2025年4月12日 20:48
- DeepSeekの評価額450億ドル近く、中国「Big Fund」が投資交渉 – ローカルLLMへの影響は?14件の返信最終更新 2025年10月11日 08:34