- このトピックには25件の返信、8人の参加者があり、最後に名無しさんにより8ヶ月、 1週前に更新されました。
25件の返信を表示中(うち親返信9件)
-
投稿者投稿
-
-
名無しさん「8x H100でDeepSeek V4-Flashの内部を動かしてみた – mHCが実際にやっていること」という投稿がありました。モデルの内部動作やmHCの効果について議論されています。
-
名無しさんmHCって何の略?初めて聞いた。
-
名無しさんなるほど、KVキャッシュの改良版って感じか。
-
-
名無しさんMulti-Head Cacheのことらしい。推論高速化の仕組みみたい。
-
名無しさん8台のH100って金持ちすぎるだろ。個人では無理。
-
名無しさんクラウドでレンタルすれば意外と安く済むらしいよ。
-
名無しさんそれでも1時間数千円はかかるんでしょ?気軽にはできないな。
-
-
-
名無しさんDeepSeek V4ってどのくらいの性能なんだ?他のモデルと比較して。
-
名無しさんベンチマークではLlama 3.1 405Bに迫るって噂。でも実際は使ってみないと分からない。
-
-
名無しさんmHCの効果って本当にあるの?過大評価されてない?
-
名無しさん自分のテストだとトークン生成速度が20%くらい上がった。ただし精度に影響はない。
-
名無しさんそれは結構な改善だな。でもキャッシュのメモリ使用量は増えるんでしょ?
-
名無しさんそこがトレードオフ。H100なら余裕かもしれんが、コンシューマー向けGPUだと厳しいかも。
-
-
-
-
名無しさんDeepSeekって中国の企業だよね。データプライバシー大丈夫?
-
名無しさんローカルで動かすから問題ない。むしろAPI使うほうがリスク。
-
名無しさんそうか。でもモデル自体にバックドアがあったら怖いな。
-
名無しさんオープンウェイトだから検証できるし、コミュニティでチェックされてるよ。
-
-
-
-
名無しさん8x H100なんて環境、普通の人は持てないから、もっと軽いモデルに期待。
-
名無しさんV4-Flashは蒸留モデルだから、8x H100は過剰かも。実際は4台でも動くらしい。
-
名無しさん情報ありがとう。じゃあ2台のA100でもなんとか?
-
名無しさんメモリ次第。V4-Flashは700Bパラメータあるから、2台のA100 80GBでは足りないかも。
-
-
-
-
名無しさんこのスレ、技術的に深いな。もっと詳細なドキュメント欲しい。
-
名無しさんRedditのもっと詳しく書いてあるよ。興味あるなら読んでみて。
-
名無しさん見てきたけど、結構専門的だった。でもmHCの実装は参考になる。
-
-
-
名無しさん結局、コスパはどうなの?GPT-4よりも安く済む?
-
名無しさん自前で動かせば長期的には安いけど、初期投資とメンテが大変。APIのほうが手軽。
-
-
-
投稿者投稿
25件の返信を表示中(うち親返信9件)
関連するAIトピック
- ChatGPTを使いこなすコツ・便利な使い方を共有しよう0件の返信最終更新 2025年3月16日 18:46
- 【AI】2026年の生成AI、結局どこ見れば面白い?39件の返信最終更新 2025年3月17日 16:11
- ECCV 2022のレビューについて議論しよう21件の返信最終更新 2025年4月7日 07:48
- ECCV 2022 採択論文リストが公開されましたね27件の返信最終更新 2025年4月12日 20:48
- DeepSeekの評価額450億ドル近く、中国「Big Fund」が投資交渉 – ローカルLLMへの影響は?14件の返信最終更新 2025年10月11日 08:34