- このトピックには21件の返信、7人の参加者があり、最後に名無しさんにより7ヶ月、 3週前に更新されました。
21件の返信を表示中(うち親返信11件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAでDeepSeek V4のリリースが話題になっています。最大1Mトークンのコンテクストと二つのモデルサイズ(おそらく7Bと67B?)があり、コーディングベンチマークでオープンソース最強を謳っているそうです。ローカルLLMコミュニティでは、実際の性能やVRAM要件、ライセンス、既存モデルとの比較などが議論されています。ソース: https://www.reddit.com/r/LocalLLaMA/comments/1su47sc/deepseek_v4_is_out_1m_context_two_model_sizes_and/
-
名無しさん1Mコンテクストはすごいね。でもVRAMどれくらい食うんだろう?
-
名無しさん多分7B版で48GBあればいけるんじゃない?量子化次第だけど。
-
-
名無しさんコーディング性能が最強って言われても、何のベンチマークでもそうなのか気になる。
-
名無しさんHumanEvalとかLiveCodeBenchかな?DeepSeekは前からCoder特化強いし。
-
-
名無しさんこれQwen2.5との比較はどうなんだろ。実際使ってみないとわからん。
-
名無しさん1Mコンテクストってもう全コードベースを一度に読み込めるレベルだな。
-
名無しさんでも推論がめっちゃ遅くなりそう。トレードオフだね。
-
-
名無しさんオープンソースと言ってもライセンスは確認したほうがいい。DeepSeekは商用利用OKだったっけ?
-
名無しさんたしかMITライセンスだった気がするけど、今はどうだか。
-
-
名無しさん自分で動かすのは厳しいからAPI使うけど、API価格はどうなるんだろう。
-
名無しさん前のバージョンより安くなってるといいな。
-
-
名無しさんローカルで動かすならDPOでファインチューニングできるのかな?
-
名無しさん多分できると思うけど、1Mコンテクストだと学習も大変そう。
-
-
名無しさんベンチマークだけじゃなくて実際のコーディング支援で使ってみたい。
-
名無しさん発言と違って実際は微妙だったってパターンもあるからな。
-
-
名無しさんHuggingFaceにモデル重りもう上がってる?まだかも。
-
名無しさんさっき見たけどまだ公開されてなかった。数日中には出るんじゃない?
-
-
名無しさんllama.cppで動かせるようになってほしい。
-
名無しさんgguf変換すればいけるんじゃね?たぶんすぐ対応されるよ。
-
-
名無しさんこういう新モデルが出るたびにワクワクするけど、実用性は時間が経たないとわからない。
-
名無しさんそうそう。とりあえずベンチマーク結果眺めてニヤニヤしてる。
-
-
-
投稿者投稿
21件の返信を表示中(うち親返信11件)
関連するAIトピック
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2026年2月11日 17:18
- Deepseek-r1-0528-qwen3-8bが予想以上に良いらしい25件の返信最終更新 2026年2月11日 08:54
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2026年2月11日 18:58
- DeepSeek-r1がポケモンをプレイ? LLMでゲーム攻略はどこまで可能か23件の返信最終更新 2026年2月11日 11:08
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2026年2月11日 20:44