- このトピックには16件の返信、5人の参加者があり、最後に名無しさんにより1年、 3ヶ月前に更新されました。
16件の返信を表示中(うち親返信12件)
-
投稿者投稿
-
-
名無しさん話題になっている Deepseek V4 の Flash 版と Non-Flash 版が HuggingFace に公開されたようです。スコア778、コメント312件の盛り上がりで、コーディング性能やコスト、プライバシー、ベンチマーク比較などが議論されています。: このスレでは、ローカルLLMユーザーとしての感想や疑問を自由に交換しましょう。
-
名無しさんついに来たか!V4はコード生成がめちゃくちゃ良いって聞いてたから楽しみ。
-
名無しさんFlash版とNon-Flash版の違いって何?推論速度以外に何かあるの?
-
名無しさんまた誇大広告じゃない?V3の時も最初は騒がれてたけど実際は期待はずれだったし。
-
名無しさんでもライセンスはMITらしいし、商用利用もOKでしょ?そこは評価できる。
-
名無しさんRTX 3090で動かしてみたけど、Flash版は量子化なしでもまあまあ速い。18BパラメータだからVRAM12GBくらいで行ける。
-
名無しさんQwen2.5 32Bと比べてどうなん?コーディングならDeepseekの方が上って聞くけど。
-
名無しさんFlash版ってvLLMとかで使う用?それとも普通にOllamaでも動く?
-
名無しさんFlash版は推論最適化されてるから、vLLM向けかもしれないけど、Ollamaでもgguf化すれば使えるよ。Non-Flashの方が変換しやすいかも。
-
名無しさんなるほど、とりあえずNon-Flashを試してみるわ。ありがとう。
-
-
-
名無しさん実際にコード書かせてみたけど、Pythonのリファクタリングはかなり正確。ただし日本語のコメントはちょっと怪しいかも。
-
名無しさんAPI使うならDeepseekの公式が安いけど、ローカルで動かすと電気代が…。でもプライバシー面ではローカルに勝るものなし。
-
名無しさん確かに。機密コード扱うならローカル一択だよね。コストはトレードオフだけど。
-
-
名無しさんオープンLLMの進化が速すぎる。半年後には何が出てるんだろうな。
-
名無しさんベンチマーク見た?HumanEvalとMBPPでかなり高いスコア出してるけど、実用的なタスクでの性能はどうなんだろう?
-
名無しさんベンチマークは参考程度でいいと思う。実際にプロジェクトで使ってみないとわかんないな。ただ、コミュニティの反応を見てると期待できそう。
-
-
名無しさんとりあえずダウンロードして試す価値はあるね。みんなの感想聞けて助かった。
-
-
投稿者投稿
16件の返信を表示中(うち親返信12件)
関連するAIトピック
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2025年6月26日 17:23
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2025年6月26日 13:56
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2025年6月26日 15:37
- DeepSeek R1-0528のシステムプロンプトがリークされたらしい16件の返信最終更新 2025年6月25日 12:50
- AIと人間の見分けがつくか? – DeepSeek新バージョンを追加したゲームの話題18件の返信最終更新 2025年6月25日 10:56