- このトピックには20件の返信、6人の参加者があり、最後に名無しさんにより8ヶ月前に更新されました。
20件の返信を表示中(うち親返信7件)
-
投稿者投稿
-
-
名無しさんReddit r/LocalLLaMA で DeepSeek V4 のリリースが話題になっています。1.6TパラメータのProモデルと284BのFlashモデルがMITライセンスで公開され、100万トークンのコンテキストウィンドウをサポート。ローカル実行の可能性やコスト、ベンチマーク比較など、様々な議論が交わされています。
-
名無しさん1.6Tってすごいな。でもローカルで動かすのは無理だろ…
-
名無しさんいや、Flash版の284Bなら量子化で何とか動くかも。とはいえVRAM大量必要だけど。
-
名無しさんAPI経由で使うのが現実的だよね。価格が気になる。
-
-
名無しさんMITライセンスなのが嬉しい。商用利用も自由だし、コミュニティの発展に繋がる。
-
名無しさんそれな。Metaも見習ってほしいわ。
-
名無しさんでも本当にMITなのか?ちゃんと確認しないと。
-
-
名無しさん100万トークンのコンテキストって何に使うんだ?長文要約とか小説執筆に良さそう。
-
名無しさんコードベース全体を理解させるのに使えるかも。デバッグが楽になりそう。
-
名無しさんただし推論時間がバカにならない。実用性は未知数。
-
-
名無しさんベンチマークではLlama 4超えたって話もあるけど、本当?
-
名無しさん一部のタスクでは確かに上回ってるみたい。でも総合力ではまだわからん。
-
名無しさんオープンなモデル同士で競争が激しくなるのは良い傾向。
-
-
名無しさんそういえばDeepSeekの前モデルと比べてどれくらい進化したの?
-
名無しさんV3からパラメータ数が倍以上になってる。推論能力が格段に上がったらしい。
-
名無しさんでも学習コストが莫大で、それを回収できるのか疑問。
-
-
名無しさんローカルLLMコミュニティ的には、Flashモデルの量子化版が配布されるのを待つしかないな。
-
名無しさんgguf形式で出たらすぐに試すわ。
-
名無しさんそれまでにPCをアップグレードしなきゃ…
-
-
名無しさんとりあえずAPIを試してみようかな。手軽だし。
-
名無しさんAPI代が怖いけど、一回くらいならいいか。
-
-
-
投稿者投稿
20件の返信を表示中(うち親返信7件)
関連するAIトピック
- DeepSeek-R1-0528の蒸留版、Devstral、必要だと思う?24件の返信最終更新 2026年2月10日 07:21
- DeepSeek R1-0528-Qwen3-8Bが無限ツールループに陥る問題、対処法ある?20件の返信最終更新 2026年2月10日 12:32
- DeepSeek-R1-0528のQwen3 8Bへの蒸留モデル、実際どうなの?14件の返信最終更新 2026年2月10日 04:36
- DeepSeek R1-0528のシステムプロンプトがリークされたらしい16件の返信最終更新 2026年2月10日 16:11
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2026年2月11日 20:44