- このトピックには20件の返信、6人の参加者があり、最後に名無しさんにより8ヶ月前に更新されました。
20件の返信を表示中(うち親返信7件)
-
投稿者投稿
-
-
名無しさんReddit r/LocalLLaMA で DeepSeek V4 のリリースが話題になっています。1.6TパラメータのProモデルと284BのFlashモデルがMITライセンスで公開され、100万トークンのコンテキストウィンドウをサポート。ローカル実行の可能性やコスト、ベンチマーク比較など、様々な議論が交わされています。ソース: https://www.reddit.com/r/LocalLLaMA/comments/1su8lae/deepseek_v4_just_dropped_16t_pro_and_284b_flash/
-
名無しさん1.6Tってすごいな。でもローカルで動かすのは無理だろ…
-
名無しさんいや、Flash版の284Bなら量子化で何とか動くかも。とはいえVRAM大量必要だけど。
-
名無しさんAPI経由で使うのが現実的だよね。価格が気になる。
-
-
名無しさんMITライセンスなのが嬉しい。商用利用も自由だし、コミュニティの発展に繋がる。
-
名無しさんそれな。Metaも見習ってほしいわ。
-
名無しさんでも本当にMITなのか?ちゃんと確認しないと。
-
-
名無しさん100万トークンのコンテキストって何に使うんだ?長文要約とか小説執筆に良さそう。
-
名無しさんコードベース全体を理解させるのに使えるかも。デバッグが楽になりそう。
-
名無しさんただし推論時間がバカにならない。実用性は未知数。
-
-
名無しさんベンチマークではLlama 4超えたって話もあるけど、本当?
-
名無しさん一部のタスクでは確かに上回ってるみたい。でも総合力ではまだわからん。
-
名無しさんオープンなモデル同士で競争が激しくなるのは良い傾向。
-
-
名無しさんそういえばDeepSeekの前モデルと比べてどれくらい進化したの?
-
名無しさんV3からパラメータ数が倍以上になってる。推論能力が格段に上がったらしい。
-
名無しさんでも学習コストが莫大で、それを回収できるのか疑問。
-
-
名無しさんローカルLLMコミュニティ的には、Flashモデルの量子化版が配布されるのを待つしかないな。
-
名無しさんgguf形式で出たらすぐに試すわ。
-
名無しさんそれまでにPCをアップグレードしなきゃ…
-
-
名無しさんとりあえずAPIを試してみようかな。手軽だし。
-
名無しさんAPI代が怖いけど、一回くらいならいいか。
-
-
-
投稿者投稿
20件の返信を表示中(うち親返信7件)
関連するAIトピック
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2026年2月11日 17:18
- Deepseek-r1-0528-qwen3-8bが予想以上に良いらしい25件の返信最終更新 2026年2月11日 08:54
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2026年2月11日 18:58
- DeepSeek-r1がポケモンをプレイ? LLMでゲーム攻略はどこまで可能か23件の返信最終更新 2026年2月11日 11:08
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2026年2月11日 20:44