- このトピックには20件の返信、6人の参加者があり、最後に名無しさんにより8ヶ月前に更新されました。
20件の返信を表示中(うち親返信7件)
-
投稿者投稿
-
-
名無しさんDeepSeek V4 のリリースが話題になっています。1.6TパラメータのProモデルと284BのFlashモデルがMITライセンスで公開され、100万トークンのコンテキストウィンドウをサポート。ローカル実行の可能性やコスト、ベンチマーク比較など、様々な議論が交わされています。
-
名無しさん1.6Tってすごいな。でもローカルで動かすのは無理だろ…
-
名無しさんいや、Flash版の284Bなら量子化で何とか動くかも。とはいえVRAM大量必要だけど。
-
名無しさんAPI経由で使うのが現実的だよね。価格が気になる。
-
-
名無しさんMITライセンスなのが嬉しい。商用利用も自由だし、コミュニティの発展に繋がる。
-
名無しさんそれな。Metaも見習ってほしいわ。
-
名無しさんでも本当にMITなのか?ちゃんと確認しないと。
-
-
名無しさん100万トークンのコンテキストって何に使うんだ?長文要約とか小説執筆に良さそう。
-
名無しさんコードベース全体を理解させるのに使えるかも。デバッグが楽になりそう。
-
名無しさんただし推論時間がバカにならない。実用性は未知数。
-
-
名無しさんベンチマークではLlama 4超えたって話もあるけど、本当?
-
名無しさん一部のタスクでは確かに上回ってるみたい。でも総合力ではまだわからん。
-
名無しさんオープンなモデル同士で競争が激しくなるのは良い傾向。
-
-
名無しさんそういえばDeepSeekの前モデルと比べてどれくらい進化したの?
-
名無しさんV3からパラメータ数が倍以上になってる。推論能力が格段に上がったらしい。
-
名無しさんでも学習コストが莫大で、それを回収できるのか疑問。
-
-
名無しさんローカルLLMコミュニティ的には、Flashモデルの量子化版が配布されるのを待つしかないな。
-
名無しさんgguf形式で出たらすぐに試すわ。
-
名無しさんそれまでにPCをアップグレードしなきゃ…
-
-
名無しさんとりあえずAPIを試してみようかな。手軽だし。
-
名無しさんAPI代が怖いけど、一回くらいならいいか。
-
-
-
投稿者投稿
20件の返信を表示中(うち親返信7件)
関連するAIトピック
- ChatGPTを使いこなすコツ・便利な使い方を共有しよう0件の返信最終更新 2025年3月16日 18:46
- 【AI】2026年の生成AI、結局どこ見れば面白い?39件の返信最終更新 2025年3月17日 16:11
- ECCV 2022のレビューについて議論しよう21件の返信最終更新 2025年4月7日 07:48
- ECCV 2022 採択論文リストが公開されましたね27件の返信最終更新 2025年4月12日 20:48
- DeepSeekの評価額450億ドル近く、中国「Big Fund」が投資交渉 – ローカルLLMへの影響は?14件の返信最終更新 2025年10月11日 08:34