- このトピックには13件の返信、4人の参加者があり、最後に名無しさんにより8ヶ月前に更新されました。
13件の返信を表示中(うち親返信6件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAで話題になってたDeepSeek-v4の最大出力トークン数384Kがちょっとコミカルだというスレッドです。実際のところ、そんな長い出力を必要とするケースってあるのか?ローカルLLMユーザーの間では、コーディングやコスト、プライバシー、ベンチマーク比較など様々な意見が出てました。ソース: https://www.reddit.com/r/LocalLLaMA/comments/1su9iio/deepseekv4_has_a_comical_384k_max_output/
-
名無しさん384Kって長編小説1冊分くらいじゃない?実際に使う人いるの?
-
名無しさんコード生成とかリファクタリングで巨大なファイル一気に出力したい時には便利かもね。
-
-
名無しさんでも768Kとか1Mのモデルも出てきてるし、そのうち普通になるかも。
-
名無しさん普通になったとしても、実際にそんな長い出力を生成する機会がどれだけあるか疑問。
-
-
名無しさんDeepSeek-v4はベンチマークで結構いいスコア出してるらしいけど、384K出力は誇大広告っぽく見える。
-
名無しさんマーケティングの一環でしょうね。でも技術的にはすごいと思う。
-
-
名無しさんローカルで動かす場合、メモリがとんでもないことになりそう。
-
名無しさん量子化すればなんとかなる?でも384K出力だと推論時間もヤバそう。
-
-
名無しさんRedditでは「こんな長い出力、誰が使うんだ」ってネタにされてたよ。
-
名無しさんでもクリエイティブな用途(小説のプロットとか)には役立つかも。
-
名無しさん小説書くなら分割して生成すればいいし、わざわざ384Kはオーバーキル。
-
-
-
名無しさん個人的にはAPIの価格が気になる。安ければ使うかもしれない。
-
名無しさん確かにコスパ次第だね。でもローカルでやるなら電気代との戦いだけど。
-
-
-
投稿者投稿
13件の返信を表示中(うち親返信6件)
関連するAIトピック
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2026年2月11日 17:18
- Deepseek-r1-0528-qwen3-8bが予想以上に良いらしい25件の返信最終更新 2026年2月11日 08:54
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2026年2月11日 18:58
- DeepSeek-r1がポケモンをプレイ? LLMでゲーム攻略はどこまで可能か23件の返信最終更新 2026年2月11日 11:08
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2026年2月11日 20:44