- このトピックには25件の返信、8人の参加者があり、最後に名無しさんにより8ヶ月、 2週前に更新されました。
25件の返信を表示中(うち親返信12件)
-
投稿者投稿
-
-
名無しさんDeepSeek V4が100万トークンのコンテキストをサポートしたという話題がRedditで盛り上がっています。実際にローカルで動かすにはメモリが何TB必要になるのか、コスト面ではどうか、また100万トークンも使うユースケースがあるのかなど、様々な意見が飛び交っています。URL:
-
名無しさん100万トークンって実際どれくらいの文章量なんだろう?
-
名無しさんざっくり言うと『ハリー・ポッター』シリーズ全巻分くらいらしい。
-
-
名無しさんそんな長いコンテキスト、誰が使うんだよ。
-
名無しさんでもメモリ消費がやばそう。GPUメモリ64GBじゃ足りないと思う。
-
-
名無しさんコードベース全体を読ませるとか、長編小説の解析とか?
-
名無しさんDeepSeek V4ってオープンなの?
-
名無しさん多分オープンウェイトだけど、そんな大規模モデルを動かせる環境は限られるよ。
-
-
名無しさんベンチマークでMQAとかでどれだけ差が出るのか気になる。
-
名無しさん100万トークンクラスのベンチマークってまだ少ないし、過学習してる可能性も。
-
-
名無しさん個人的にはローカルで動かせないと意味ないと思う。
-
名無しさんクラウドAPIでもいいけど、レイテンシとコストがなあ。
-
名無しさん100万トークンの推論APIって1回数千円とかじゃない?
-
-
-
名無しさんだからこそ蒸留モデルとか小規模版に期待したい。
-
名無しさんしかし、Attentionの計算量O(L^2)が現実的にどうなるか。Linear Attentionとか使ってるのかな。
-
名無しさん多分何かしらの近似手法は入ってると思う。
-
-
名無しさん実際の使われ方としては、まるごと法律文書とか契約書を突っ込む用途かな。
-
名無しさんでも精度が落ちたら意味ないし、検証が大変そう。
-
-
名無しさんRedditのスレでは「メモリ使用量がバカにならない」って意見が多かった。
-
名無しさん実際、100万トークンで推論するにはH100 8枚でもきついとか。
-
名無しさんじゃあ現実的には研究用途オンリーだな。
-
-
-
名無しさんDeepSeekは中国の会社だし、データのプライバシー面でも懸念。
-
名無しさんローカルで動かすなら関係ないけど、APIはちょっと使いたくない。
-
名無しさんまあ、とにかく興味深い技術ではある。
-
-
-
名無しさん100万コンテキストが標準になるのはまだまだ先だと思う。
-
名無しさんそれでも技術の進歩はすごいね。数年後には当たり前になってたりして。
-
-
-
投稿者投稿
25件の返信を表示中(うち親返信12件)
関連するAIトピック
- ChatGPTを使いこなすコツ・便利な使い方を共有しよう0件の返信最終更新 2025年3月16日 18:46
- 【AI】2026年の生成AI、結局どこ見れば面白い?39件の返信最終更新 2025年3月17日 16:11
- ECCV 2022のレビューについて議論しよう21件の返信最終更新 2025年4月7日 07:48
- ECCV 2022 採択論文リストが公開されましたね27件の返信最終更新 2025年4月12日 20:48
- DeepSeekの評価額450億ドル近く、中国「Big Fund」が投資交渉 – ローカルLLMへの影響は?14件の返信最終更新 2025年10月11日 08:34