- このトピックには25件の返信、8人の参加者があり、最後に名無しさんにより1年、 4ヶ月前に更新されました。
25件の返信を表示中(うち親返信12件)
-
投稿者投稿
-
-
名無しさんDeepSeek V4が100万トークンのコンテキストをサポートしたという話題がRedditで盛り上がっています。実際にローカルで動かすにはメモリが何TB必要になるのか、コスト面ではどうか、また100万トークンも使うユースケースがあるのかなど、様々な意見が飛び交っています。URL:
-
名無しさん100万トークンって実際どれくらいの文章量なんだろう?
-
名無しさんざっくり言うと『ハリー・ポッター』シリーズ全巻分くらいらしい。
-
-
名無しさんそんな長いコンテキスト、誰が使うんだよ。
-
名無しさんでもメモリ消費がやばそう。GPUメモリ64GBじゃ足りないと思う。
-
-
名無しさんコードベース全体を読ませるとか、長編小説の解析とか?
-
名無しさんDeepSeek V4ってオープンなの?
-
名無しさん多分オープンウェイトだけど、そんな大規模モデルを動かせる環境は限られるよ。
-
-
名無しさんベンチマークでMQAとかでどれだけ差が出るのか気になる。
-
名無しさん100万トークンクラスのベンチマークってまだ少ないし、過学習してる可能性も。
-
-
名無しさん個人的にはローカルで動かせないと意味ないと思う。
-
名無しさんクラウドAPIでもいいけど、レイテンシとコストがなあ。
-
名無しさん100万トークンの推論APIって1回数千円とかじゃない?
-
-
-
名無しさんだからこそ蒸留モデルとか小規模版に期待したい。
-
名無しさんしかし、Attentionの計算量O(L^2)が現実的にどうなるか。Linear Attentionとか使ってるのかな。
-
名無しさん多分何かしらの近似手法は入ってると思う。
-
-
名無しさん実際の使われ方としては、まるごと法律文書とか契約書を突っ込む用途かな。
-
名無しさんでも精度が落ちたら意味ないし、検証が大変そう。
-
-
名無しさんRedditのスレでは「メモリ使用量がバカにならない」って意見が多かった。
-
名無しさん実際、100万トークンで推論するにはH100 8枚でもきついとか。
-
名無しさんじゃあ現実的には研究用途オンリーだな。
-
-
-
名無しさんDeepSeekは中国の会社だし、データのプライバシー面でも懸念。
-
名無しさんローカルで動かすなら関係ないけど、APIはちょっと使いたくない。
-
名無しさんまあ、とにかく興味深い技術ではある。
-
-
-
名無しさん100万コンテキストが標準になるのはまだまだ先だと思う。
-
名無しさんそれでも技術の進歩はすごいね。数年後には当たり前になってたりして。
-
-
-
投稿者投稿
25件の返信を表示中(うち親返信12件)
関連するAIトピック
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2025年6月26日 17:23
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2025年6月26日 13:56
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2025年6月26日 15:37
- DeepSeek R1-0528のシステムプロンプトがリークされたらしい16件の返信最終更新 2025年6月25日 12:50
- AIと人間の見分けがつくか? – DeepSeek新バージョンを追加したゲームの話題18件の返信最終更新 2025年6月25日 10:56