- このトピックには26件の返信、8人の参加者があり、最後に名無しさんにより7ヶ月前に更新されました。
26件の返信を表示中(うち親返信13件)
-
投稿者投稿
-
-
名無しさんReddit r/LocalLLaMAで話題のDeepSeek新モデル、当初1Mコンテキストと言われていたけど実は3.2Mかもしれないという投稿がありました。
ローカルLLMユーザーとしてはコンテキスト長の拡大は嬉しいけど、メモリ消費や速度が気になりますね。皆さんはどう思いますか? -
名無しさん3.2Mってすごいな。でもローカルだとGPUメモリが足りなさそう。
-
名無しさん今の4090でも24GBじゃ厳しいだろうね。量子化すればいけるか?
-
-
名無しさん本当ならコード補完に使いたい。長いプロジェクト全体を入れられるかも。
-
名無しさんDeepSeekは中国のモデルだから、やっぱりデータ収集が気になる。
-
名無しさんローカルで動かせば問題ないでしょ。オープンソースだし。
-
-
名無しさんRedditではベンチマーク結果が賛否両論だったな。実際の性能はどうなんだろう。
-
名無しさんリーダーボードでは上位だけど、実用的なタスクだと微妙って声もあるよ。
-
-
名無しさんコンテキスト長だけじゃなくて、推論コストも下がってるといいな。
-
名無しさん確かに。APIの価格次第では業務でも使える。
-
-
名無しさん3.2Mって検索拡張(RAG)いらなくなるレベルじゃない?
-
名無しさんいや、それでも検索は必要だよ。全部の情報をコンテキストに入れるのは非効率。
-
-
名無しさんこれってDeepSeek-V3の後継?それとも別物?
-
名無しさんおそらくR1系統の派生モデルじゃないかな。詳細まだ不明。
-
-
名無しさんとにかくベンチマークの数字だけじゃなくて、自分の使い方で試したい。
-
名無しさんOllamaで早く動かせるようにならないかな。
-
-
名無しさんcontextの長さだけで優劣決めるのは危険。精度が落ちるかもしれない。
-
名無しさんその通り。長ければいいってもんじゃない。Lost in the middle問題は解決されてるの?
-
名無しさんそこが一番気になる。論文ではどうなってるんだろう。
-
-
-
名無しさん中国の規制に引っかからなければいいけど。
-
名無しさんオープンソースだからこそ、自分でチェックできる。
-
-
名無しさんしかし3.2Mって聞くと、Llama 3.1 405Bの128Kが小さく感じるな。
-
名無しさんでも405Bはパラメータ数が桁違い。コンテキスト長だけ比較してもね。
-
-
名無しさん個人的には1Mでも十分すぎる。3.2Mって誰が使うんだ?
-
名無しさんコード生成や法律文書分析には役立つかも。
-
-
名無しさんとにかく実際にリリースされてから評価しよう。今は噂段階だし。
-
名無しさん楽しみだけど、過度な期待は禁物だね。
-
-
-
投稿者投稿
26件の返信を表示中(うち親返信13件)
関連するAIトピック
- DeepSeek-R1-0528の蒸留版、Devstral、必要だと思う?24件の返信最終更新 2026年2月10日 07:21
- DeepSeek R1-0528-Qwen3-8Bが無限ツールループに陥る問題、対処法ある?20件の返信最終更新 2026年2月10日 12:32
- DeepSeek-R1-0528のQwen3 8Bへの蒸留モデル、実際どうなの?14件の返信最終更新 2026年2月10日 04:36
- DeepSeek R1-0528のシステムプロンプトがリークされたらしい16件の返信最終更新 2026年2月10日 16:11
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2026年2月11日 20:44