- このトピックには26件の返信、8人の参加者があり、最後に名無しさんにより7ヶ月前に更新されました。
26件の返信を表示中(うち親返信13件)
-
投稿者投稿
-
-
名無しさん話題のDeepSeek新モデル、当初1Mコンテキストと言われていたけど実は3.2Mかもしれないという投稿がありました。
ローカルLLMユーザーとしてはコンテキスト長の拡大は嬉しいけど、メモリ消費や速度が気になりますね。皆さんはどう思いますか? -
名無しさん3.2Mってすごいな。でもローカルだとGPUメモリが足りなさそう。
-
名無しさん今の4090でも24GBじゃ厳しいだろうね。量子化すればいけるか?
-
-
名無しさん本当ならコード補完に使いたい。長いプロジェクト全体を入れられるかも。
-
名無しさんDeepSeekは中国のモデルだから、やっぱりデータ収集が気になる。
-
名無しさんローカルで動かせば問題ないでしょ。オープンだし。
-
-
名無しさんRedditではベンチマーク結果が賛否両論だったな。実際の性能はどうなんだろう。
-
名無しさんリーダーボードでは上位だけど、実用的なタスクだと微妙って声もあるよ。
-
-
名無しさんコンテキスト長だけじゃなくて、推論コストも下がってるといいな。
-
名無しさん確かに。APIの価格次第では業務でも使える。
-
-
名無しさん3.2Mって検索拡張(RAG)いらなくなるレベルじゃない?
-
名無しさんいや、それでも検索は必要だよ。全部の情報をコンテキストに入れるのは非効率。
-
-
名無しさんこれってDeepSeek-V3の後継?それとも別物?
-
名無しさんおそらくR1系統の派生モデルじゃないかな。詳細まだ不明。
-
-
名無しさんとにかくベンチマークの数字だけじゃなくて、自分の使い方で試したい。
-
名無しさんOllamaで早く動かせるようにならないかな。
-
-
名無しさんcontextの長さだけで優劣決めるのは危険。精度が落ちるかもしれない。
-
名無しさんその通り。長ければいいってもんじゃない。Lost in the middle問題は解決されてるの?
-
名無しさんそこが一番気になる。論文ではどうなってるんだろう。
-
-
-
名無しさん中国の規制に引っかからなければいいけど。
-
名無しさんオープンだからこそ、自分でチェックできる。
-
-
名無しさんしかし3.2Mって聞くと、Llama 3.1 405Bの128Kが小さく感じるな。
-
名無しさんでも405Bはパラメータ数が桁違い。コンテキスト長だけ比較してもね。
-
-
名無しさん個人的には1Mでも十分すぎる。3.2Mって誰が使うんだ?
-
名無しさんコード生成や法律文書分析には役立つかも。
-
-
名無しさんとにかく実際にリリースされてから評価しよう。今は噂段階だし。
-
名無しさん楽しみだけど、過度な期待は禁物だね。
-
-
-
投稿者投稿
26件の返信を表示中(うち親返信13件)
関連するAIトピック
- 【学術研究】Windowsユーザー向けLLMパフォーマンステスト参加者募集(ChatGPT・Gemini・DeepSeek)13件の返信最終更新 2025年8月6日 04:51
- DeepSeek Coder v2 vs Qwen 3.0 Coder 30B どっちがコーディング向き?16件の返信最終更新 2025年8月7日 03:07
- OpenClaw Skill: 中国語LLMルーターで20以上のAIモデル(DeepSeek, Qwen, Kimi, Doubao)に自動フォールバ…21件の返信最終更新 2025年8月5日 12:06
- DeepSeekプロキシテスト – 試してる人いる?26件の返信最終更新 2025年8月6日 21:52
- DeepSeekやQwenのコード生成モデルをセルフホストしてる人いる?無制限利用のために19件の返信最終更新 2025年8月6日 18:02