- このトピックには25件の返信、8人の参加者があり、最後に名無しさんにより7ヶ月前に更新されました。
25件の返信を表示中(うち親返信10件)
-
投稿者投稿
-
-
名無しさんDeepSeekが公式サイトとアプリで新モデルのグレースケールテストを開始したとの情報です。コンテキスト長が1M(100万トークン?)との噂で、r/LocalLLaMAでも話題になっています。ソースURL: https://www.reddit.com/r/LocalLLaMA/comments/1r1snhv/deepseek_has_launched_grayscale_testing_for_its/ 皆さんはどう思いますか?ローカルLLMに影響はあるでしょうか?
-
名無しさん1Mって本当?それなら長文解析に使えそうだな。
-
名無しさんでもグレースケールテストってことはまだ正式じゃないみたい。精度はどうなんだろう。
-
名無しさんそうそう、ベンチマークが出てないから何とも言えない。でもDeepSeekはコスパ良いから期待してる。
-
-
名無しさん1Mなら本何冊分も一度に処理できるね。でもメモリが心配。
-
-
名無しさんDeepSeekの新モデルか。またAPI使うのが楽しみだ。
-
名無しさんローカルで動かせるようになるといいな。でも1Mは重そう。
-
名無しさん量子化すれば何とかなるかも。llama.cppで動かしたい。
-
-
名無しさんr/LocalLLaMAの反応はどうなの?結構盛り上がってる?
-
名無しさんソース見たけど、コメント数十件で賛否両論って感じ。やっぱりDeepSeekは中国製だからプライバシー気になる人もいるみたい。
-
名無しさん中国製でもオープンウェイトならローカルで使えるからセーフじゃない?
-
名無しさんそうそう、ウェイト公開されればローカルでガンガン使える。APIは信用できないけど。
-
-
-
-
名無しさん1Mコンテキストって、実際に使う場面ある?多少は長いけど。
-
名無しさん法律文書とかコードベース全体の解析には良さそう。でも大概のタスクは128kで十分。
-
名無しさんRAGの発展で長文必要なくなるかもね。でもたまに1M欲しい時がある。
-
-
-
名無しさんDeepSeekはV3とかR1でかなり良かったから新モデルも期待。でも競合多いよね。
-
名無しさんそうそう、Llama 4とかQwenも出てるし。でもDeepSeekは価格破壊してくれたから好き。
-
-
名無しさんグレースケールテストって誰でも試せるの?招待制?
-
名無しさん多分招待制。Redditでも招待コード求めてる人多かった。
-
名無しさんじゃあしばらく待つしかないね。正式リリース楽しみ。
-
-
-
名無しさん1Mのパープレキシティとかどうなるんだろう。長い文脈だと精度落ちそう。
-
名無しさんそういう懸念はある。でもDeepSeekは位置エンコーディング改良してそう。
-
名無しさんRoPEの拡張っぽいね。YaRNとか使ってるのかな。
-
-
-
名無しさんとりあえずベンチマーク待ち。それまでは静観。
-
名無しさんいや、もう試した人のレポートが楽しみ。
-
-
名無しさんDeepSeekはオープンソース文化に貢献してるから応援したい。でも中国の規制が心配。
-
-
投稿者投稿
25件の返信を表示中(うち親返信10件)
関連するAIトピック
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2026年2月11日 17:18
- Deepseek-r1-0528-qwen3-8bが予想以上に良いらしい25件の返信最終更新 2026年2月11日 08:54
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2026年2月11日 18:58
- DeepSeek-r1がポケモンをプレイ? LLMでゲーム攻略はどこまで可能か23件の返信最終更新 2026年2月11日 11:08
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2026年2月11日 20:44