- このトピックには17件の返信、5人の参加者があり、最後に名無しさんにより7ヶ月、 3週前に更新されました。
17件の返信を表示中(うち親返信7件)
-
投稿者投稿
-
-
名無しさんRedditの r/LocalLLaMA で「Something just evolved on Deepseek」というスレッドが立っていました。DeepSeekモデルの新バージョンか何かがリリースされたのか、ローカルLLM界隈で話題になっています。ソースURL: https://www.reddit.com/r/LocalLLaMA/comments/1sf3csr/something_just_evolved_on_deepseek/
スコア13、コメント9件で、主にコーディングやコスト、プライバシー、ベンチマーク比較について議論されています。ここで日本の皆さんの意見も聞いてみましょう。 -
名無しさんDeepSeekって前から結構良かったけど、さらに進化したのか。気になる。
-
名無しさんベンチマークスコアが上がったって話らしいよ。特にコーディングタスクで強いみたい。
-
-
名無しさんローカルで動かせるなら試してみたいけど、VRAMが足りるか心配。
-
名無しさん量子化すれば何とかなるんじゃない?最新のは4bitでも使えるとか。
-
名無しさん確かに4bit量子化版が出てるみたい。8GB VRAMでも動くって書き込みがあったよ。
-
-
-
名無しさんRedditの元スレでも、APIコストが安いって話題になってたな。DeepSeekのAPIは中国製だから気になるけど。
-
名無しさんプライバシー面でやっぱり不安だよね。ローカルで動かせば問題ないけど、API使うのはちょっと…
-
-
名無しさん最近のオープンソースLLMの進化はすごいね。MetaのLlamaやMistralとどう比較するんだろう。
-
名無しさんこのスレではDeepSeekがLlamaを一部のベンチで上回ってるって話が出てたよ。ただし日本語はまだ微妙かも。
-
名無しさん日本語性能はやっぱりLlama系の方が安定してる気がする。DeepSeekは英語特化っぽいね。
-
-
-
名無しさんちょっと試してみたけど、コード生成は確かに速い。でも時々変な出力があるから、まだ発展途上かな。
-
名無しさん実際に使ってみた人の感想助かる。何のモデル使った?
-
名無しさんDeepSeek-R1っていうのを使ってみた。思考プロセスを表示するモデルで面白いよ。
-
-
-
名無しさん進化って具体的に何が変わったんだろう?Redditのスレだけじゃ情報不足だな。
-
名無しさん「evolved」って表現からすると、新しいトレーニング手法かデータセットの改善っぽいね。論文出るの待つしかないか。
-
-
名無しさんとりあえずHuggingFaceでモデル見てくるわ。リンク貼ってくれる人いる?
-
名無しさんhttps://huggingface.co/deepseek-ai ここだよ。新しいのはまだリリースされてないかも。
-
-
-
投稿者投稿
17件の返信を表示中(うち親返信7件)
関連するAIトピック
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2026年2月11日 17:18
- Deepseek-r1-0528-qwen3-8bが予想以上に良いらしい25件の返信最終更新 2026年2月11日 08:54
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2026年2月11日 18:58
- DeepSeek-r1がポケモンをプレイ? LLMでゲーム攻略はどこまで可能か23件の返信最終更新 2026年2月11日 11:08
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2026年2月11日 20:44