- このトピックには25件の返信、8人の参加者があり、最後に名無しさんにより1年前に更新されました。
25件の返信を表示中(うち親返信8件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAでDeepSeek-R1-0528の知識カットオフについてのスレッドがありました。要約すると、このモデルの訓練データがいつまでなのかという質問に対して、回答は「2024年7月」という説と「2025年初頭」という説があり、議論が分かれています。実際に使ってみて新しい情報に弱いという声も。
-
名無しさん自分で試した感じでは2024年半ばくらいの知識っぽい。最近のイベントは全然答えられない。
-
名無しさん同じく、2024年7月以降のことは自信なさげ。カットオフはその辺りかも。
-
名無しさんでもコード生成に関しては最新のライブラリにも対応してるって話もあるよ。
-
-
-
名無しさん公式の発表ってあったっけ?DeepSeekのドキュメント見てもはっきりしない。
-
名無しさんないよね。コミュニティの推測ばかり。あてにならない。
-
-
名無しさんそもそもR1って色々バージョンあるから混乱する。0528って何?
-
名無しさんリリース日っぽいけど、モデル名に日付入れるのやめてほしい。
-
-
名無しさんローカルで動かすなら知識カットオフよりサイズと速度の方が気になる。
-
名無しさん確かに。でもカットオフ古いと実用性下がるよね。
-
名無しさん検索機能と組み合わせればカバーできるんじゃない?
-
名無しさんRAG使うのが現実的。カットオフ自体は大した問題じゃない。
-
-
-
-
名無しさんベンチマークでの性能はどうなんだろう。MMLUとか。
-
名無しさん多分、他のLLMより少し古いデータで訓練されてるから、新しいベンチでは不利。
-
名無しさんでもコーディング系は強いって聞く。競プロとか。
-
-
-
名無しさんプライバシー面でDeepSeekはどうなんだろう。中国企業だし。
-
名無しさんローカルで動かせば問題ない。API使うなら気にするべき。
-
名無しさんでもモデル自体に何か仕込まれてたら終わりでしょ。
-
名無しさんそれはOSSならコード見れば分かる。DeepSeekは結構透明性高い方。
-
名無しさんそうかな?完全に信用はできないけど。
-
-
-
-
名無しさんコストパフォーマンスで言えばDeepSeekは良い選択。GPTより安い。
-
名無しさんでも知識カットオフが新しいClaudeとかの方が好き。
-
名無しさん用途次第。最新情報いらないならDeepSeekで十分。
-
-
-
名無しさん結局、訓練データの日付が正確に分からないのがもどかしい。
-
名無しさんRedditのスレでも結論出てなかったしね。各自で判断するしか。
-
名無しさんまあ、新しいモデル待つか。DeepSeekもすぐ次出すでしょ。
-
-
-
-
投稿者投稿
25件の返信を表示中(うち親返信8件)
関連するAIトピック
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2025年6月26日 17:23
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2025年6月26日 13:56
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2025年6月26日 15:37
- DeepSeek R1-0528のシステムプロンプトがリークされたらしい16件の返信最終更新 2025年6月25日 12:50
- AIと人間の見分けがつくか? – DeepSeek新バージョンを追加したゲームの話題18件の返信最終更新 2025年6月25日 10:56