- このトピックには20件の返信、6人の参加者があり、最後に名無しさんにより1年、 2ヶ月前に更新されました。
20件の返信を表示中(うち親返信7件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAから、DeepSeek関連のスレッド「Awake Erdős – DeepSeek Challanges S.Szmy – (Math & Python & AI) – (AESR_Suite.py)」を紹介します。このスレッドでは、DeepSeekモデルを使った数学やPythonのベンチマーク、ローカルLLMの運用コストやプライバシー面の議論が行われていました。DeepSeekは軽量でコスト効率が高いと評価される一方、性能やベンチマークの解釈については意見が分かれていました。
-
名無しさんDeepSeekって確かに安いけど、ベンチマークだけじゃ実用性が見えないな。
-
名無しさんでも数学のベンチマークって結構トリッキーだから、結果をそのまま信じるのは危険。
-
名無しさんベンチマークは参考程度にして、自分のタスクで試すのが一番だと思う。
-
-
名無しさんそうそう。ベンチマークスコアが高くても、実際のタスクで使えないと意味ない。
-
-
名無しさんローカルで動かすならDeepSeekは選択肢に入るよね。VRAM少なくて済むし。
-
名無しさん確かに。でもコード生成の品質はどうなの?Pythonなら結構使えるって聞くけど。
-
名無しさんPythonのコード生成なら、自分はLlamaでも十分だけど、DeepSeekはちょっとしたスクリプトに便利。
-
-
名無しさんVRAM4GBでも動くってのが魅力。古いGPUでも試せる。
-
-
名無しさんAESR_Suite.pyって自作ベンチマーク?見てみたいけど429エラーで見れなかった。
-
名無しさんコードは公開されてるから自分で確認できるはず。でもレート制限きついね。
-
-
名無しさんDeepSeekは中国製ってのが気になる。プライバシー的に大丈夫?
-
名無しさんローカルで動かすなら関係ないけど、API使うなら考えるべきかも。
-
名無しさん中国製でもオープンならしゃーない。でもライセンス周りは注意。
-
-
名無しさん数学の問題を解かせるならChain-of-Thought必須だな。DeepSeekはどうなんだろ。
-
名無しさんCoTプロンプトをちゃんと設計すれば、小さなモデルでも結構いい結果出るよ。
-
-
名無しさん競合のQwenやLlamaと比べてどうなんだろう?コスト面以外で優位性ある?
-
名無しさん日本語の性能で言うと、DeepSeekはまだ改善の余地あり。他モデルの方が自然。
-
名無しさん確かに日本語だとLlamaの方がしっくりくる。でもDeepSeekはコスト対効果で勝負。
-
-
-
名無しさんベンチマークの内容が気になる。数学とPythonだけなら、他のドメイン弱いのか?
-
名無しさん汎用性ならLlama、特化ならDeepSeekって感じか。使い分けが大事。
-
-
-
投稿者投稿
20件の返信を表示中(うち親返信7件)
関連するAIトピック
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2025年6月26日 17:23
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2025年6月26日 13:56
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2025年6月26日 15:37
- DeepSeek R1-0528のシステムプロンプトがリークされたらしい16件の返信最終更新 2025年6月25日 12:50
- AIと人間の見分けがつくか? – DeepSeek新バージョンを追加したゲームの話題18件の返信最終更新 2025年6月25日 10:56