DeepSeekの数学・PythonベンチマークとローカルLLMの運用について

掲示板 フォーラム AI DeepSeekの数学・PythonベンチマークとローカルLLMの運用について

  • このトピックには20件の返信、6人の参加者があり、最後に名無しさんにより1年、 2ヶ月前に更新されました。
20件の返信を表示中(うち親返信7件)
  • 投稿者
    投稿
    • #68248 返信
      名無しさん
      Redditのr/LocalLLaMAから、DeepSeek関連のスレッド「Awake Erdős – DeepSeek Challanges S.Szmy – (Math & Python & AI) – (AESR_Suite.py)」を紹介します。このスレッドでは、DeepSeekモデルを使った数学やPythonのベンチマーク、ローカルLLMの運用コストやプライバシー面の議論が行われていました。DeepSeekは軽量でコスト効率が高いと評価される一方、性能やベンチマークの解釈については意見が分かれていました。

    • #68249 返信
      名無しさん
      DeepSeekって確かに安いけど、ベンチマークだけじゃ実用性が見えないな。

      • #68251 返信
        名無しさん
        でも数学のベンチマークって結構トリッキーだから、結果をそのまま信じるのは危険。

        • #68254 返信
          名無しさん
          ベンチマークは参考程度にして、自分のタスクで試すのが一番だと思う。

      • #68260 返信
        名無しさん
        そうそう。ベンチマークスコアが高くても、実際のタスクで使えないと意味ない。

    • #68250 返信
      名無しさん
      ローカルで動かすならDeepSeekは選択肢に入るよね。VRAM少なくて済むし。

      • #68253 返信
        名無しさん
        確かに。でもコード生成の品質はどうなの?Pythonなら結構使えるって聞くけど。

        • #68259 返信
          名無しさん
          Pythonのコード生成なら、自分はLlamaでも十分だけど、DeepSeekはちょっとしたスクリプトに便利。

      • #68262 返信
        名無しさん
        VRAM4GBでも動くってのが魅力。古いGPUでも試せる。

    • #68252 返信
      名無しさん
      AESR_Suite.pyって自作ベンチマーク?見てみたいけど429エラーで見れなかった。

      • #68256 返信
        名無しさん
        コードは公開されてるから自分で確認できるはず。でもレート制限きついね。

    • #68255 返信
      名無しさん
      DeepSeekは中国製ってのが気になる。プライバシー的に大丈夫?

      • #68257 返信
        名無しさん
        ローカルで動かすなら関係ないけど、API使うなら考えるべきかも。

      • #68264 返信
        名無しさん
        中国製でもオープンならしゃーない。でもライセンス周りは注意。

    • #68258 返信
      名無しさん
      数学の問題を解かせるならChain-of-Thought必須だな。DeepSeekはどうなんだろ。

      • #68261 返信
        名無しさん
        CoTプロンプトをちゃんと設計すれば、小さなモデルでも結構いい結果出るよ。

    • #68263 返信
      名無しさん
      競合のQwenやLlamaと比べてどうなんだろう?コスト面以外で優位性ある?

      • #68265 返信
        名無しさん
        日本語の性能で言うと、DeepSeekはまだ改善の余地あり。他モデルの方が自然。

        • #68267 返信
          名無しさん
          確かに日本語だとLlamaの方がしっくりくる。でもDeepSeekはコスト対効果で勝負。

    • #68266 返信
      名無しさん
      ベンチマークの内容が気になる。数学とPythonだけなら、他のドメイン弱いのか?

      • #68268 返信
        名無しさん
        汎用性ならLlama、特化ならDeepSeekって感じか。使い分けが大事。

20件の返信を表示中(うち親返信7件)
返信先: DeepSeekの数学・PythonベンチマークとローカルLLMの運用についてで#68264に返信
あなたの情報:




AA
tchmii
タイトルとURLをコピーしました