DeepSeekの数学・PythonベンチマークとローカルLLMの運用について

名無しさん · 2025-03-30T16:25:50+09:00

Redditのr/LocalLLaMAから、DeepSeek関連のスレッド「Awake Erdős - DeepSeek Challanges S.Szmy - (Math & Python & AI) - (AESR_Suite.py)」を紹介します。このスレッドでは、DeepSeekモデルを使った数学やPythonのベンチマーク、ローカルLLMの運用コストやプライバシー面の議論が行われていました。DeepSeekは軽量でコスト効率が高いと評価される一方、性能やベンチマークの解釈については意見が分かれていました。

このトピックには20件の返信、6人の参加者があり、最後に名無しさんにより1年、 2ヶ月前に更新されました。

20件の返信を表示中（うち親返信7件）

投稿者

投稿
- 2025年3月30日 4:25 PM #68248 返信
  
  名無しさん
  
  Redditのr/LocalLLaMAから、DeepSeek関連のスレッド「Awake Erdős – DeepSeek Challanges S.Szmy – (Math & Python & AI) – (AESR_Suite.py)」を紹介します。このスレッドでは、DeepSeekモデルを使った数学やPythonのベンチマーク、ローカルLLMの運用コストやプライバシー面の議論が行われていました。DeepSeekは軽量でコスト効率が高いと評価される一方、性能やベンチマークの解釈については意見が分かれていました。
- 2025年3月30日 4:27 PM #68249 返信
  
  名無しさん
  
  DeepSeekって確かに安いけど、ベンチマークだけじゃ実用性が見えないな。
  - 2025年3月30日 4:34 PM #68251 返信
    
    名無しさん
    
    でも数学のベンチマークって結構トリッキーだから、結果をそのまま信じるのは危険。
    - 2025年3月30日 4:47 PM #68254 返信
      
      名無しさん
      
      ベンチマークは参考程度にして、自分のタスクで試すのが一番だと思う。
  - 2025年3月30日 5:16 PM #68260 返信
    
    名無しさん
    
    そうそう。ベンチマークスコアが高くても、実際のタスクで使えないと意味ない。
- 2025年3月30日 4:30 PM #68250 返信
  
  名無しさん
  
  ローカルで動かすならDeepSeekは選択肢に入るよね。VRAM少なくて済むし。
  - 2025年3月30日 4:43 PM #68253 返信
    
    名無しさん
    
    確かに。でもコード生成の品質はどうなの？Pythonなら結構使えるって聞くけど。
    - 2025年3月30日 5:10 PM #68259 返信
      
      名無しさん
      
      Pythonのコード生成なら、自分はLlamaでも十分だけど、DeepSeekはちょっとしたスクリプトに便利。
  - 2025年3月30日 5:30 PM #68262 返信
    
    名無しさん
    
    VRAM4GBでも動くってのが魅力。古いGPUでも試せる。
- 2025年3月30日 4:41 PM #68252 返信
  
  名無しさん
  
  AESR_Suite.pyって自作ベンチマーク？見てみたいけど429エラーで見れなかった。
  - 2025年3月30日 5:02 PM #68256 返信
    
    名無しさん
    
    コードは公開されてるから自分で確認できるはず。でもレート制限きついね。
- 2025年3月30日 4:53 PM #68255 返信
  
  名無しさん
  
  DeepSeekは中国製ってのが気になる。プライバシー的に大丈夫？
  - 2025年3月30日 5:03 PM #68257 返信
    
    名無しさん
    
    ローカルで動かすなら関係ないけど、API使うなら考えるべきかも。
  - 2025年3月30日 5:37 PM #68264 返信
    
    名無しさん
    
    中国製でもオープンならしゃーない。でもライセンス周りは注意。
- 2025年3月30日 5:06 PM #68258 返信
  
  名無しさん
  
  数学の問題を解かせるならChain-of-Thought必須だな。DeepSeekはどうなんだろ。
  - 2025年3月30日 5:28 PM #68261 返信
    
    名無しさん
    
    CoTプロンプトをちゃんと設計すれば、小さなモデルでも結構いい結果出るよ。
- 2025年3月30日 5:32 PM #68263 返信
  
  名無しさん
  
  競合のQwenやLlamaと比べてどうなんだろう？コスト面以外で優位性ある？
  - 2025年3月30日 5:45 PM #68265 返信
    
    名無しさん
    
    日本語の性能で言うと、DeepSeekはまだ改善の余地あり。他モデルの方が自然。
    - 2025年3月30日 5:51 PM #68267 返信
      
      名無しさん
      
      確かに日本語だとLlamaの方がしっくりくる。でもDeepSeekはコスト対効果で勝負。
- 2025年3月30日 5:47 PM #68266 返信
  
  名無しさん
  
  ベンチマークの内容が気になる。数学とPythonだけなら、他のドメイン弱いのか？
  - 2025年3月30日 5:56 PM #68268 返信
    
    名無しさん
    
    汎用性ならLlama、特化ならDeepSeekって感じか。使い分けが大事。
投稿者

投稿

20件の返信を表示中（うち親返信7件）

返信先: DeepSeekの数学・PythonベンチマークとローカルLLMの運用についてで#68249に返信

あなたの情報:

お名前 (必須)

メール (非公開) (必須):

ウェブサイト:

キャンセル

関連するAIトピック