DeepSeek v3.1のベンチマークについて議論しよう

このトピックには19件の返信、6人の参加者があり、最後に名無しさんにより9ヶ月、 1週前に更新されました。

19件の返信を表示中（うち親返信7件）

投稿者

投稿
- 2025年9月17日 9:18 AM #75646 返信
  
  名無しさん
  
  Redditのr/LocalLLaMAで「DeepSeek v3.1をベンチマークした人いる？」という投稿が話題になっていました。パフォーマンスやコスト、プライバシー面での比較が行われています。URL:
- 2025年9月17日 9:19 AM #75647 返信
  
  名無しさん
  
  自分も気になってた。V2.5からどのくらい改善されてるんだろう？
  - 2025年9月17日 9:22 AM #75648 返信
    
    名無しさん
    
    V3.1はコード生成がかなり良くなったって聞いたけど、ベンチマーク見ないとね。
- 2025年9月17日 9:27 AM #75649 返信
  
  名無しさん
  
  とりあえずMMLUやHumanEvalのスコアを他のモデルと比較したい。
  - 2025年9月17日 9:34 AM #75650 返信
    
    名無しさん
    
    Redditのスレだと、Llama 3.1 70Bと同等くらいって意見があったよ。
    - 2025年9月17日 9:36 AM #75651 返信
      
      名無しさん
      
      でもパラメータ数が違うから単純比較はできないよね。
- 2025年9月17日 9:39 AM #75652 返信
  
  名無しさん
  
  ローカルで動かすには量子化が必須。Q4_K_Mでどのくらい精度落ちるのか試したい。
  - 2025年9月17日 9:45 AM #75653 返信
    
    名無しさん
    
    自分はRTX 4090でQ8だとVRAM足りなくて、Q4にしたら結構劣化した。
    - 2025年9月17日 9:54 AM #75654 返信
      
      名無しさん
      
      そうなんだ…やっぱりQ8以上じゃないと実用的じゃないかも。
- 2025年9月17日 9:56 AM #75655 返信
  
  名無しさん
  
  API使うならコスト面も気になる。DeepSeekのAPIは安いけど、レスポンス遅くない？
  - 2025年9月17日 9:58 AM #75656 返信
    
    名無しさん
    
    確かにたまに遅い。でも課金制だから無料枠で試すのがおすすめ。
- 2025年9月17日 10:02 AM #75657 返信
  
  名無しさん
  
  プライバシー重視ならローカル一択。だけどV3.1はライセンス大丈夫なの？
  - 2025年9月17日 10:09 AM #75658 返信
    
    名無しさん
    
    MITライセンスだったはず。商用利用もOKみたい。
    - 2025年9月17日 10:20 AM #75659 返信
      
      名無しさん
      
      それなら安心。でも中国のモデルってバイアスが心配。
      - 2025年9月17日 10:22 AM #75660 返信
        
        名無しさん
        
        その辺はLlamaと比較してもそこまで変わらないと思うけどね。
- 2025年9月17日 10:25 AM #75661 返信
  
  名無しさん
  
  ベンチマークより実際の使用感を教えてほしい。チャットとか文章要約はどう？
  - 2025年9月17日 10:30 AM #75662 返信
    
    名無しさん
    
    試しに使ってみたけど、日本語の精度はLlamaよりいいかも。
    - 2025年9月17日 10:37 AM #75663 返信
      
      名無しさん
      
      マジ？じゃあ試してみようかな。
- 2025年9月17日 10:39 AM #75664 返信
  
  名無しさん
  
  どなたか実際にベンチマーク取った方いらっしゃいますか？具体的な数字が知りたい。
  - 2025年9月17日 10:43 AM #75665 返信
    
    名無しさん
    
    自分はOpen LLM Leaderboardのスコアを見たけど、V3.1はまだ載ってなかった。
投稿者

投稿

19件の返信を表示中（うち親返信7件）

返信先: DeepSeek v3.1のベンチマークについて議論しよう

あなたの情報:

お名前 (必須)

メール (非公開) (必須):

ウェブサイト:

関連するAIトピック