DeepSeek V3.2 Speciale：大学院レベルの問題は解けるのに、高校代数でつまずくってどういうこと？

名無しさん · 2025-05-05T15:38:22+09:00

Redditのr/LocalLLaMAで話題になっているDeepSeek V3.2 Specialeの話です。このモデル、大学院レベルの難しい問題は解けるのに、なぜか高校の代数でミスをするという報告がありました。ローカルLLMユーザーの間でも「ベンチマークの限界か？」「訓練データの偏りでは？」と議論になっています。みなさんのご意見をどうぞ。

このトピックには14件の返信、4人の参加者があり、最後に名無しさんにより1年、 1ヶ月前に更新されました。

14件の返信を表示中（うち親返信7件）

投稿者

投稿
- 2025年5月5日 3:38 PM #73768 返信
  
  名無しさん
  
  Redditのr/LocalLLaMAで話題になっているDeepSeek V3.2 Specialeの話です。このモデル、大学院レベルの難しい問題は解けるのに、なぜか高校の代数でミスをするという報告がありました。
  ローカルLLMユーザーの間でも「ベンチマークの限界か？」「訓練データの偏りでは？」と議論になっています。みなさんのご意見をどうぞ。
- 2025年5月5日 3:39 PM #73769 返信
  
  名無しさん
  
  これあるあるだよね。LLMって特定のパターンには強いけど、基礎的な論理で抜けがある。
  - 2025年5月5日 3:47 PM #73771 返信
    
    名無しさん
    
    そうそう、訓練データに論文が多いから、そういう問題は得意だけど、中学数学みたいなのは苦手なんだろうな。
- 2025年5月5日 3:42 PM #73770 返信
  
  名無しさん
  
  むしろ大学院レベルが解けるってすごくない？高校代数は単純な計算ミスみたいなものかも。
  - 2025年5月5日 3:56 PM #73773 返信
    
    名無しさん
    
    でも「Special版」って謳ってるのに、基本ができてないのはちょっと…。
- 2025年5月5日 3:54 PM #73772 返信
  
  名無しさん
  
  ベンチマークの選び方にも問題あるよね。実際のユースケースではもっとバランスが大事。
  - 2025年5月5日 3:59 PM #73774 返信
    
    名無しさん
    
    そう、MATHとかGSM8Kはある程度できるけど、自由形式の代数問題は別問題らしい。
- 2025年5月5日 4:05 PM #73775 返信
  
  名無しさん
  
  ローカルで動かすには重すぎるし、コスパも微妙って話もあるね。
  - 2025年5月5日 4:14 PM #73776 返信
    
    名無しさん
    
    でもDeepSeekはAPI安いから、そこは評価できる。プライバシー気にする人はローカル一択だけど。
- 2025年5月5日 4:16 PM #73777 返信
  
  名無しさん
  
  高校代数でつまずくって、もしかしてプロンプトが悪いだけじゃない？
  - 2025年5月5日 4:18 PM #73778 返信
    
    名無しさん
    
    それもあるかも。でもRedditの人はいろいろ試してダメだったって言ってたよ。
- 2025年5月5日 4:22 PM #73779 返信
  
  名無しさん
  
  こういう報告って結構あるから、AIの「賢さ」ってまだまだ不完全だなと思う。
  - 2025年5月5日 4:29 PM #73780 返信
    
    名無しさん
    
    同感。特にコーディング系だと、ライブラリの使い方は完璧なのに、簡単なループでミスったりする。
- 2025年5月5日 4:40 PM #73781 返信
  
  名無しさん
  
  まあ、人間も同じようなことあるしね。専門バカみたいなものか。
  - 2025年5月5日 4:42 PM #73782 返信
    
    名無しさん
    
    それにしても、DeepSeekは中国のモデルだから、データセットに偏りがある可能性も否めない。
投稿者

投稿

14件の返信を表示中（うち親返信7件）

返信先: DeepSeek V3.2 Speciale：大学院レベルの問題は解けるのに、高校代数でつまずくってどういうこと？で#73777に返信

あなたの情報:

お名前 (必須)

メール (非公開) (必須):

ウェブサイト:

キャンセル

関連するAIトピック