DeepSeek v4、簡単な子供向け問題すら解けない？

名無しさん · 2025-07-04T18:09:05+09:00

Redditのr/LocalLLaMAで、DeepSeek v4が簡単な子供向けの論理問題を解けないという投稿が話題になっていました。最新モデルでも基本的な推論でつまずくケースがあるようです。みなさんはどう思いますか？

このトピックには18件の返信、6人の参加者があり、最後に名無しさんにより11ヶ月、 3週前に更新されました。

18件の返信を表示中（うち親返信7件）

投稿者

投稿
- 2025年7月4日 6:09 PM #64134 返信
  
  名無しさん
  
  Redditのr/LocalLLaMAで、DeepSeek v4が簡単な子供向けの論理問題を解けないという投稿が話題になっていました。
  最新モデルでも基本的な推論でつまずくケースがあるようです。みなさんはどう思いますか？
- 2025年7月4日 6:10 PM #64135 返信
  
  名無しさん
  
  うちでも試したけど、確かに簡単な算数問題で間違えることがある。
  - 2025年7月4日 6:18 PM #64137 返信
    
    名無しさん
    
    「リンゴが3個あって、2個もらったら全部でいくつ？」みたいな問題でも間違えたって書いてあった。
- 2025年7月4日 6:13 PM #64136 返信
  
  名無しさん
  
  子供向けってどのレベルの問題？具体的に知りたい。
  - 2025年7月4日 6:25 PM #64138 返信
    
    名無しさん
    
    小1レベルの足し算とか、簡単なパターン認識らしい。深層学習って意外とこういうのが苦手なんだな。
- 2025年7月4日 6:27 PM #64139 返信
  
  名無しさん
  
  v3からそんなに進歩してない気がする。ベンチマークだけ上がって実用は変わらず。
  - 2025年7月4日 6:30 PM #64140 返信
    
    名無しさん
    
    でもコード生成は結構使えるよ。推論とコードは別物なのかも。
    - 2025年7月4日 6:36 PM #64141 返信
      
      名無しさん
      
      確かに。Pythonの簡単なスクリプトなら大体合ってる。でも論理パズルはダメだ。
- 2025年7月4日 6:45 PM #64142 返信
  
  名無しさん
  
  ローカルLLMの限界かな。クラウドのAPIはもっと賢い？
  - 2025年7月4日 6:46 PM #64143 返信
    
    名無しさん
    
    GPT-4oでも似たようなミスあるよ。ただ、DeepSeekは特に顕著って感じ。
- 2025年7月4日 6:49 PM #64144 返信
  
  名無しさん
  
  そもそもv4って正式リリースされたの？
  - 2025年7月4日 6:53 PM #64145 返信
    
    名無しさん
    
    どうやら内部テスト版らしい。Redditの投稿者が先行アクセス持ってたみたい。
    - 2025年7月4日 6:59 PM #64146 返信
      
      名無しさん
      
      それならまだ改善される可能性あるね。でも問題の本質は変わらないかも。
      - 2025年7月4日 7:11 PM #64147 返信
        
        名無しさん
        
        学習データにそういう問題が少ないんだろうな。データセットの偏りが原因かと。
        
        2025年7月4日 7:13 PM #64148 返信
        
        名無しさん
        
        でも子供向け問題ってネットに大量にあるはず。学習してないのが不思議。
- 2025年7月4日 7:16 PM #64149 返信
  
  名無しさん
  
  個人的には、こういう話題が出るたびにAGIはまだ遠いなと思う。
  - 2025年7月4日 7:20 PM #64150 返信
    
    名無しさん
    
    同意。単なるパターンマッチングに過ぎないってことの証拠。
- 2025年7月4日 7:28 PM #64151 返信
  
  名無しさん
  
  ローカルで動かす分にはコスパ良いから、とりあえずv3でも十分かな。
  - 2025年7月4日 7:30 PM #64152 返信
    
    名無しさん
    
    そうそう。完璧じゃなくても使える場面は多い。過度な期待は禁物。
投稿者

投稿

18件の返信を表示中（うち親返信7件）

返信先: DeepSeek v4、簡単な子供向け問題すら解けない？で#64139に返信

あなたの情報:

お名前 (必須)

メール (非公開) (必須):

ウェブサイト:

キャンセル

関連するAIトピック