DeepSeek v4、簡単な子供向け問題すら解けない？

名無しさん · 2025-07-04T14:12:30+09:00

Redditのr/LocalLLaMAで、DeepSeek v4が簡単な子供向けの論理問題を解けないという投稿が話題になっていました。最新モデルでも基本的な推論でつまずくケースがあるようです。みなさんはどう思いますか？

このトピックには18件の返信、6人の参加者があり、最後に名無しさんにより11ヶ月、 3週前に更新されました。

18件の返信を表示中（うち親返信7件）

投稿者

投稿
- 2025年7月4日 2:12 PM #64115 返信
  
  名無しさん
  
  Redditのr/LocalLLaMAで、DeepSeek v4が簡単な子供向けの論理問題を解けないという投稿が話題になっていました。
  最新モデルでも基本的な推論でつまずくケースがあるようです。みなさんはどう思いますか？
- 2025年7月4日 2:14 PM #64116 返信
  
  名無しさん
  
  うちでも試したけど、確かに簡単な算数問題で間違えることがある。
  - 2025年7月4日 2:21 PM #64118 返信
    
    名無しさん
    
    「リンゴが3個あって、2個もらったら全部でいくつ？」みたいな問題でも間違えたって書いてあった。
- 2025年7月4日 2:17 PM #64117 返信
  
  名無しさん
  
  子供向けってどのレベルの問題？具体的に知りたい。
  - 2025年7月4日 2:28 PM #64119 返信
    
    名無しさん
    
    小1レベルの足し算とか、簡単なパターン認識らしい。深層学習って意外とこういうのが苦手なんだな。
- 2025年7月4日 2:30 PM #64120 返信
  
  名無しさん
  
  v3からそんなに進歩してない気がする。ベンチマークだけ上がって実用は変わらず。
  - 2025年7月4日 2:33 PM #64121 返信
    
    名無しさん
    
    でもコード生成は結構使えるよ。推論とコードは別物なのかも。
    - 2025年7月4日 2:39 PM #64122 返信
      
      名無しさん
      
      確かに。Pythonの簡単なスクリプトなら大体合ってる。でも論理パズルはダメだ。
- 2025年7月4日 2:48 PM #64123 返信
  
  名無しさん
  
  ローカルLLMの限界かな。クラウドのAPIはもっと賢い？
  - 2025年7月4日 2:50 PM #64124 返信
    
    名無しさん
    
    GPT-4oでも似たようなミスあるよ。ただ、DeepSeekは特に顕著って感じ。
- 2025年7月4日 2:52 PM #64125 返信
  
  名無しさん
  
  そもそもv4って正式リリースされたの？
  - 2025年7月4日 2:56 PM #64126 返信
    
    名無しさん
    
    どうやら内部テスト版らしい。Redditの投稿者が先行アクセス持ってたみたい。
    - 2025年7月4日 3:03 PM #64127 返信
      
      名無しさん
      
      それならまだ改善される可能性あるね。でも問題の本質は変わらないかも。
      - 2025年7月4日 3:14 PM #64128 返信
        
        名無しさん
        
        学習データにそういう問題が少ないんだろうな。データセットの偏りが原因かと。
        
        2025年7月4日 3:16 PM #64129 返信
        
        名無しさん
        
        でも子供向け問題ってネットに大量にあるはず。学習してないのが不思議。
- 2025年7月4日 3:19 PM #64130 返信
  
  名無しさん
  
  個人的には、こういう話題が出るたびにAGIはまだ遠いなと思う。
  - 2025年7月4日 3:24 PM #64131 返信
    
    名無しさん
    
    同意。単なるパターンマッチングに過ぎないってことの証拠。
- 2025年7月4日 3:31 PM #64132 返信
  
  名無しさん
  
  ローカルで動かす分にはコスパ良いから、とりあえずv3でも十分かな。
  - 2025年7月4日 3:34 PM #64133 返信
    
    名無しさん
    
    そうそう。完璧じゃなくても使える場面は多い。過度な期待は禁物。
投稿者

投稿

18件の返信を表示中（うち親返信7件）

返信先: DeepSeek v4、簡単な子供向け問題すら解けない？で#64124に返信

あなたの情報:

お名前 (必須)

メール (非公開) (必須):

ウェブサイト:

キャンセル

関連するAIトピック