DeepSeek v4、簡単な子供向け問題すら解けない?【元スレ166】

掲示板 フォーラム AI DeepSeek v4、簡単な子供向け問題すら解けない?【元スレ166】

  • このトピックには18件の返信、6人の参加者があり、最後に名無しさんにより8ヶ月、 1週前に更新されました。
18件の返信を表示中(うち親返信7件)
  • 投稿者
    投稿
    • #64134 返信
      名無しさん
      Redditのr/LocalLLaMAで、DeepSeek v4が簡単な子供向けの論理問題を解けないという投稿が話題になっていました。ソース: https://www.reddit.com/r/LocalLLaMA/comments/1suqmmr/deepseek_v4_still_not_able_to_solve_simple/

      最新モデルでも基本的な推論でつまずくケースがあるようです。みなさんはどう思いますか?

    • #64135 返信
      名無しさん
      うちでも試したけど、確かに簡単な算数問題で間違えることがある。

      • #64137 返信
        名無しさん
        「リンゴが3個あって、2個もらったら全部でいくつ?」みたいな問題でも間違えたって書いてあった。

    • #64136 返信
      名無しさん
      子供向けってどのレベルの問題?具体的に知りたい。

      • #64138 返信
        名無しさん
        小1レベルの足し算とか、簡単なパターン認識らしい。深層学習って意外とこういうのが苦手なんだな。

    • #64139 返信
      名無しさん
      v3からそんなに進歩してない気がする。ベンチマークだけ上がって実用は変わらず。

      • #64140 返信
        名無しさん
        でもコード生成は結構使えるよ。推論とコードは別物なのかも。

        • #64141 返信
          名無しさん
          確かに。Pythonの簡単なスクリプトなら大体合ってる。でも論理パズルはダメだ。

    • #64142 返信
      名無しさん
      ローカルLLMの限界かな。クラウドのAPIはもっと賢い?

      • #64143 返信
        名無しさん
        GPT-4oでも似たようなミスあるよ。ただ、DeepSeekは特に顕著って感じ。

    • #64144 返信
      名無しさん
      そもそもv4って正式リリースされたの?

      • #64145 返信
        名無しさん
        どうやら内部テスト版らしい。Redditの投稿者が先行アクセス持ってたみたい。

        • #64146 返信
          名無しさん
          それならまだ改善される可能性あるね。でも問題の本質は変わらないかも。

          • #64147 返信
            名無しさん
            学習データにそういう問題が少ないんだろうな。データセットの偏りが原因かと。

            • #64148 返信
              名無しさん
              でも子供向け問題ってネットに大量にあるはず。学習してないのが不思議。

    • #64149 返信
      名無しさん
      個人的には、こういう話題が出るたびにAGIはまだ遠いなと思う。

      • #64150 返信
        名無しさん
        同意。単なるパターンマッチングに過ぎないってことの証拠。

    • #64151 返信
      名無しさん
      ローカルで動かす分にはコスパ良いから、とりあえずv3でも十分かな。

      • #64152 返信
        名無しさん
        そうそう。完璧じゃなくても使える場面は多い。過度な期待は禁物。

18件の返信を表示中(うち親返信7件)
返信先: DeepSeek v4、簡単な子供向け問題すら解けない?【元スレ166】で#64150に返信
あなたの情報:




AA
tchmii
タイトルとURLをコピーしました