DeepSeek V3.2 Speciale:大学院レベルの問題は解けるのに、高校代数でつまずくってどういうこと?

掲示板 フォーラム AI DeepSeek V3.2 Speciale:大学院レベルの問題は解けるのに、高校代数でつまずくってどういうこと?

  • このトピックには14件の返信、4人の参加者があり、最後に名無しさんにより1年、 1ヶ月前に更新されました。
14件の返信を表示中(うち親返信7件)
  • 投稿者
    投稿
    • #73768 返信
      名無しさん
      Redditのr/LocalLLaMAで話題になっているDeepSeek V3.2 Specialeの話です。このモデル、大学院レベルの難しい問題は解けるのに、なぜか高校の代数でミスをするという報告がありました。
      ローカルLLMユーザーの間でも「ベンチマークの限界か?」「訓練データの偏りでは?」と議論になっています。みなさんのご意見をどうぞ。

    • #73769 返信
      名無しさん
      これあるあるだよね。LLMって特定のパターンには強いけど、基礎的な論理で抜けがある。

      • #73771 返信
        名無しさん
        そうそう、訓練データに論文が多いから、そういう問題は得意だけど、中学数学みたいなのは苦手なんだろうな。

    • #73770 返信
      名無しさん
      むしろ大学院レベルが解けるってすごくない?高校代数は単純な計算ミスみたいなものかも。

      • #73773 返信
        名無しさん
        でも「Special版」って謳ってるのに、基本ができてないのはちょっと…。

    • #73772 返信
      名無しさん
      ベンチマークの選び方にも問題あるよね。実際のユースケースではもっとバランスが大事。

      • #73774 返信
        名無しさん
        そう、MATHとかGSM8Kはある程度できるけど、自由形式の代数問題は別問題らしい。

    • #73775 返信
      名無しさん
      ローカルで動かすには重すぎるし、コスパも微妙って話もあるね。

      • #73776 返信
        名無しさん
        でもDeepSeekはAPI安いから、そこは評価できる。プライバシー気にする人はローカル一択だけど。

    • #73777 返信
      名無しさん
      高校代数でつまずくって、もしかしてプロンプトが悪いだけじゃない?

      • #73778 返信
        名無しさん
        それもあるかも。でもRedditの人はいろいろ試してダメだったって言ってたよ。

    • #73779 返信
      名無しさん
      こういう報告って結構あるから、AIの「賢さ」ってまだまだ不完全だなと思う。

      • #73780 返信
        名無しさん
        同感。特にコーディング系だと、ライブラリの使い方は完璧なのに、簡単なループでミスったりする。

    • #73781 返信
      名無しさん
      まあ、人間も同じようなことあるしね。専門バカみたいなものか。

      • #73782 返信
        名無しさん
        それにしても、DeepSeekは中国のモデルだから、データセットに偏りがある可能性も否めない。

14件の返信を表示中(うち親返信7件)
返信先: DeepSeek V3.2 Speciale:大学院レベルの問題は解けるのに、高校代数でつまずくってどういうこと?で#73777に返信
あなたの情報:




AA
tchmii
タイトルとURLをコピーしました