- このトピックには18件の返信、6人の参加者があり、最後に名無しさんにより11ヶ月、 3週前に更新されました。
18件の返信を表示中(うち親返信7件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAで、DeepSeek v4が簡単な子供向けの論理問題を解けないという投稿が話題になっていました。
最新モデルでも基本的な推論でつまずくケースがあるようです。みなさんはどう思いますか? -
名無しさんうちでも試したけど、確かに簡単な算数問題で間違えることがある。
-
名無しさん「リンゴが3個あって、2個もらったら全部でいくつ?」みたいな問題でも間違えたって書いてあった。
-
-
名無しさん子供向けってどのレベルの問題?具体的に知りたい。
-
名無しさん小1レベルの足し算とか、簡単なパターン認識らしい。深層学習って意外とこういうのが苦手なんだな。
-
-
名無しさんv3からそんなに進歩してない気がする。ベンチマークだけ上がって実用は変わらず。
-
名無しさんでもコード生成は結構使えるよ。推論とコードは別物なのかも。
-
名無しさん確かに。Pythonの簡単なスクリプトなら大体合ってる。でも論理パズルはダメだ。
-
-
-
名無しさんローカルLLMの限界かな。クラウドのAPIはもっと賢い?
-
名無しさんGPT-4oでも似たようなミスあるよ。ただ、DeepSeekは特に顕著って感じ。
-
-
名無しさんそもそもv4って正式リリースされたの?
-
名無しさんどうやら内部テスト版らしい。Redditの投稿者が先行アクセス持ってたみたい。
-
名無しさんそれならまだ改善される可能性あるね。でも問題の本質は変わらないかも。
-
名無しさん学習データにそういう問題が少ないんだろうな。データセットの偏りが原因かと。
-
名無しさんでも子供向け問題ってネットに大量にあるはず。学習してないのが不思議。
-
-
-
-
-
名無しさん個人的には、こういう話題が出るたびにAGIはまだ遠いなと思う。
-
名無しさん同意。単なるパターンマッチングに過ぎないってことの証拠。
-
-
名無しさんローカルで動かす分にはコスパ良いから、とりあえずv3でも十分かな。
-
名無しさんそうそう。完璧じゃなくても使える場面は多い。過度な期待は禁物。
-
-
-
投稿者投稿
18件の返信を表示中(うち親返信7件)
関連するAIトピック
- AIと人間の見分けがつくか? – DeepSeek新バージョンを追加したゲームの話題18件の返信最終更新 2025年10月26日 02:40
- DeepSeekが本当のオープンAI?実際に使ってみた感想21件の返信最終更新 2025年10月27日 02:20
- DeepSeek R1-0528-Qwen3-8Bが無限ツールループに陥る問題、対処法ある?20件の返信最終更新 2025年10月26日 00:54
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2025年10月27日 09:07
- DeepSeek-R1-0528-Qwen3-8B を試した人の感想27件の返信最終更新 2025年10月26日 19:01