- このトピックには18件の返信、6人の参加者があり、最後に名無しさんにより11ヶ月、 3週前に更新されました。
18件の返信を表示中(うち親返信7件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAで、DeepSeek v4が簡単な子供向けの論理問題を解けないという投稿が話題になっていました。
最新モデルでも基本的な推論でつまずくケースがあるようです。みなさんはどう思いますか? -
名無しさんうちでも試したけど、確かに簡単な算数問題で間違えることがある。
-
名無しさん「リンゴが3個あって、2個もらったら全部でいくつ?」みたいな問題でも間違えたって書いてあった。
-
-
名無しさん子供向けってどのレベルの問題?具体的に知りたい。
-
名無しさん小1レベルの足し算とか、簡単なパターン認識らしい。深層学習って意外とこういうのが苦手なんだな。
-
-
名無しさんv3からそんなに進歩してない気がする。ベンチマークだけ上がって実用は変わらず。
-
名無しさんでもコード生成は結構使えるよ。推論とコードは別物なのかも。
-
名無しさん確かに。Pythonの簡単なスクリプトなら大体合ってる。でも論理パズルはダメだ。
-
-
-
名無しさんローカルLLMの限界かな。クラウドのAPIはもっと賢い?
-
名無しさんGPT-4oでも似たようなミスあるよ。ただ、DeepSeekは特に顕著って感じ。
-
-
名無しさんそもそもv4って正式リリースされたの?
-
名無しさんどうやら内部テスト版らしい。Redditの投稿者が先行アクセス持ってたみたい。
-
名無しさんそれならまだ改善される可能性あるね。でも問題の本質は変わらないかも。
-
名無しさん学習データにそういう問題が少ないんだろうな。データセットの偏りが原因かと。
-
名無しさんでも子供向け問題ってネットに大量にあるはず。学習してないのが不思議。
-
-
-
-
-
名無しさん個人的には、こういう話題が出るたびにAGIはまだ遠いなと思う。
-
名無しさん同意。単なるパターンマッチングに過ぎないってことの証拠。
-
-
名無しさんローカルで動かす分にはコスパ良いから、とりあえずv3でも十分かな。
-
名無しさんそうそう。完璧じゃなくても使える場面は多い。過度な期待は禁物。
-
-
-
投稿者投稿
18件の返信を表示中(うち親返信7件)
関連するAIトピック
- C99でCPU LLMエンジンを作ってみたけど、DeepSeek MoEで1.90 tok/sしか出ない問題27件の返信最終更新 2025年6月16日 17:19
- DeepSeek V4 Pro (max)って何?話題のローカルLLMモデルについて語ろう22件の返信最終更新 2025年2月12日 18:03
- DwarfStarとDeepSeek V4 FlashをDGX Sparkで試した人いる?25件の返信最終更新 2025年2月12日 02:45
- DeepSeekのキャッシュヒット率99.9%を実現するmemory-keeperというツール16件の返信最終更新 2025年2月12日 09:06
- RTX 6000 PROを4~8枚で大規模モデル運用してる人、実際どう?GLM 5.2、Kimi 2.7、DeepSeek V4 Proとか18件の返信最終更新 2025年2月11日 22:54