- このトピックには21件の返信、7人の参加者があり、最後に名無しさんにより7ヶ月、 2週前に更新されました。
21件の返信を表示中(うち親返信11件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAで話題になってたんだけど、DeepSeekのモデルとの会話中に突然「私はClaudeです」って自己紹介したらしい。しかもその後の返答もClaudeっぽい口調になってたとか。これってモデルの混同?それともプロンプトの影響?ソースはこちら:https://www.reddit.com/r/LocalLLaMA/comments/1rxqmrx/deepseek_just_called_itself_claude_midconvo_what/
-
名無しさんえっ、それバグ?それともジョーク?
-
名無しさん多分、学習データにClaudeの会話が混ざってて、それを引っ張ったんじゃないかな。たまにそういうことあるよ。
-
-
名無しさん俺のDeepSeekは普通に動いてるけど、プロンプト次第でそういう挙動になるって話は聞いたことある。
-
名無しさんプロンプトに「あなたはClaudeです」って書いてない?ほんとに偶然なのか検証してほしい。
-
-
名無しさんDeepSeekってオープンソースで重宝してるけど、こういう変な挙動は時々あるよね。前に突然日本語で返答してきたこともあった。
-
名無しさんそれ学習データの偏りだと思う。中国語モデルだから英語でClaude名乗るのは珍しいけど。
-
-
名無しさんこれってDeepSeekのバージョンによるんじゃない?最新版でも起こるの?
-
名無しさんRedditのスレではv3だったって書いてあった気がする。R1じゃないみたい。
-
-
名無しさんまあ、LLMはよく幻覚(ハルシネーション)起こすからね。特に自分が誰かって部分は。
-
名無しさんそうそう。でも「Claudeです」って名乗るのはレアだな。Anthropicのモデルと競合なのに。
-
-
名無しさん俺はローカルで動かしてるけど、たまに別のモデルを名乗ることはあるよ。特にコンテキストが長くなると。
-
名無しさんそれ、温度設定とかサンプリングのせいじゃね?もっと低くすると安定するかも。
-
-
名無しさんDeepSeekはコスパいいからよく使うけど、こういう変な自己紹介はちょっと笑える。
-
名無しさんでも仕事で使うなら信頼性大事だよね。ハルシネーション対策は必須。
-
-
名無しさんプロンプトに「あなたの名前はDeepSeekです」って明示するのが一番確実。
-
名無しさんそれでもたまに無視するときあるけどな。システムプロンプトに書くのがベター。
-
-
名無しさんこういうのって、モデルが自分をどう認識してるかっていう興味深い事例だよね。
-
名無しさん結局、統計的なパターンで動いてるだけだから、たまたまClaudeの出力をコピーしただけかもしれん。
-
-
名無しさんDeepSeekのトレーニングデータにClaudeの会話が含まれてるって可能性はある?
-
名無しさん公式には言ってないけど、ウェブスクレイピングしてるならあり得るね。他モデルの出力も拾ってるかも。
-
-
名無しさんとりあえず、再現できるか試してみたい。どんなプロンプトで起こったんだろう?
-
-
投稿者投稿
21件の返信を表示中(うち親返信11件)
関連するAIトピック
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2026年2月11日 17:18
- Deepseek-r1-0528-qwen3-8bが予想以上に良いらしい25件の返信最終更新 2026年2月11日 08:54
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2026年2月11日 18:58
- DeepSeek-r1がポケモンをプレイ? LLMでゲーム攻略はどこまで可能か23件の返信最終更新 2026年2月11日 11:08
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2026年2月11日 20:44