DeepSeekが「台湾」を「タイ」に自動置換?その検閲実態を解析

掲示板 フォーラム AI DeepSeekが「台湾」を「タイ」に自動置換?その検閲実態を解析

  • このトピックには25件の返信、8人の参加者があり、最後に名無しさんにより1年、 3ヶ月前に更新されました。
25件の返信を表示中(うち親返信10件)
  • 投稿者
    投稿
    • #65664 返信
      名無しさん
      Redditのr/LocalLLaMAで話題の投稿「DeepSeek replaced ‘Taiwan’ with ‘Thailand’ automatically. Here’s the full breakdown of how its censorship actually works」を元に議論しましょう。DeepSeekモデルが特定の地理的名称を自動的に変更する仕組みが報告されています。実際に試した人、他のモデルとの比較、規制回避の方法など、意見を聞かせてください。

    • #65667 返信
      名無しさん
      これ本当?試したけど普通に「台湾」って出力されたよ。特定のプロンプトだけなのかな。

      • #65669 返信
        名無しさん
        中国語のプロンプトで試したら「タイ」に変わったって話だね。日本語だと違うかも。

    • #65671 返信
      名無しさん
      こういう検閲は中国製AIではよくある話。DeepSeekだけじゃないよ。

      • #65673 返信
        名無しさん
        でもオープンなら自分でファインチューニングできるからまだマシじゃない?

        • #65675 返信
          名無しさん
          ファインチューニングしてもベースモデルに組み込まれてるバイアスは消えないよ。

    • #65677 返信
      名無しさん
      性能は良いけど政治的な問題がね…ローカルで使う分には気にしないって人もいるけど。

      • #65679 返信
        名無しさん
        でも研究目的ならともかく、商用で使うのはリスクあるよね。

    • #65681 返信
      名無しさん
      Redditのスレでは完全な回避方法も議論されてた。システムプロンプトで抑制できるとか。

      • #65683 返信
        名無しさん
        詳しく知りたい。リンク先のBreakdown読んだけど、結構複雑だった。

        • #65685 返信
          名無しさん
          簡単に言うと、特定の単語を検出してリダイレクトしてるみたい。完全なブロックじゃないよ。

    • #65687 返信
      名無しさん
      こういうのって中国企業としては仕方ないのかもしれないけど、透明性はもっと欲しいよね。

      • #65688 返信
        名無しさん
        でもオープン公開してるだけでも評価できると思う。MetaとかGoogleも似たようなことしてる。

    • #65690 返信
      名無しさん
      ローカルLLM勢としては、こういう問題を把握した上で使うかどうか決めればいい。

      • #65692 返信
        名無しさん
        そうそう。自分でテストして、用途に合わなければ他のモデルにすればいい。

        • #65694 返信
          名無しさん
          QwenやYiも似たようなバイアスあるって聞いたけど、実際どうなんだろ。

          • #65696 返信
            名無しさん
            Qwenは中国語で試すと「台湾は中国の一部」って明言するよ。DeepSeekより露骨。

    • #65698 返信
      名無しさん
      逆に欧米モデル(Llama, Mistral)はこういうのないから安心。

      • #65700 返信
        名無しさん
        でもLlamaにも文化的バイアスはあるよ。完璧なモデルなんてない。

        • #65702 返信
          名無しさん
          そういう意味ではDeepSeekの性能は魅力的だから、検閲だけ何とかしてほしい。

    • #65704 返信
      名無しさん
      個人的にはコード生成で使ってるから、地理的な話はあんまり関係ないな。

      • #65705 返信
        名無しさん
        コード生成でも学習データに中国語が多いから、変数名が中国語になることはあるよ。

        • #65706 返信
          名無しさん
          それはプロンプトを英語にすれば回避できる。DeepSeekは英語性能も高い。

    • #65708 返信
      名無しさん
      結局、使う目的によるよね。研究や検証なら問題ないけど、政治的な話題に使うのは危険。

      • #65709 返信
        名無しさん
        同意。DeepSeekはあくまでツール。その特性を理解して使おう。

    • #65711 返信
      名無しさん
      このスレ読んで、自分で試してみたくなった。プロンプト例教えてくれる人いる?

25件の返信を表示中(うち親返信10件)
返信先: DeepSeekが「台湾」を「タイ」に自動置換?その検閲実態を解析で#65673に返信
あなたの情報:




AA
tchmii
タイトルとURLをコピーしました