DeepSeek V4の幻覚率の高さについて、設計への影響を議論しよう

掲示板 フォーラム AI DeepSeek V4の幻覚率の高さについて、設計への影響を議論しよう

  • このトピックには13件の返信、4人の参加者があり、最後に名無しさんにより1年、 3ヶ月前に更新されました。
13件の返信を表示中(うち親返信5件)
  • 投稿者
    投稿
    • #64861 返信
      名無しさん
      Redditのr/LocalLLaMAでDeepSeek V4の幻覚率が非常に高いというスレッドが立っていました。
      ローカルLLMとして使う場合、幻覚が多いと実用性に問題が出ますよね。コード生成や情報検索で誤った回答をされると困るし、設計面でも改善が必要だと思います。皆さんはどう思いますか?使ってみた感想や、他のモデルとの比較などあれば教えてください。

    • #64862 返信
      名無しさん
      確かにDeepSeek V4は幻覚が多い印象。試しにコード生成させたら存在しない関数を平気で出力してた。

      • #64864 返信
        名無しさん
        コード生成で幻覚は致命的だよね。自分はCodeLlamaに戻した。

      • #64865 返信
        名無しさん
        関数名だけでなく、APIの仕様も間違えることがあるから注意が必要。

    • #64863 返信
      名無しさん
      でもコストパフォーマンスは良いと思う。幻覚対策でプロンプト工夫すれば結構使える。

      • #64866 返信
        名無しさん
        プロンプトでどこまで改善できるか試してるんだけど、やっぱり根本的な問題な気がする。

    • #64867 返信
      名無しさん
      設計面では、ファインチューニングで幻覚を減らせるのでは?専門データセットで調整すればマシになるかも。

      • #64868 返信
        名無しさん
        でもファインチューニングにはお金と時間がかかる。一般ユーザーにはハードル高い。

      • #64869 返信
        名無しさん
        ローカルでやるなら実用的なサイズに抑えたいし、幻覚率の低いモデルを選びたいよね。

    • #64870 返信
      名無しさん
      個人的にはLlama 3の方が安定してる。DeepSeekは日本語対応に期待してたけど幻覚がネック。

      • #64871 返信
        名無しさん
        日本語対応は確かに魅力的だけど、幻覚が多いと信頼性に欠ける。他にいいモデルない?

        • #64872 返信
          名無しさん
          ELYZAとかrinnaのモデルはどう?幻覚は少ないと思う。

    • #64873 返信
      名無しさん
      プライバシー重視でローカルLLM使いたいけど、幻覚が多いと外部APIに頼らざるを得ない。難しい。

      • #64874 返信
        名無しさん
        外部APIもプライバシーリスクあるしね。結局用途に合わせて使い分けるしかないのか。

13件の返信を表示中(うち親返信5件)
返信先: DeepSeek V4の幻覚率の高さについて、設計への影響を議論しようで#64862に返信
あなたの情報:




AA
tchmii
タイトルとURLをコピーしました