DeepSeekの幻覚問題、みんなどうしてる?

掲示板 フォーラム AI DeepSeekの幻覚問題、みんなどうしてる?

  • このトピックには18件の返信、6人の参加者があり、最後に名無しさんにより7ヶ月、 3週前に更新されました。
18件の返信を表示中(うち親返信8件)
  • 投稿者
    投稿
    • #66562 返信
      名無しさん
      Redditのr/LocalLLaMAで「DeepSeekのimport幻覚問題、修正方法ある?」というスレッドが立ってた。コード生成で存在しないモジュールをでっち上げる問題で、結構悩んでる人が多いみたい。ソース:https://www.reddit.com/r/LocalLLaMA/comments/1s44emu/the_import_hallucination_problem_with_deepseek/

    • #66563 返信
      名無しさん
      俺もR1でよくある。存在しないライブラリをimportしやがる。

      • #66564 返信
        名無しさん
        それ、モデルにコンテキストをちゃんと与えてないんじゃない?

    • #66565 返信
      名無しさん
      プロンプトに「実際に存在するモジュールだけ使え」って入れたら改善したよ。

      • #66566 返信
        名無しさん
        それでもたまに嘘つくんだよな…根本的な解決にはなってない気がする。

    • #66567 返信
      名無しさん
      DeepSeekはコード生成強いけど、こういう細かい幻覚が厄介。ローカルLLM全般の課題だね。

      • #66568 返信
        名無しさん
        そうそう。ChatGPTでもあるけど、DeepSeekは特にimportでやらかす印象。

    • #66569 返信
      名無しさん
      Qwen2.5とか使うとマシだけど、コスト面でDeepSeekに戻っちゃう。

      • #66570 返信
        名無しさん
        Qwenもたまに幻覚あるよ。完璧なモデルはまだないってことか。

    • #66571 返信
      名無しさん
      API経由だと安いけど、プライバシー考えるとローカルで動かしたい。そのせいで苦労する。

      • #66572 返信
        名無しさん
        ローカルだとファインチューニングで直せるかもね。試した人いる?

        • #66573 返信
          名無しさん
          自分でデータセット作ってLoRAやったけど、効果は微妙だった。

    • #66574 返信
      名無しさん
      そもそもimportの幻覚って、学習データに依存してるんじゃない?

      • #66575 返信
        名無しさん
        そうかもしれない。特にPythonのversionによってモジュール名が違うと混乱するんだろうな。

    • #66576 返信
      名無しさん
      Redditの元スレでも、解決策としてコード実行環境と連携するって意見があったよ。

      • #66577 返信
        名無しさん
        それは良いアイデア。実際にimportしてエラー出たら修正させるような。

    • #66578 返信
      名無しさん
      DeepSeekの次バージョンに期待するしかないかもね。

      • #66579 返信
        名無しさん
        でも新バージョン出ても幻覚完全にはなくならないだろうな。

        • #66580 返信
          名無しさん
          結局、人間がチェックするのが一番確実ってことか…。

18件の返信を表示中(うち親返信8件)
返信先: DeepSeekの幻覚問題、みんなどうしてる?で#66569に返信
あなたの情報:




AA
tchmii
タイトルとURLをコピーしました