DeepSeek V4の幻覚率の高さについて、設計への影響を議論しよう

名無しさん · 2025-03-08T18:22:37+09:00

Redditのr/LocalLLaMAでDeepSeek V4の幻覚率が非常に高いというスレッドが立っていました。ローカルLLMとして使う場合、幻覚が多いと実用性に問題が出ますよね。コード生成や情報検索で誤った回答をされると困るし、設計面でも改善が必要だと思います。皆さんはどう思いますか？使ってみた感想や、他のモデルとの比較などあれば教えてください。

このトピックには13件の返信、4人の参加者があり、最後に名無しさんにより1年、 3ヶ月前に更新されました。

13件の返信を表示中（うち親返信5件）

投稿者

投稿
- 2025年3月8日 6:22 PM #64861 返信
  
  名無しさん
  
  Redditのr/LocalLLaMAでDeepSeek V4の幻覚率が非常に高いというスレッドが立っていました。
  ローカルLLMとして使う場合、幻覚が多いと実用性に問題が出ますよね。コード生成や情報検索で誤った回答をされると困るし、設計面でも改善が必要だと思います。皆さんはどう思いますか？使ってみた感想や、他のモデルとの比較などあれば教えてください。
- 2025年3月8日 6:24 PM #64862 返信
  
  名無しさん
  
  確かにDeepSeek V4は幻覚が多い印象。試しにコード生成させたら存在しない関数を平気で出力してた。
  - 2025年3月8日 6:31 PM #64864 返信
    
    名無しさん
    
    コード生成で幻覚は致命的だよね。自分はCodeLlamaに戻した。
  - 2025年3月8日 6:38 PM #64865 返信
    
    名無しさん
    
    関数名だけでなく、APIの仕様も間違えることがあるから注意が必要。
- 2025年3月8日 6:27 PM #64863 返信
  
  名無しさん
  
  でもコストパフォーマンスは良いと思う。幻覚対策でプロンプト工夫すれば結構使える。
  - 2025年3月8日 6:40 PM #64866 返信
    
    名無しさん
    
    プロンプトでどこまで改善できるか試してるんだけど、やっぱり根本的な問題な気がする。
- 2025年3月8日 6:44 PM #64867 返信
  
  名無しさん
  
  設計面では、ファインチューニングで幻覚を減らせるのでは？専門データセットで調整すればマシになるかも。
  - 2025年3月8日 6:50 PM #64868 返信
    
    名無しさん
    
    でもファインチューニングにはお金と時間がかかる。一般ユーザーにはハードル高い。
  - 2025年3月8日 6:59 PM #64869 返信
    
    名無しさん
    
    ローカルでやるなら実用的なサイズに抑えたいし、幻覚率の低いモデルを選びたいよね。
- 2025年3月8日 7:00 PM #64870 返信
  
  名無しさん
  
  個人的にはLlama 3の方が安定してる。DeepSeekは日本語対応に期待してたけど幻覚がネック。
  - 2025年3月8日 7:02 PM #64871 返信
    
    名無しさん
    
    日本語対応は確かに魅力的だけど、幻覚が多いと信頼性に欠ける。他にいいモデルない？
    - 2025年3月8日 7:06 PM #64872 返信
      
      名無しさん
      
      ELYZAとかrinnaのモデルはどう？幻覚は少ないと思う。
- 2025年3月8日 7:13 PM #64873 返信
  
  名無しさん
  
  プライバシー重視でローカルLLM使いたいけど、幻覚が多いと外部APIに頼らざるを得ない。難しい。
  - 2025年3月8日 7:24 PM #64874 返信
    
    名無しさん
    
    外部APIもプライバシーリスクあるしね。結局用途に合わせて使い分けるしかないのか。
投稿者

投稿

13件の返信を表示中（うち親返信5件）

返信先: DeepSeek V4の幻覚率の高さについて、設計への影響を議論しようで#64862に返信

あなたの情報:

お名前 (必須)

メール (非公開) (必須):

ウェブサイト:

キャンセル

関連するAIトピック