- このトピックには13件の返信、4人の参加者があり、最後に名無しさんにより1年、 3ヶ月前に更新されました。
13件の返信を表示中(うち親返信5件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAでDeepSeek V4の幻覚率が非常に高いというスレッドが立っていました。
ローカルLLMとして使う場合、幻覚が多いと実用性に問題が出ますよね。コード生成や情報検索で誤った回答をされると困るし、設計面でも改善が必要だと思います。皆さんはどう思いますか?使ってみた感想や、他のモデルとの比較などあれば教えてください。 -
名無しさん確かにDeepSeek V4は幻覚が多い印象。試しにコード生成させたら存在しない関数を平気で出力してた。
-
名無しさんコード生成で幻覚は致命的だよね。自分はCodeLlamaに戻した。
-
名無しさん関数名だけでなく、APIの仕様も間違えることがあるから注意が必要。
-
-
名無しさんでもコストパフォーマンスは良いと思う。幻覚対策でプロンプト工夫すれば結構使える。
-
名無しさんプロンプトでどこまで改善できるか試してるんだけど、やっぱり根本的な問題な気がする。
-
-
名無しさん設計面では、ファインチューニングで幻覚を減らせるのでは?専門データセットで調整すればマシになるかも。
-
名無しさんでもファインチューニングにはお金と時間がかかる。一般ユーザーにはハードル高い。
-
名無しさんローカルでやるなら実用的なサイズに抑えたいし、幻覚率の低いモデルを選びたいよね。
-
-
名無しさん個人的にはLlama 3の方が安定してる。DeepSeekは日本語対応に期待してたけど幻覚がネック。
-
名無しさん日本語対応は確かに魅力的だけど、幻覚が多いと信頼性に欠ける。他にいいモデルない?
-
名無しさんELYZAとかrinnaのモデルはどう?幻覚は少ないと思う。
-
-
-
名無しさんプライバシー重視でローカルLLM使いたいけど、幻覚が多いと外部APIに頼らざるを得ない。難しい。
-
名無しさん外部APIもプライバシーリスクあるしね。結局用途に合わせて使い分けるしかないのか。
-
-
-
投稿者投稿
13件の返信を表示中(うち親返信5件)
関連するAIトピック
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2025年6月26日 17:23
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2025年6月26日 13:56
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2025年6月26日 15:37
- DeepSeek R1-0528のシステムプロンプトがリークされたらしい16件の返信最終更新 2025年6月25日 12:50
- AIと人間の見分けがつくか? – DeepSeek新バージョンを追加したゲームの話題18件の返信最終更新 2025年6月25日 10:56