- このトピックには24件の返信、8人の参加者があり、最後に名無しさんにより1年、 2ヶ月前に更新されました。
24件の返信を表示中(うち親返信8件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAで、金融AIエージェント向けに高速&低コストなLLMを探している投稿がありました。現在はDeepSeek V3.2 Reasoningを使っているが、乗り換えを検討中とのこと。コストと性能のバランス、ローカル運用の可否など、みなさんの意見を聞かせてください。
-
名無しさんDeepSeekはコスパ良いけど、金融だと数値計算に弱いって聞いたな。
-
名無しさん確かに、複雑な財務分析だとDeepSeekは外すことがある。Mistralの方が安定してるかも。
-
名無しさんMistral Largeは良さそうだけど、値段が高い。DeepSeekの方がコスパいい。
-
名無しさんコスト重視ならGemma 2が安いけど、性能はイマイチ。
-
-
-
-
名無しさんLlama 3.1 8Bをファインチューニングして使ってるよ。速度も精度もまずまず。
-
名無しさんLlama 8Bは軽いけど、やっぱり規模が足りない気がする。70Bくらい欲しい。
-
名無しさん70BはVRAMが爆食いだよ。8Bでも量子化すれば動くけど、精度落ちるし。
-
-
-
名無しさん金融なら専用モデル作った方がよくない?GPT-4o miniをAPI経由で使う手もある。
-
名無しさんAPIだと遅延やコストが気になるな。ローカルで動かしたい。
-
名無しさんローカル運用ならllama.cppで量子化モデル使うのがベストプラクティス。
-
-
-
名無しさんQwen2.5 32Bは数学に強いって評判。試してみる価値あり。
-
名無しさんQwenは日本語対応も良いらしい。金融用語もそこそこ理解できるみたい。
-
-
名無しさんそもそも金融AIエージェントって何をさせるの?チャート分析?自動トレード?
-
名無しさん財務諸表の解析とか、リスク評価とか。結構複雑な処理が必要。
-
名無しさんそれなら関数呼び出しできるモデルがいいな。DeepSeekもtool use対応してる?
-
名無しさんDeepSeekはtool callできるよ。ただ精度はGPT-4に劣る。
-
名無しさんtool callの正確さはファインチューニングで改善できるみたい。
-
-
-
-
-
名無しさんDeepSeek V3.2は推論能力高いと思うけど、金融特有のドメイン知識が不足してるかも。ファインチューニング前提なら別だが。
-
名無しさんRAGで補えばドメイン知識は何とかなる。ベクトルDBに金融文書突っ込んで。
-
名無しさんRAGの精度を上げるのが難しいんだよね。適切なチャンク分割とか。
-
名無しさんチャンク戦略は試行錯誤だね。自分はsemantic chunkingが一番マシだった。
-
-
-
-
名無しさん自分はClaude 3 Haiku使ってる。高速で金融関連のタスクもそこそこ正確。
-
名無しさんHaikuは安いけど、複数ステップの推論だとハルシネーション多い。
-
-
名無しさん結局はユースケース次第だよな。簡単な質問応答なら小さいモデルで十分。
-
-
投稿者投稿
24件の返信を表示中(うち親返信8件)
関連するAIトピック
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2025年6月26日 17:23
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2025年6月26日 13:56
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2025年6月26日 15:37
- DeepSeek R1-0528のシステムプロンプトがリークされたらしい16件の返信最終更新 2025年6月25日 12:50
- AIと人間の見分けがつくか? – DeepSeek新バージョンを追加したゲームの話題18件の返信最終更新 2025年6月25日 10:56