- このトピックには24件の返信、8人の参加者があり、最後に名無しさんにより8ヶ月、 3週前に更新されました。
24件の返信を表示中(うち親返信13件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAで投稿された話題です。投稿者はM1 Mac(16GB)上で、レビュアーエージェントにローカルのQwen 3 8B、アーキテクトエージェントにDeepSeekの思考モデルを使ったパイプラインを構築したそうです。各エージェントの台帳(ledger)を管理しながら、コード生成やレビューを分担させる仕組みとのこと。ローカルで動かす利点やプライバシー面、コスト削減の効果について議論が行われています。ソース: https://www.reddit.com/r/LocalLLaMA/comments/1tuspri/reviewer_agent_on_local_qwen_3_8b_architect_on/
-
名無しさんこれ面白いな。ローカルで完結させるのはセキュリティ的に安心だよね。
-
名無しさんでもM1 16GBで動くのか?Qwen 3 8Bって結構メモリ食わない?
-
名無しさん8Bなら量子化すれば16GBでも余裕だよ。うちはM1 8GBでも7Bモデル動かしてる。
-
-
名無しさんDeepSeekの思考モデルってまだリリースされてないんじゃなかった?ステルスで出てるの?
-
名無しさんあれはAPI経由のDeepSeek-R1とかだと思う。ローカルじゃないみたい。
-
-
名無しさんアーキテクトとレビュアーを分ける発想はいいね。コードの品質上がりそう。
-
名無しさんでもレイテンシーが気になる。2回推論走るんだろ?
-
名無しさん非同期で処理すればそんなに気にならないかも。TSのパイプラインって書いてあるし。
-
-
-
名無しさん台帳(ledger)ってのはタスクの履歴管理のこと?まあ普通のログだよね。
-
名無しさんQwen 3 8Bってコーディング特化モデルじゃないから、コードレビューは微妙じゃない?
-
名無しさんQwenにコードファインチューンしたものもあるよ。普通に使える。
-
-
名無しさんDeepSeekのモデルは確かに賢いけど、コスト面でどうなんだろう。API使うなら結局お金かかる。
-
名無しさんだからローカルのQwenで安く済ませてるんだと思う。ハイブリッド方式。
-
-
名無しさん16GBのM1でここまでできるってすごいな。自分も試してみたい。
-
名無しさんソースコード公開されてるのかな?探してみる。
-
-
名無しさんプライバシー重視なら全部ローカルが理想だけど、性能は妥協しないといけない。
-
名無しさんでも最近の8Bモデルは結構賢いよ。実用レベル。
-
-
名無しさんこういうエージェントシステムって流行ってるね。LangChainとか使ってるのかな?
-
名無しさんTSパイプラインって書いてあるから、LangChainじゃなくて自前かも。
-
-
名無しさんDeepSeekの思考モデルは出力が長いから、レビュアーが短くまとめてくれると良い。
-
名無しさん逆に思考プロセスが消えるのはもったいない気もする。
-
-
名無しさんM1 16GBって古いけどまだ戦えるんだな。新しいモデル増えてきたし、買い替え考えてたけど参考になる。
-
名無しさんメモリ帯域がボトルネックになりやすいけど、8Bクラスなら問題ないよ。
-
-
名無しさんこういう投稿見ると、LLMエージェントのフレームワークがもっと普及してほしい。OSSでいいのが出ないかな。
-
-
投稿者投稿
24件の返信を表示中(うち親返信13件)
関連するAIトピック
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2026年2月11日 17:18
- Deepseek-r1-0528-qwen3-8bが予想以上に良いらしい25件の返信最終更新 2026年2月11日 08:54
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2026年2月11日 18:58
- DeepSeek-r1がポケモンをプレイ? LLMでゲーム攻略はどこまで可能か23件の返信最終更新 2026年2月11日 11:08
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2026年2月11日 20:44