- このトピックには13件の返信、4人の参加者があり、最後に名無しさんにより7ヶ月、 3週前に更新されました。
13件の返信を表示中(うち親返信7件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAで、Jetson Orin Nano上でのLlama 3.1 8B、Qwen 2.5 7B、DeepSeek-R1 1.5Bの実測パフォーマンスが共有されていました。低コストでプライベートなLLM運用を模索する人には興味深いデータです。ソース:https://www.reddit.com/r/LocalLLaMA/comments/1ss7cqh/jetson_orin_nano_for_local_llms_realworld/
-
名無しさんこれ見たけど、8Bモデルでも結構スピード出てるんだな。トークン生成速度どのくらいだった?
-
名無しさん確かLlama 3.1 8Bで10〜15トークン/秒くらいだった気がする。Qwenも似たような感じ。DeepSeek-R1 1.5Bはもっと速かった。
-
-
名無しさんJetson Orin Nanoって値段の割に結構使えるんだな。でも消費電力はどうなの?
-
名無しさん15Wくらいじゃなかったっけ。Raspberry Piよりは食うけど、GPU積んでるから仕方ない。
-
-
名無しさんDeepSeek-R1 1.5Bは軽いけど、性能どうなんだろう。コード生成とかには使えるのか?
-
名無しさん1.5Bだと簡単なコード補完くらいなら使えるけど、複雑なのは無理。やっぱり8B以上欲しい。でもローカルで動くのは安心感ある。
-
-
名無しさんこのベンチマーク、量子化方式とか気になる。GGUF?それともExLlama?
-
名無しさん多分GGUFの4ビット量子化だと思う。JetsonだとTegra GPU向けに最適化してるみたい。
-
-
名無しさんこういうデータは参考になる。自分も試してみようかな。でもCUDAコア少ないから大量トークンは厳しそう。
-
名無しさん実際に使うなら、1回の応答が数百トークンまでなら実用的。長文生成には向かない。
-
-
名無しさんRedditのスレッド見てきたけど、Opの環境とか細かい設定も載ってて参考になった。日本のフォーラムでもこういう情報共有したいね。
-
名無しさんそうそう。ただしRedditの情報は鵜呑みにしないほうがいい。実際に環境再現してみないと。
-
-
名無しさんJetson以外に、Intel N100とかでも似たようなベンチ欲しいな。ローカルLLMのハード選びは悩む。
-
-
投稿者投稿
13件の返信を表示中(うち親返信7件)
関連するAIトピック
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2026年2月11日 17:18
- Deepseek-r1-0528-qwen3-8bが予想以上に良いらしい25件の返信最終更新 2026年2月11日 08:54
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2026年2月11日 18:58
- DeepSeek-r1がポケモンをプレイ? LLMでゲーム攻略はどこまで可能か23件の返信最終更新 2026年2月11日 11:08
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2026年2月11日 20:44