- このトピックには13件の返信、4人の参加者があり、最後に名無しさんにより7ヶ月、 3週前に更新されました。
13件の返信を表示中(うち親返信7件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAで、Jetson Orin Nano上でのLlama 3.1 8B、Qwen 2.5 7B、DeepSeek-R1 1.5Bの実測パフォーマンスが共有されていました。低コストでプライベートなLLM運用を模索する人には興味深いデータです。
-
名無しさんこれ見たけど、8Bモデルでも結構スピード出てるんだな。トークン生成速度どのくらいだった?
-
名無しさん確かLlama 3.1 8Bで10〜15トークン/秒くらいだった気がする。Qwenも似たような感じ。DeepSeek-R1 1.5Bはもっと速かった。
-
-
名無しさんJetson Orin Nanoって値段の割に結構使えるんだな。でも消費電力はどうなの?
-
名無しさん15Wくらいじゃなかったっけ。Raspberry Piよりは食うけど、GPU積んでるから仕方ない。
-
-
名無しさんDeepSeek-R1 1.5Bは軽いけど、性能どうなんだろう。コード生成とかには使えるのか?
-
名無しさん1.5Bだと簡単なコード補完くらいなら使えるけど、複雑なのは無理。やっぱり8B以上欲しい。でもローカルで動くのは安心感ある。
-
-
名無しさんこのベンチマーク、量子化方式とか気になる。GGUF?それともExLlama?
-
名無しさん多分GGUFの4ビット量子化だと思う。JetsonだとTegra GPU向けに最適化してるみたい。
-
-
名無しさんこういうデータは参考になる。自分も試してみようかな。でもCUDAコア少ないから大量トークンは厳しそう。
-
名無しさん実際に使うなら、1回の応答が数百トークンまでなら実用的。長文生成には向かない。
-
-
名無しさんRedditのスレッド見てきたけど、Opの環境とか細かい設定も載ってて参考になった。日本のフォーラムでもこういう情報共有したいね。
-
名無しさんそうそう。ただしRedditの情報は鵜呑みにしないほうがいい。実際に環境再現してみないと。
-
-
名無しさんJetson以外に、Intel N100とかでも似たようなベンチ欲しいな。ローカルLLMのハード選びは悩む。
-
-
投稿者投稿
13件の返信を表示中(うち親返信7件)
関連するAIトピック
- NexusNetworkの学会リジェクトに関する議論26件の返信最終更新 2025年4月2日 10:10
- ML系学会の査読者、最初のスコアを下げることってどのくらいある?20件の返信最終更新 2025年4月3日 07:51
- 最近の話題について語ろう24件の返信最終更新 2025年4月2日 06:25
- 機械学習のアンラーニングとモデル編集ワークショップ(UME)について21件の返信最終更新 2025年4月1日 00:40
- ECCV 2026のリバッタル可視性問題について19件の返信最終更新 2025年4月1日 04:25