Jetson Orin NanoでローカルLLMの実性能：Llama 3.1 8B、Qwen 2.5 7B、DeepSeek-R1 1.5Bのベンチマ...

名無しさん · 2025-11-02T11:50:59+09:00

Redditのr/LocalLLaMAで、Jetson Orin Nano上でのLlama 3.1 8B、Qwen 2.5 7B、DeepSeek-R1 1.5Bの実測パフォーマンスが共有されていました。低コストでプライベートなLLM運用を模索する人には興味深いデータです。

このトピックには13件の返信、4人の参加者があり、最後に名無しさんにより7ヶ月、 3週前に更新されました。

13件の返信を表示中（うち親返信7件）

投稿者

投稿
- 2025年11月2日 11:50 AM #66228 返信
  
  名無しさん
  
  Redditのr/LocalLLaMAで、Jetson Orin Nano上でのLlama 3.1 8B、Qwen 2.5 7B、DeepSeek-R1 1.5Bの実測パフォーマンスが共有されていました。低コストでプライベートなLLM運用を模索する人には興味深いデータです。
- 2025年11月2日 11:52 AM #66229 返信
  
  名無しさん
  
  これ見たけど、8Bモデルでも結構スピード出てるんだな。トークン生成速度どのくらいだった？
  - 2025年11月2日 11:55 AM #66230 返信
    
    名無しさん
    
    確かLlama 3.1 8Bで10〜15トークン/秒くらいだった気がする。Qwenも似たような感じ。DeepSeek-R1 1.5Bはもっと速かった。
- 2025年11月2日 11:59 AM #66231 返信
  
  名無しさん
  
  Jetson Orin Nanoって値段の割に結構使えるんだな。でも消費電力はどうなの？
  - 2025年11月2日 12:06 PM #66232 返信
    
    名無しさん
    
    15Wくらいじゃなかったっけ。Raspberry Piよりは食うけど、GPU積んでるから仕方ない。
- 2025年11月2日 12:08 PM #66233 返信
  
  名無しさん
  
  DeepSeek-R1 1.5Bは軽いけど、性能どうなんだろう。コード生成とかには使えるのか？
  - 2025年11月2日 12:12 PM #66234 返信
    
    名無しさん
    
    1.5Bだと簡単なコード補完くらいなら使えるけど、複雑なのは無理。やっぱり8B以上欲しい。でもローカルで動くのは安心感ある。
- 2025年11月2日 12:18 PM #66235 返信
  
  名無しさん
  
  このベンチマーク、量子化方式とか気になる。GGUF？それともExLlama？
  - 2025年11月2日 12:27 PM #66236 返信
    
    名無しさん
    
    多分GGUFの4ビット量子化だと思う。JetsonだとTegra GPU向けに最適化してるみたい。
- 2025年11月2日 12:28 PM #66237 返信
  
  名無しさん
  
  こういうデータは参考になる。自分も試してみようかな。でもCUDAコア少ないから大量トークンは厳しそう。
  - 2025年11月2日 12:31 PM #66238 返信
    
    名無しさん
    
    実際に使うなら、1回の応答が数百トークンまでなら実用的。長文生成には向かない。
- 2025年11月2日 12:35 PM #66239 返信
  
  名無しさん
  
  Redditのスレッド見てきたけど、Opの環境とか細かい設定も載ってて参考になった。日本のフォーラムでもこういう情報共有したいね。
  - 2025年11月2日 12:41 PM #66240 返信
    
    名無しさん
    
    そうそう。ただしRedditの情報は鵜呑みにしないほうがいい。実際に環境再現してみないと。
- 2025年11月2日 12:53 PM #66241 返信
  
  名無しさん
  
  Jetson以外に、Intel N100とかでも似たようなベンチ欲しいな。ローカルLLMのハード選びは悩む。
投稿者

投稿

13件の返信を表示中（うち親返信7件）

返信先: Jetson Orin NanoでローカルLLMの実性能：Llama 3.1 8B、Qwen 2.5 7B、DeepSeek-R1 1.5Bのベンチマ…で#66239に返信

あなたの情報:

お名前 (必須)

メール (非公開) (必須):

ウェブサイト:

キャンセル

関連するAIトピック