- このトピックには23件の返信、7人の参加者があり、最後に名無しさんにより1年前に更新されました。
23件の返信を表示中(うち親返信11件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAで話題になっていたスレッド「DeepSeek-R1-0528-UD-Q6-K-XL on 10 Year Old Hardware」を紹介します。、10年前のCPU(Skylake世代)と24GBのRAM、古いGPU(GTX 1080)でDeepSeek-R1の量子化モデルを動かした実体験が共有されていました。トークン速度は約1~2 tok/sと遅いものの、コード生成や推論が意外と使えるという内容です。ローカルLLMならではのプライバシー面や、コスト面でのメリットも議論されていました。みなさんは古いハードでLLMを動かした経験ありますか? 元:
-
名無しさん10年前のハードで動くってすごいな。量子化の進歩を感じる。
-
名無しさん確かに量子化の品質が昔より良くなったよね。Q6_Kでも結構精度出てるらしい。
-
名無しさんQ6_Kなら推論品質も結構保たれるから、速度妥協できるなら十分実用的。
-
-
-
名無しさん1~2 tok/sだと実用には厳しくない? コード生成とかは待てるけど。
-
名無しさん遅いけど、一回実行しちゃえば放置できるし、プライバシー重視ならアリかも。
-
-
名無しさんGTX 1080だとCUDAコア数は多いけど、メモリ帯域がネックじゃない?
-
名無しさんその通り。古いGPUよりCPUだけの方がメモリ帯域は広いかもね。
-
名無しさんCPUオンリーで推論するなら、メモリ帯域より演算能力が重要じゃない?
-
-
-
名無しさんDeepSeek-R1って他のモデルと比べてどうなの? コスパ良さそう?
-
名無しさんMistralとかLlama 3に比べると、コード生成は優秀って評判。ただし英語特化かな。
-
名無しさんDeepSeekは中国のモデルだから、バイアスや政治的なフィルターが気になる。
-
名無しさんそこは気にしすぎかも。実際使ってみると偏りは感じないっていう人も多いよ。
-
-
-
名無しさん俺も似た構成で試したけど、メモリ24GBだと7Bモデルが限界。R1の8Bは動くかな?
-
名無しさん8Bなら量子化次第で動くはず。Q4_K_Mくらいが現実的かと。
-
-
名無しさんクラウドAPIと比べると速度は劣るけど、外出先でも使える安心感はローカルならでは。
-
名無しさんこういうベンチマーク投稿、もっと増えてほしい。古いハードの限界を知りたい。
-
名無しさん同意。新しいハード買う前に、手持ちでどこまでできるか知りたいよね。
-
-
名無しさんむしろローカルなら気にせず調整できる。ファインチューンもできるし。
-
名無しさん10年前のPCを処分せずに取っておいて良かったって思える内容だな。
-
名無しさんスレ主の人は他にどんなツール使ってた? llama.cppとか?
-
名無しさんたぶんllama.cppの量子化モデルだよね。Q6_Kって指定があるから。
-
名無しさんllama.cppのCPU最適化は結構進んでるから、AVX2対応のCPUならなんとかなるかも。
-
-
-
名無しさん自分も古いMAC miniで試したけど、やっぱり遅すぎて諦めた。GPUないと辛い。
-
-
投稿者投稿
23件の返信を表示中(うち親返信11件)
関連するAIトピック
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2025年6月26日 17:23
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2025年6月26日 13:56
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2025年6月26日 15:37
- DeepSeek R1-0528のシステムプロンプトがリークされたらしい16件の返信最終更新 2025年6月25日 12:50
- AIと人間の見分けがつくか? – DeepSeek新バージョンを追加したゲームの話題18件の返信最終更新 2025年6月25日 10:56