- このトピックには19件の返信、6人の参加者があり、最後に名無しさんにより1年、 4ヶ月前に更新されました。
19件の返信を表示中(うち親返信10件)
-
投稿者投稿
-
-
名無しさん海外のReddit、DeepSeek-V4を4枚のレガシーRTX 2080 Ti(予算約2kドル)でローカル実行したという投稿が話題になっていました。カスタムTuringカーネル、W8A8量子化により、プレフィルで255 tok/sを達成したそうです。この投稿をきっかけに、ローカルLLMのコストや性能、プライバシーについて意見が交わされています。URL:
-
名無しさんすごいな、2080Ti4枚でそんな性能が出るのか。電力消費はどうなんだろう?
-
名無しさん2080TiのTDPは250Wだから4枚で1000W、電気代が半端ないな。
-
-
名無しさんプレフィル255 tok/sってのは凄いけど、実際の生成速度はどれくらいなんだろ?
-
名無しさんカスタムTuringカーネルって何?普通の2080Tiでも動くの?
-
名無しさんどうやらCUDAカーネルをチューニングしてるみたい。OSSで公開されてるのかな。
-
-
名無しさんW8A8量子化ってのはINT8で重みとアクティベーション両方やるやつだね。精度落ちが気になる。
-
名無しさんこの予算なら中古の2080Ti4枚で2kドルってとこか。日本円で30万くらい?
-
名無しさん中古市場で1枚3万くらいだから4枚で12万、ケースや電源込みで20万くらいで組めるかも。
-
-
名無しさんDeepSeek-V4はパラメータ数いくつだっけ?671B?そんなの2080Tiで動くの?
-
名無しさん量子化と分散推論でなんとかなってるんだろう。メモリは合計44GBだからぎりぎりか。
-
-
名無しさんやっぱりローカルで動かしたいよね。API使うとプライバシーが心配だし。
-
名無しさんでもDeepSeekのAPI結構安いから、わざわざ2080Ti4枚用意するよりトークン単位で払ったほうがトータルコスト安い気がする。
-
名無しさん初期投資で済むかランニングコストかだね。電気代も馬鹿にならない。
-
-
-
名無しさんTuring世代の2080TiってNVLink使えるんだっけ?メモリ統合できるなら面白い。
-
名無しさんNVLink対応してるけど、2080Tiは2-wayまでしかサポートしてないから4枚だと通常のPCIe接続になる。帯域がネックかも。
-
-
名無しさんカスタムカーネルって部分が気になる。どんな最適化してるんだろう。
-
名無しさん多分エキスパート分散とかTuringのテンソルコア活用してるんじゃないかな。でも2080Tiのテンソルコアは遅いって話もある。
-
-
名無しさんこれって本当に実用的?実際にコード書かせたりするのに使えるレベル?
-
名無しさんRedditの投稿ではコーディングに使えたって書いてあったけど、精度はFP16より落ちるから注意が必要かも。
-
-
-
投稿者投稿
19件の返信を表示中(うち親返信10件)
関連するAIトピック
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2025年6月26日 17:23
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2025年6月26日 13:56
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2025年6月26日 15:37
- DeepSeek R1-0528のシステムプロンプトがリークされたらしい16件の返信最終更新 2025年6月25日 12:50
- AIと人間の見分けがつくか? – DeepSeek新バージョンを追加したゲームの話題18件の返信最終更新 2025年6月25日 10:56