- このトピックには23件の返信、7人の参加者があり、最後に名無しさんにより1年、 3ヶ月前に更新されました。
23件の返信を表示中(うち親返信12件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAで話題になっているDeepSeek V4-Flashのスレッドを紹介します。13Bのアクティブパラメータを持ち、量子化すれば128GB Macでも動くかもしれないとのこと。コード生成やコスト、プライバシー面での評価が議論されています。ッド:
-
名無しさんこれすごいな。13Bでこれだけできるなら、ローカルLLMの選択肢が広がる。
-
名無しさんでも実際のベンチマークはどうなの?既存の7Bモデルと比較してどのくらい差がある?
-
名無しさんRedditのコメント見ると、GSM8KやHumanEvalで高いスコア出してるみたい。ただし検証が必要。
-
名無しさん自分でベンチマーク取らないとね。他人のスコアはあてにならない。
-
-
-
-
名無しさん128GB Macってまだ高いけど、量子化で動くなら試してみたい。
-
名無しさん128GB MacってM1 Ultraとか?メモリ帯域も重要だからそこも考慮しないと。
-
名無しさんM1 Ultraのメモリ帯域は800GB/sだから、推論速度も期待できる。
-
-
-
名無しさんコード生成ならDeepSeekは結構優秀って聞くけど、V4-Flashは特にCoder向けなのかな。
-
名無しさんCoder向けっていうより汎用モデルっぽい。でもコードも得意らしい。
-
-
名無しさんプライバシー重視ならローカル運用は正義。クラウドAPI使いたくない人には朗報。
-
名無しさん量子化ビット数が気になる。4bitでどれだけ性能落ちるんだろ。
-
名無しさん13Bアクティブパラメータってことは、全体ではもっと大きいのか?MoE構造?
-
名無しさんそう、MoEで総パラメータは100B以上あるって話。アクティブは13Bだけ。
-
-
名無しさんそれならVRAM消費は13B相当で済むのか。良い設計だな。
-
名無しさんアクティブパラメータだけなら、既存の13Bモデルと同程度のリ済むから嬉しい。
-
-
名無しさんでもAPIの方がコスト安いんじゃない?電気代考えると。
-
名無しさん長期的にはローカルの方が安い場合もある。特に頻繁に使うなら。
-
-
名無しさん競合のQwenとかと比べてどうなんだろう。
-
名無しさんRedditではDeepSeekの方がコーディング性能高いって意見多い。でも好みの問題かも。
-
-
名無しさん128GB Mac持ってないから、普通のPCで動かす方法も考えないと。
-
名無しさんGPUメモリ24GBあれば4bit量子化でなんとか動くかも。ただし速度は遅い。
-
-
名無しさんとりあえずHugging Faceでモデル公開されたら試してみる。
-
名無しさんでも品質が13Bモデル並みなら、素直に大きいモデル使う方が良くない?
-
-
投稿者投稿
23件の返信を表示中(うち親返信12件)
関連するAIトピック
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2025年6月26日 17:23
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2025年6月26日 13:56
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2025年6月26日 15:37
- DeepSeek R1-0528のシステムプロンプトがリークされたらしい16件の返信最終更新 2025年6月25日 12:50
- AIと人間の見分けがつくか? – DeepSeek新バージョンを追加したゲームの話題18件の返信最終更新 2025年6月25日 10:56