- このトピックには24件の返信、8人の参加者があり、最後に名無しさんにより8ヶ月、 1週前に更新されました。
24件の返信を表示中(うち親返信8件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAで話題のDeepseek-v4-flash。OpenRouter経由で動作させた動画が投稿されたようです。モデルの性能、コスト、プライバシーなどについて議論しましょう。元
-
名無しさん動画見たけど結構速そうだね。OpenRouterってAPI使うんだっけ?
-
名無しさんそう、API経由でモデルを呼び出すサービス。v4-flashは軽量で速いらしい。
-
-
名無しさんでもOpenRouterって従量課金だよね?個人で使うにはどうなんだろ。
-
名無しさん確かにコストは気になる。けどローカルで動かすよりは手軽だし、高性能なモデルを試せるのはいいね。
-
-
名無しさんDeepseekシリーズは中国製だからプライバシーが心配っていう意見も見るな。
-
名無しさんその辺は使うデータ次第だと思う。機密情報を扱わなければそんなに問題ないんじゃない?
-
名無しさんAPI経由ならなおさらデータがどこに行くかわからんから、そこは注意だな。
-
-
-
名無しさんベンチマークスコアはどうなってるんだろう?Llama 3.1 8Bと比べてどう?
-
名無しさんv4-flashはマルチモーダル対応で、コード生成も得意って聞いた。実際に使ってみないとわからんけど。
-
名無しさんOpenRouterのページでベンチマーク見れるよ。結構いいスコア出てた気がする。
-
名無しさんそれ見てみるわ。ありがとう。
-
-
-
名無しさん動画はどっかで見れるの?リンク貼ってほしい。
-
名無しさんRedditのスレッドに直接動画が貼ってあるよ。上のURLから飛べる。
-
名無しさんサンクス。後で見てみる。
-
-
-
名無しさん個人的にはローカルで動くモデルの方が安心するけど、v4-flashは量子化版もあるらしいね。
-
名無しさんそうそう、llama.cppとかで使えるQ4_K_Mとか。VRAM 6GBくらいあれば動くって噂。
-
名無しさんそれはいいね。うちの3060で試せるかも。
-
名無しさん3060の12GBなら余裕じゃない?自分は8GBだけどQ4ならいけるかな。
-
名無しさん8GBでもQ4_K_Mならコンテキスト次第で動くと思う。試す価値あり。
-
-
-
-
-
名無しさんOpenRouterってv4-flashの値段いくらなんだろ?他のモデルと比べてどう?
-
名無しさんOpenRouterの価格ページ見たら、入力トークンあたり$0.15/M、出力$0.60/Mだったかな。安い方だと思う。
-
名無しさん結構リーズナブルだね。個人利用なら全然アリだわ。
-
-
-
名無しさんでも結局は用途次第だよね。チャットボットならこれで十分だけど、専門的なタスクにはもっと大きいモデルが必要かも。
-
名無しさんそうそう。v4-flashは小〜中規模のタスクに最適化されてるから、使い分けが大事。
-
-
-
投稿者投稿
24件の返信を表示中(うち親返信8件)
関連するAIトピック
- DeepSeek-R1-0528の蒸留版、Devstral、必要だと思う?24件の返信最終更新 2026年2月10日 07:21
- DeepSeek R1-0528-Qwen3-8Bが無限ツールループに陥る問題、対処法ある?20件の返信最終更新 2026年2月10日 12:32
- DeepSeek-R1-0528のQwen3 8Bへの蒸留モデル、実際どうなの?14件の返信最終更新 2026年2月10日 04:36
- DeepSeek R1-0528のシステムプロンプトがリークされたらしい16件の返信最終更新 2026年2月10日 16:11
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2026年2月11日 20:44