DeepSeek V4 FlashをLLMスタックの低コスト作業員として使う話　$0.0003/call

名無しさん · 2025-06-28T16:54:33+09:00

Redditのr/LocalLLaMAで「DeepSeek V4 Flash as a cheap worker in your LLM stack: $0.0003/call via MCP, swappable endpoint」というスレッドが立っていました。DeepSeek V4 FlashをAPI経由で呼び出し、コストを抑えつつLLMパイプラインの一部として使うという提案です。特に、MCP（Model Context Protocol）を使ってエンドポイントを動的に切り替えられる点が注目されています。ッド:

このトピックには26件の返信、8人の参加者があり、最後に名無しさんにより12ヶ月前に更新されました。

26件の返信を表示中（うち親返信13件）

投稿者

投稿
- 2025年6月28日 4:54 PM #63257 返信
  
  名無しさん
  
  Redditのr/LocalLLaMAで「DeepSeek V4 Flash as a cheap worker in your LLM stack: $0.0003/call via MCP, swappable endpoint」というスレッドが立っていました。DeepSeek V4 FlashをAPI経由で呼び出し、コストを抑えつつLLMパイプラインの一部として使うという提案です。特に、MCP（Model Context Protocol）を使ってエンドポイントを動的に切り替えられる点が注目されています。ッド:
- 2025年6月28日 4:56 PM #63258 返信
  
  名無しさん
  
  安いね。0.0003ドルって1回あたり0.04円くらい？ローカルで動かすよりコスト効率良いケースもありそう。
  - 2025年6月28日 5:10 PM #63261 返信
    
    名無しさん
    
    でもクエリ数が増えると結構な額になるぞ。大量に使うなら固定費の方が安いかも。
- 2025年6月28日 4:59 PM #63259 返信
  
  名無しさん
  
  MCPって何？初めて聞いた。
  - 2025年6月28日 5:03 PM #63260 返信
    
    名無しさん
    
    Model Context Protocolの略で、AIモデルとアプリケーション間の通信規格だよ。エンドポイントを動的に切り替えられるのが便利。
- 2025年6月28日 5:12 PM #63262 返信
  
  名無しさん
  
  DeepSeek V4 Flashってベンチマーク性能はどうなの？あんまり頭良くなかったら安くても意味ない。
  - 2025年6月28日 5:15 PM #63263 返信
    
    名無しさん
    
    シンプルなタスクなら十分だと思う。コード生成とか要約とか。ただし複雑な推論は無理。
- 2025年6月28日 5:21 PM #63264 返信
  
  名無しさん
  
  個人情報をAPIに送るのが怖い。ローカルでやるのが安心。
  - 2025年6月28日 5:30 PM #63265 返信
    
    名無しさん
    
    それな。社内データを外部に送るのは規約的にアウトな場合もあるし。
- 2025年6月28日 5:32 PM #63266 返信
  
  名無しさん
  
  swappable endpointってどうやるんだ？自作ツールで対応するん？
  - 2025年6月28日 5:34 PM #63267 返信
    
    名無しさん
    
    MCP対応のクライアントなら簡単に設定できるみたい。例えばContinueとか。
- 2025年6月28日 5:38 PM #63268 返信
  
  名無しさん
  
  この価格設定、長期的に持つのかね？DeepSeekが値上げしたら終わり。
  - 2025年6月28日 5:45 PM #63269 返信
    
    名無しさん
    
    確かに。でも今は競争が激しいからしばらくは大丈夫じゃない？
- 2025年6月28日 5:56 PM #63270 返信
  
  名無しさん
  
  GPT-4o miniの方が性能高いし、値段も似たようなもんだと思うけど。
  - 2025年6月28日 5:58 PM #63271 返信
    
    名無しさん
    
    でもコンテキスト長がDeepSeekの方が長いらしい。用途によるね。
- 2025年6月28日 6:01 PM #63272 返信
  
  名無しさん
  
  実際に使ってみた人いる？レイテンシはどう？
  - 2025年6月28日 6:06 PM #63273 返信
    
    名無しさん
    
    ちょっと試した。応答速度はまずまず。バッチ処理に向いてるかも。
- 2025年6月28日 6:13 PM #63274 返信
  
  名無しさん
  
  DeepSeek V4 Flashの前にV3とかもあるけど、どれが一番コスパいいんだろう。
  - 2025年6月28日 6:16 PM #63275 返信
    
    名無しさん
    
    Flashが最安値じゃない？用途によってはR1とか使いたいけど。
- 2025年6月28日 6:19 PM #63276 返信
  
  名無しさん
  
  このスレッド、よく見たらコメント0って書いてあるけど、実際はたくさんあるのかな？
  - 2025年6月28日 6:25 PM #63277 返信
    
    名無しさん
    
    Redditの表示バグじゃない？元ポストが新しすぎるのかも。
- 2025年6月28日 6:35 PM #63278 返信
  
  名無しさん
  
  ローカルLLMコミュニティはこういう外部API頼りになるのかね。ちょっと本末転倒な気が。
  - 2025年6月28日 6:37 PM #63279 返信
    
    名無しさん
    
    でも全部ローカルで賄うのは非現実的。ハイブリッドが現実解。
- 2025年6月28日 6:39 PM #63280 返信
  
  名無しさん
  
  MCPってセキュリティ的に大丈夫なん？エンドポイント切り替えが自由だと悪用されない？
  - 2025年6月28日 6:44 PM #63281 返信
    
    名無しさん
    
    設定をちゃんとしないと危ない。信頼できるエンドポイントだけ許可するのが大事。
- 2025年6月28日 6:50 PM #63282 返信
  
  名無しさん
  
  DeepSeekの中国企業ってのが引っかかる。データの取り扱いが不明確。
  - 2025年6月28日 7:02 PM #63283 返信
    
    名無しさん
    
    そこは気になるね。でも価格には惹かれる。個人利用ならリスク取る価値あるかも。
投稿者

投稿

26件の返信を表示中（うち親返信13件）

返信先: DeepSeek V4 FlashをLLMスタックの低コスト作業員として使う話　$0.0003/callで#63264に返信

あなたの情報:

お名前 (必須)

メール (非公開) (必須):

ウェブサイト:

キャンセル

関連するAIトピック