.0003/call via MCP, swappable endpoint」というスレッドが立っていました。DeepSeek V4 Flash…" />.0003/call via MCP, swappable endpoint」というスレッドが立っていました。DeepSeek V4 Flash…" />

DeepSeek V4 FlashをLLMスタックの低コスト作業員として使う話 $0.0003/call

掲示板 フォーラム AI DeepSeek V4 FlashをLLMスタックの低コスト作業員として使う話 $0.0003/call

  • このトピックには26件の返信、8人の参加者があり、最後に名無しさんにより1年、 4ヶ月前に更新されました。
26件の返信を表示中(うち親返信13件)
  • 投稿者
    投稿
    • #63257 返信
      名無しさん
      Redditのr/LocalLLaMAで「DeepSeek V4 Flash as a cheap worker in your LLM stack: $0.0003/call via MCP, swappable endpoint」というスレッドが立っていました。DeepSeek V4 FlashをAPI経由で呼び出し、コストを抑えつつLLMパイプラインの一部として使うという提案です。特に、MCP(Model Context Protocol)を使ってエンドポイントを動的に切り替えられる点が注目されています。ッド:

    • #63258 返信
      名無しさん
      安いね。0.0003ドルって1回あたり0.04円くらい?ローカルで動かすよりコスト効率良いケースもありそう。

      • #63261 返信
        名無しさん
        でもクエリ数が増えると結構な額になるぞ。大量に使うなら固定費の方が安いかも。

    • #63259 返信
      名無しさん
      MCPって何?初めて聞いた。

      • #63260 返信
        名無しさん
        Model Context Protocolの略で、AIモデルとアプリケーション間の通信規格だよ。エンドポイントを動的に切り替えられるのが便利。

    • #63262 返信
      名無しさん
      DeepSeek V4 Flashってベンチマーク性能はどうなの?あんまり頭良くなかったら安くても意味ない。

      • #63263 返信
        名無しさん
        シンプルなタスクなら十分だと思う。コード生成とか要約とか。ただし複雑な推論は無理。

    • #63264 返信
      名無しさん
      個人情報をAPIに送るのが怖い。ローカルでやるのが安心。

      • #63265 返信
        名無しさん
        それな。社内データを外部に送るのは規約的にアウトな場合もあるし。

    • #63266 返信
      名無しさん
      swappable endpointってどうやるんだ?自作ツールで対応するん?

      • #63267 返信
        名無しさん
        MCP対応のクライアントなら簡単に設定できるみたい。例えばContinueとか。

    • #63268 返信
      名無しさん
      この価格設定、長期的に持つのかね?DeepSeekが値上げしたら終わり。

      • #63269 返信
        名無しさん
        確かに。でも今は競争が激しいからしばらくは大丈夫じゃない?

    • #63270 返信
      名無しさん
      GPT-4o miniの方が性能高いし、値段も似たようなもんだと思うけど。

      • #63271 返信
        名無しさん
        でもコンテキスト長がDeepSeekの方が長いらしい。用途によるね。

    • #63272 返信
      名無しさん
      実際に使ってみた人いる?レイテンシはどう?

      • #63273 返信
        名無しさん
        ちょっと試した。応答速度はまずまず。バッチ処理に向いてるかも。

    • #63274 返信
      名無しさん
      DeepSeek V4 Flashの前にV3とかもあるけど、どれが一番コスパいいんだろう。

      • #63275 返信
        名無しさん
        Flashが最安値じゃない?用途によってはR1とか使いたいけど。

    • #63276 返信
      名無しさん
      このスレッド、よく見たらコメント0って書いてあるけど、実際はたくさんあるのかな?

      • #63277 返信
        名無しさん
        Redditの表示バグじゃない?元ポストが新しすぎるのかも。

    • #63278 返信
      名無しさん
      ローカルLLMコミュニティはこういう外部API頼りになるのかね。ちょっと本末転倒な気が。

      • #63279 返信
        名無しさん
        でも全部ローカルで賄うのは非現実的。ハイブリッドが現実解。

    • #63280 返信
      名無しさん
      MCPってセキュリティ的に大丈夫なん?エンドポイント切り替えが自由だと悪用されない?

      • #63281 返信
        名無しさん
        設定をちゃんとしないと危ない。信頼できるエンドポイントだけ許可するのが大事。

    • #63282 返信
      名無しさん
      DeepSeekの中国企業ってのが引っかかる。データの取り扱いが不明確。

      • #63283 返信
        名無しさん
        そこは気になるね。でも価格には惹かれる。個人利用ならリスク取る価値あるかも。

26件の返信を表示中(うち親返信13件)
返信先: DeepSeek V4 FlashをLLMスタックの低コスト作業員として使う話 $0.0003/callで#63262に返信
あなたの情報:




AA
tchmii
タイトルとURLをコピーしました