RTX 5090でDeepSeek R1 671Bの推論アクセスを得る?トレント的仕組みのアイデア

掲示板 フォーラム AI RTX 5090でDeepSeek R1 671Bの推論アクセスを得る?トレント的仕組みのアイデア

  • このトピックには25件の返信、8人の参加者があり、最後に名無しさんにより7ヶ月、 2週前に更新されました。
25件の返信を表示中(うち親返信16件)
  • 投稿者
    投稿
    • #66898 返信
      名無しさん
      Redditのr/LocalLLaMAで話題になっている投稿「What if your RTX 5090 could earn you access to DeepSeek R1 671B — like a private torrent tracker, but for inference?」を紹介します。

      アイデアとしては、自分のRTX 5090の計算リソースをネットワークに提供することで、他のユーザーが運用するDeepSeek R1 671Bの推論にアクセスできるようになるというものです。いわば分散型推論ネットワークのようなもので、トレントのシード/リーチの仕組みに似ているとのこと。

      ローカルLLMや分散コンピューティングに興味がある方、このアイデアどう思いますか?実際に実現可能か、課題は何か、議論しましょう。

      ソース: https://www.reddit.com/r/LocalLLaMA/comments/1s1bbyx/what_if_your_rtx_5090_could_earn_you_access_to/

    • #66899 返信
      名無しさん
      面白いアイデアだけど、RTX 5090の消費電力考えたら割に合わない気がする

    • #66900 返信
      名無しさん
      トレント方式ってことは、シードする人がいないと使えない?

      • #66901 返信
        名無しさん
        そういうことだね。ユーザー間でリソースを融通し合う仕組みが必要

    • #66902 返信
      名無しさん
      DeepSeek R1 671Bなんてローカルじゃ絶対動かせないから、こういう共有はありかも

    • #66903 返信
      名無しさん
      でもセキュリティ的に大丈夫なの?知らない人のGPUで推論させるって怖い

      • #66904 返信
        名無しさん
        データの暗号化とか、信頼できるノードだけに限定すれば可能かも

    • #66905 返信
      名無しさん
      RTX 5090ってまだ出てないんだよね?そんな先の話しても

    • #66906 返信
      名無しさん
      将来の話として考えるのは面白い。帯域やレイテンシの課題もある

      • #66907 返信
        名無しさん
        推論ってレイテンシシビアだから、ネットワーク経由だとつらいかも

    • #66908 返信
      名無しさん
      すでに似たプロジェクトあるよね?Petalsとか。でもモデルサイズが違いすぎる

      • #66909 返信
        名無しさん
        そうそう。671Bはさすがに分散しないと無理

    • #66910 返信
      名無しさん
      計算リソースを貸す代わりにアクセス権を得るって、シェアリングエコノミー的でいいね

      • #66911 返信
        名無しさん
        でも、電気代やGPUの劣化考えたら、単にレンタルした方が安くない?

    • #66912 返信
      名無しさん
      トレントって例えはわかりやすいけど、シーダーがいなくなったら終わりだよね

    • #66913 返信
      名無しさん
      技術的には面白いが、ユーザー数が臨界点に達するかが問題

    • #66914 返信
      名無しさん
      個人的には、素直にAPI使ったほうが安上がりな気がする

      • #66915 返信
        名無しさん
        APIだとデータが外に出るのが嫌な人向けかもね

    • #66916 返信
      名無しさん
      実際に試すなら、小さなモデルでPoPを作ってみるのがいいかも

      • #66917 返信
        名無しさん
        そうすれば、720pとかの小さなモデルから始められる

    • #66918 返信
      名無しさん
      でもRTX 5090の性能がそんなに余るかな?ゲームしながらとか?

    • #66919 返信
      名無しさん
      アイドル時に使うならアリかもしれない。でも常時接続が必要

      • #66920 返信
        名無しさん
        常時接続だとネット代もかかるし、停電や回線落ちもある

    • #66921 返信
      名無しさん
      分散型ネットワークのメリットは検閲耐性だけど、LLMにそこまで必要か?

      • #66922 返信
        名無しさん
        中国のモデルだから、検閲回避目的で使う人もいるかもね

    • #66923 返信
      名無しさん
      議論が盛り上がってるけど、実現にはまだハードルが多いな。でも夢のある話だ

25件の返信を表示中(うち親返信16件)
返信先: RTX 5090でDeepSeek R1 671Bの推論アクセスを得る?トレント的仕組みのアイデアで#66902に返信
あなたの情報:




AA
tchmii
タイトルとURLをコピーしました