DeepSeekやQwenのコード生成モデルをセルフホストしてる人いる？無制限利用のために

このトピックには19件の返信、6人の参加者があり、最後に名無しさんにより7ヶ月前に更新されました。

19件の返信を表示中（うち親返信12件）

投稿者

投稿
- #69118 返信
  
  名無しさん
  
  DeepSeekやQwenのコード生成モデルをセルフホストして、無制限に使っている人はいますか？Redditのr/LocalLLaMAで同様の議論がありました（）。コスト、プライバシー、ベンチマークなど、実際に使っている人の体験を聞きたいです。
- #69119 返信
  
  名無しさん
  
  お、面白い話題だね。自分も気になってる。コスト面とかどうなんだろう。
  - #69120 返信
    
    名無しさん
    
    うちはQwen2.5-Coder 7BをRTX 3090で動かしてる。普通のコード補完なら十分使えるよ。
    - #69122 返信
      
      名無しさん
      
      どのくらいメモリ使ってる？llama.cppで動かしてる？
- #69121 返信
  
  名無しさん
  
  ハードウェアはどれくらい必要？メモリやVRAMの目安を教えて。
- #69123 返信
  
  名無しさん
  
  DeepSeekの方が複雑なタスクには向いてると思う。でもモデルサイズが大きいからね。
  - #69124 返信
    
    名無しさん
    
    僕はQwenの方がシンプルな補完は速いと感じる。用途によるかも。
- #69125 返信
  
  名無しさん
  
  セルフホストだとレイテンシー高いし、たまに使うだけならAPIの方が安上がりじゃない？
- #69126 返信
  
  名無しさん
  
  企業のコードとか機密情報を扱うならセルフホスト一択だよね。
  - #69127 返信
    
    名無しさん
    
    実はDeepSeek Coder 33Bもオープンで、量子化すれば割と動くよ。
- #69128 返信
  
  名無しさん
  
  ollamaとかLM Studio使うとセットアップ簡単だよ。初心者向け。
- #69129 返信
  
  名無しさん
  
  でも性能は環境によるから、ちゃんとベンチマークした方がいい。
- #69130 返信
  
  名無しさん
  
  うちでベンチマークしたけど、Qwen 14Bがバランス良かった。自分のハードには合ってた。
  - #69131 返信
    
    名無しさん
    
    どんなハード？俺は2枚の3090なんだけど。
    - #69132 返信
      
      名無しさん
      
      2枚なら70Bも4bitで動くよ。試してみたら？
- #69133 返信
  
  名無しさん
  
  70Bはオーバースペックじゃない？32Bで十分だと思うけど。
- #69134 返信
  
  名無しさん
  
  GPUメモリが8GBしかないんだけど、何か動かせる？
  - #69135 返信
    
    名無しさん
    
    7Bを量子化すれば動くよ。でもコード生成なら14B推奨。
- #69136 返信
  
  名無しさん
  
  あとllama.cppのGPUアクセラレーション使うと速くなるよ。設定次第。
- #69137 返信
  
  名無しさん
  
  いろいろ試してみるわ。情報ありがとう。
投稿者

投稿

19件の返信を表示中（うち親返信12件）

返信先: DeepSeekやQwenのコード生成モデルをセルフホストしてる人いる？無制限利用のためにで#69127に返信

あなたの情報:

お名前 (必須)

メール (非公開) (必須):

ウェブサイト:

キャンセル

関連するAIトピック