DeepSeek V2/V2.5/R1/V3等のフルモデル用LoRAアダプターありますか?

掲示板 フォーラム AI DeepSeek V2/V2.5/R1/V3等のフルモデル用LoRAアダプターありますか?

  • このトピックには19件の返信、6人の参加者があり、最後に名無しさんにより8ヶ月、 3週前に更新されました。
19件の返信を表示中(うち親返信9件)
  • 投稿者
    投稿
    • #61949 返信
      名無しさん
      Reddit r/LocalLLaMAで「DeepSeekのフルモデル(蒸留じゃないやつ)向けのLoRAアダプターを知ってる?」というスレッドが立ちました。V2, V2.5, R1, V3, V3.1, V3.2など、フルサイズのDeepSeekモデルに適用可能なLoRAを探しているようです。コメントでは、コード生成やコスト、プライバシー、ベンチマーク比較などが話題になっていました。みなさんはこういったアダプターの存在を知っていますか?ローカルで動かす際の注意点などあれば教えてください。

    • #61950 返信
      名無しさん
      自分も探してる。HuggingFaceでいくつか見つけたけど、ほとんどが蒸留モデル用だった。

    • #61951 返信
      名無しさん
      フルモデルってパラメータ数が膨大だから、LoRAでも学習が大変そう。

      • #61952 返信
        名無しさん
        確かに、VRAM消費が半端ない。でもQLoRAならいけるかも。

    • #61953 返信
      名無しさん
      DeepSeek R1なら結構出てるよ。ただしコーディング特化のやつが多い。

      • #61954 返信
        名無しさん
        それってベンチマークでどの程度差が出るの?興味ある。

        • #61955 返信
          名無しさん
          人間の評価だと微妙だけど、コード生成のタスクでは明らかに向上してるらしい。

    • #61956 返信
      名無しさん
      フルモデルのLoRAって、そもそも公開が少ないよね。メモリ制限で個人が作るのが難しいから?

      • #61957 返信
        名無しさん
        そうかも。企業は蒸留モデルに注力してるし、コミュニティも小さめ。

    • #61958 返信
      名無しさん
      自分はV3.1使ってるけど、LoRAなしでも十分な気がする。

      • #61959 返信
        名無しさん
        用途によるよ。汎用ならベースでいいけど、特定ドメインならLoRAあった方がいい。

    • #61960 返信
      名無しさん
      Redditのスレでも話題になってたけど、HuggingFaceのフィルターが不十分で探しにくい。

      • #61961 返信
        名無しさん
        モデル名で検索して、LoRAタグがついてるものを地道にチェックするしかない。

    • #61962 返信
      名無しさん
      個人的にはQLoRAで自作するのが一番確実。時間はかかるけど。

      • #61963 返信
        名無しさん
        データセットは何使ってる?公開されてる日本語データセットだと品質が…

        • #61964 返信
          名無しさん
          自分は英語のコーディングデータセットでやってる。日本語は少ないね。

    • #61965 返信
      名無しさん
      蒸留モデルで十分って意見も多いけど、フルモデルのポテンシャルを引き出したい気持ちもわかる。

      • #61966 返信
        名無しさん
        現実的にはコスパの問題。ローカルで動かすなら蒸留で妥協するのも手。

    • #61967 返信
      名無しさん
      誰かまとめてリポジトリ作ってくれないかな。

      • #61968 返信
        名無しさん
        自分で作るのが面倒なら、AnthropicやOpenAIのAPI使う方が早いかも。

19件の返信を表示中(うち親返信9件)
返信先: DeepSeek V2/V2.5/R1/V3等のフルモデル用LoRAアダプターありますか?で#61956に返信
あなたの情報:




AA
tchmii
タイトルとURLをコピーしました