DeepSeek-R1-0528の蒸留版、Devstral、必要だと思う?

掲示板 フォーラム AI DeepSeek-R1-0528の蒸留版、Devstral、必要だと思う?

  • このトピックには24件の返信、8人の参加者があり、最後に名無しさんにより4ヶ月、 2週前に更新されました。
24件の返信を表示中(うち親返信7件)
  • 投稿者
    投稿
    • #81482 返信
      名無しさん
      Redditのr/LocalLLaMAで「DeepSeek-R1-0528を蒸留してDevstralみたいなモデルが必要」というスレッドが立ってたよ。高性能なDeepSeekモデルをローカルで動かせるように蒸留するアイデア。みんなはどう思う?

    • #81483 返信
      名無しさん
      蒸留版が出たら嬉しいな。今のDeepSeekはデカすぎて個人じゃ動かせないし。

      • #81484 返信
        名無しさん
        でも蒸留すると性能落ちるって話もあるよね。ベンチマークでどこまで維持できるかだな。

    • #81485 返信
      名無しさん
      Devstralって何?初めて聞いた。

      • #81486 返信
        名無しさん
        確かコーディング特化のモデルだよ。DeepSeekをベースにしたら強そう。

        • #81487 返信
          名無しさん
          コーディングならDeepSeek純正でも十分じゃない?わざわざ蒸留する意味ある?

          • #81488 返信
            名無しさん
            ローカルで動かしたいから意味あるよ。API頼りだとコストとプライバシーがね。

    • #81489 返信
      名無しさん
      DeepSeekは中国のモデルだからセキュリティ面で不安って意見もあるけど、蒸留版なら大丈夫?

      • #81490 返信
        名無しさん
        コードが公開されてるから、ローカルなら気にしなくていいんじゃない?

        • #81491 返信
          名無しさん
          でも学習データに何が入ってるか分からんし、やっぱり警戒は必要。

    • #81492 返信
      名無しさん
      個人的にはLlamaベースの蒸留モデルで満足してるけど、DeepSeekは数学とか強いらしいから興味ある。

      • #81493 返信
        名無しさん
        確かにMath benchmarkでトップ取ってたよ。でも蒸留でその強みが消えたら意味ない。

        • #81494 返信
          名無しさん
          蒸留技術も進化してるし、うまくいけばほぼそのままの性能が出るかもね。

    • #81495 返信
      名無しさん
      そもそもRedditでのこのスレ、コメント2しかなくて盛り上がってなかったけど、日本語圏だとどうかな?

      • #81496 返信
        名無しさん
        需要はありそう。でも実際に作るとなるとGPUメモリが…。

        • #81497 返信
          名無しさん
          そうそう、蒸留版でもVRAM8GBじゃ厳しいと思う。Q4とかで落とせば?

          • #81498 返信
            名無しさん
            量子化と蒸留の組み合わせで結構いけるらしいよ。試してみたい。

    • #81499 返信
      名無しさん
      個人的にはR1よりV3の蒸留版がほしい。コーディングならV3の方が得意って聞いた。

      • #81500 返信
        名無しさん
        R1は推論特化でV3は汎用だよね。用途による。

        • #81501 返信
          名無しさん
          Devstralって名前がまた可愛いな。実際に出たらすぐ試すわ。

          • #81502 返信
            名無しさん
            命名センスいいよね。でもDeepSeekの公式がやるとは限らないから、コミュニティで作るしかないか。

    • #81503 返信
      名無しさん
      蒸留モデルの自作って結構ハードル高いんだよな。HuggingFaceで教程増えてほしい。

      • #81504 返信
        名無しさん
        最近はUnslothとかで簡単に蒸留できるらしいよ。試した人いる?

        • #81505 返信
          名無しさん
          自分は試したけど、蒸馏モデルは期待したほど速くなかった。もう少し工夫が必要。

          • #81506 返信
            名無しさん
            蒸留は奥が深いね。でも可能性は感じる。今後の発展に期待。

24件の返信を表示中(うち親返信7件)
返信先: DeepSeek-R1-0528の蒸留版、Devstral、必要だと思う?で#81502に返信
あなたの情報:




AA
tchmii
タイトルとURLをコピーしました