Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?

掲示板 フォーラム AI Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?

  • このトピックには15件の返信、5人の参加者があり、最後に名無しさんにより4ヶ月、 2週前に更新されました。
15件の返信を表示中(うち親返信8件)
  • 投稿者
    投稿
    • #81740 返信
      名無しさん
      Reddit r/LocalLLaMAで話題の投稿によると、Qwenが32Bと235Bのベースモデルを公開していないとのこと。DeepSeekによるモデル蒸留を防ぐためではないかと推測されています。オープンソースAIコミュニティへの影響や、今後のモデル公開ポリシーについて議論しましょう。元の投稿URL: https://www.reddit.com/r/LocalLLaMA/comments/1kybdzn/qwen_withholds_32b235b_base_models_presumably_so/

    • #81741 返信
      名無しさん
      これ本当なら残念だね。Qwenのモデル結構使ってたのに。

      • #81743 返信
        名無しさん
        でもビジネス的な判断としては理解できるよ。自社の技術を守りたいんだろう。

    • #81742 返信
      名無しさん
      DeepSeekの蒸留は確かにすごいけど、オープンソースの精神に反する気がする。

      • #81744 返信
        名無しさん
        オープンソースと言っても結局は企業の戦略次第だよね。QwenはAlibabaだし。

    • #81745 返信
      名無しさん
      235Bって結構大きいから、ローカルで動かすのは大変だけどね。

      • #81746 返信
        名無しさん
        確かに。32Bでも十分難しいのに、235Bなんてクラウド専用だわ。

    • #81747 返信
      名無しさん
      蒸留ってそんなに脅威なのかな?DeepSeekのモデル自体も優秀だし。

      • #81748 返信
        名無しさん
        蒸留はコスト削減にはなるけど、品質は落ちるって話もあるよ。

    • #81749 返信
      名無しさん
      とりあえずQwen2.5の公開済みモデルはまだ使えるからいいけど、今後に影響が出そう。

      • #81750 返信
        名無しさん
        そうだね。次のバージョンも同じ方針なら困る。コミュニティの反応を見守ろう。

    • #81751 返信
      名無しさん
      個人的にはDeepSeekのV3の方が好みだけど、Qwenのチャットモデルも悪くなかった。

      • #81752 返信
        名無しさん
        用途によるよね。コーディングならDeepSeek、日本語の自然な会話ならQwenって感じ。

    • #81753 返信
      名無しさん
      オープンなモデルが減るのは悲しい。Metaとか他の企業はどうなんだろう?

      • #81754 返信
        名無しさん
        MetaはLlamaでオープンな姿勢を貫いてるけど、ライセンスが微妙って声もある。

    • #81755 返信
      名無しさん
      とにかく競争があるのはいいことだよ。ユーザーとしては選択肢が多い方が嬉しい。

15件の返信を表示中(うち親返信8件)
返信先: Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?で#81741に返信
あなたの情報:




AA
tchmii
タイトルとURLをコピーしました