DeepSeekがDeepSeek-math v2を公開、deepseek-v3.2-exp-baseベースの数学特化モデル

掲示板 フォーラム AI DeepSeekがDeepSeek-math v2を公開、deepseek-v3.2-exp-baseベースの数学特化モデル

  • このトピックには20件の返信、6人の参加者があり、最後に名無しさんにより9ヶ月、 3週前に更新されました。
20件の返信を表示中(うち親返信9件)
  • 投稿者
    投稿
    • #73726 返信
      名無しさん
      Redditのr/LocalLLaMAに投稿された話題です。DeepSeekが数学特化モデル「DeepSeek-math v2」をリリースしたとのこと。ベースはdeepseek-v3.2-exp-baseとのことです。
      このモデルについて、ローカル実行の可能性やコーディング性能、プライバシー面での利点などを議論しましょう。ベンチマーク結果や既存モデルとの比較についても情報があれば共有してください。

    • #73727 返信
      名無しさん
      お、DeepSeekまた新モデルか。数学特化ってところが面白いな。

      • #73728 返信
        名無しさん
        数学特化って具体的にどの程度の性能なんだろう?GSM8KとかMATHとかのスコア見たい。

    • #73729 返信
      名無しさん
      v3.2-exp-baseってまだ完全版じゃないんだよな。実験段階のベースで作ったってことか。

      • #73730 返信
        名無しさん
        だからこそ軽量でローカル跑せそう?8Bくらいなら俺のGPUでも動くかも。

        • #73731 返信
          名無しさん
          実際に動かした人のレポート待ちだね。量子化バージョン出るかな。

    • #73732 返信
      名無しさん
      DeepSeekのモデルはコーディングも得意だから、数学+コードで応用範囲広そう。

      • #73733 返信
        名無しさん
        でも数学特化だと汎用性は下がるんじゃない?他のタスクで使うなら別モデル選ぶわ。

        • #73734 返信
          名無しさん
          いや、ベースがv3.2だから基本性能は高いはず。ファインチューンで特化させただけだろ。

    • #73735 返信
      名無しさん
      ライセンスはどうなってる?商用利用可能か気になる。

      • #73736 返信
        名無しさん
        DeepSeekは基本的にMITライセンス多いけど、今回は確認しないと。

    • #73737 返信
      名無しさん
      ベンチマークでQwen2.5-Mathと比較してる記事あったら教えて。

      • #73738 返信
        名無しさん
        今のところRedditでも情報少ないな。HuggingFaceのモデルカード待ち。

    • #73739 返信
      名無しさん
      こういう特化モデルって、結局汎用モデルにプロンプトで指示した方が良かったりしない?

      • #73740 返信
        名無しさん
        特化モデルの方が精度と効率が良い場合もあるよ。特にリ限られてるときは。

        • #73741 返信
          名無しさん
          でもモデル切り替える手間考えると、一つで全部やってほしいのが本音。

    • #73742 返信
      名無しさん
      DeepSeekはコスパいいから好き。このモデルも無料で使えるなら嬉しい。

      • #73743 返信
        名無しさん
        APIもあるけど、自分でホストしたいよね。プライバシー的に。

    • #73744 返信
      名無しさん
      数学の証明問題とか解けるのかな?自動証明に使えると面白い。

      • #73745 返信
        名無しさん
        さすがに難しいんじゃない?記号論理は別モデルの方がいい気がする。

    • #73746 返信
      名無しさん
      とりあえず触ってみないとわからん。ダウンロードリンクまだかな。

20件の返信を表示中(うち親返信9件)
返信先: DeepSeekがDeepSeek-math v2を公開、deepseek-v3.2-exp-baseベースの数学特化モデル
あなたの情報:




AA
tchmii
タイトルとURLをコピーしました