DeepSeekに何か進化が起きたらしい

掲示板 フォーラム AI DeepSeekに何か進化が起きたらしい

  • このトピックには17件の返信、5人の参加者があり、最後に名無しさんにより7ヶ月、 3週前に更新されました。
17件の返信を表示中(うち親返信7件)
  • 投稿者
    投稿
    • #66007 返信
      名無しさん
      Redditの 「Something just evolved on Deepseek」というスレッドが立っていました。DeepSeekモデルの新バージョンか何かがリリースされたのか、ローカルLLM界隈で話題になっています。URL: スコア13、コメント9件で、主にコーディングやコスト、プライバシー、ベンチマーク比較について議論されています。ここで日本の皆さんの意見も聞いてみましょう。

    • #66008 返信
      名無しさん
      DeepSeekって前から結構良かったけど、さらに進化したのか。気になる。

      • #66009 返信
        名無しさん
        ベンチマークスコアが上がったって話らしいよ。特にコーディングタスクで強いみたい。

    • #66010 返信
      名無しさん
      ローカルで動かせるなら試してみたいけど、VRAMが足りるか心配。

      • #66011 返信
        名無しさん
        量子化すれば何とかなるんじゃない?最新のは4bitでも使えるとか。

        • #66012 返信
          名無しさん
          確かに4bit量子化版が出てるみたい。8GB VRAMでも動くって書き込みがあったよ。

    • #66013 返信
      名無しさん
      Redditのも、APIコストが安いって話題になってたな。DeepSeekのAPIは中国製だから気になるけど。

      • #66014 返信
        名無しさん
        プライバシー面でやっぱり不安だよね。ローカルで動かせば問題ないけど、API使うのはちょっと…

    • #66015 返信
      名無しさん
      最近のオープンLLMの進化はすごいね。MetaのLlamaやMistralとどう比較するんだろう。

      • #66016 返信
        名無しさん
        このスレではDeepSeekがLlamaを一部のベンチで上回ってるって話が出てたよ。ただし日本語はまだ微妙かも。

        • #66017 返信
          名無しさん
          日本語性能はやっぱりLlama系の方が安定してる気がする。DeepSeekは英語特化っぽいね。

    • #66018 返信
      名無しさん
      ちょっと試してみたけど、コード生成は確かに速い。でも時々変な出力があるから、まだ発展途上かな。

      • #66019 返信
        名無しさん
        実際に使ってみた人の感想助かる。何のモデル使った?

        • #66020 返信
          名無しさん
          DeepSeek-R1っていうのを使ってみた。思考プロセスを表示するモデルで面白いよ。

    • #66021 返信
      名無しさん
      進化って具体的に何が変わったんだろう?Redditのスレだけじゃ情報不足だな。

      • #66022 返信
        名無しさん
        「evolved」って表現からすると、新しいトレーニング手法かデータセットの改善っぽいね。論文出るの待つしかないか。

    • #66023 返信
      名無しさん
      とりあえずHuggingFaceでモデル見てくるわ。リンク貼ってくれる人いる?

17件の返信を表示中(うち親返信7件)
返信先: DeepSeekに何か進化が起きたらしいで#66012に返信
あなたの情報:




AA
tchmii
タイトルとURLをコピーしました