DeepSeekの技術論文の解説スレ

掲示板 フォーラム AI DeepSeekの技術論文の解説スレ

  • このトピックには27件の返信、9人の参加者があり、最後に名無しさんにより7ヶ月、 4週前に更新されました。
27件の返信を表示中(うち親返信15件)
  • 投稿者
    投稿
    • #65635 返信
      名無しさん
      Redditのr/LocalLLaMAでDeepSeekが公開した技術論文の解説が投稿されていました。この論文ではモデルの効率化やコスト削減、プライバシー面での利点などが議論されています。ローカルLLMに興味がある方、DeepSeekのベンチマークやコード生成について知りたい方はぜひコメントしてください。ソース: https://www.reddit.com/r/LocalLLaMA/comments/1su8fya/heres_an_explanation_of_a_technical_paper/

    • #65636 返信
      名無しさん
      DeepSeekって最近よく聞くけど、実際どうなの?ローカルで動かすにはスペック足りる?

      • #65638 返信
        名無しさん
        うちのRTX 4090で試したけど、7Bモデルなら余裕。量子化すればもっと軽くなるよ。

        • #65642 返信
          名無しさん
          4090持ってる人はいいけど、一般ユーザーにはまだハードル高いかも。

    • #65637 返信
      名無しさん
      論文の内容をざっと見た感じ、メモリ効率が良さそう。特定のタスク向けにチューニングできるみたい。

      • #65640 返信
        名無しさん
        確かにメモリ効率は良さそうだけど、精度が落ちるトレードオフがないか心配。

    • #65639 返信
      名無しさん
      コード生成のベンチマークが気になる。DeepSeek Coderってやつと比べてどうなんだろ。

      • #65644 返信
        名無しさん
        コード生成はStarCoder2と比較してて、結構良いスコア出てたよ。

    • #65641 返信
      名無しさん
      コスト面ではAPI使うよりローカルで動かした方が安上がりだよね。電気代だけ。

      • #65646 返信
        名無しさん
        電気代だけとはいえ、24時間稼働させると馬鹿にならない。でもまあ趣味ならOK。

    • #65643 返信
      名無しさん
      プライバシー重視ならローカル一択。DeepSeekの論文にもその辺の利点が書いてあった。

    • #65645 返信
      名無しさん
      この論文、 Attentionの最適化手法について詳しく書いてあって勉強になる。

    • #65647 返信
      名無しさん
      DeepSeekって中国発なのがちょっと気になる。データの取り扱いとか大丈夫?

      • #65648 返信
        名無しさん
        ローカルなら外部にデータ出ないから安全だよ。ソースコードも公開されてるし。

    • #65649 返信
      名無しさん
      論文の内容を自分でも試してみたいけど、実装が難しそう。

      • #65650 返信
        名無しさん
        Hugging Faceにサンプルコード上がってるから、それをベースにすると楽だよ。

    • #65651 返信
      名無しさん
      ローカルLLMは進化が早くて追いつくのが大変。でも面白い。

    • #65652 返信
      名無しさん
      ベンチマークの数字だけ見るとすごいけど、実際の使い勝手はどうなんだろう。

      • #65653 返信
        名無しさん
        うちの業務で使ってみたけど、簡単な質問なら問題なし。複雑な推論はまだ微妙。

    • #65654 返信
      名無しさん
      DeepSeekのモデルサイズ展開が豊富で助かる。小さめのモデルで試せるし。

      • #65655 返信
        名無しさん
        1.5Bとかだとスマホでも動くのかな?試した人いる?

    • #65656 返信
      名無しさん
      この論文、他の研究者にも参考になりそう。ローカルLLMコミュニティ盛り上がってるね。

    • #65657 返信
      名無しさん
      個人的にはLLaMA派だけど、DeepSeekも侮れない。コスパで勝ってる部分ある。

      • #65658 返信
        名無しさん
        LLaMAはエコシステムが充実してるから安心感あるよね。でもDeepSeekの性能は魅力的。

    • #65659 返信
      名無しさん
      API使うのとローカルとでコスト比較してみたけど、利用頻度次第だな。

      • #65660 返信
        名無しさん
        毎日何千回も叩くならAPIの方が安い場合もある。スケールの問題。

    • #65661 返信
      名無しさん
      論文の解説動画とかあったら見たい。テキストだけだと理解が追いつかない。

      • #65662 返信
        名無しさん
        YouTubeにいくつか上がってるよ。DeepSeek公式チャンネルもチェックしてみて。

27件の返信を表示中(うち親返信15件)
返信先: DeepSeekの技術論文の解説スレで#65645に返信
あなたの情報:




AA
tchmii
タイトルとURLをコピーしました