DeepSeekの技術論文の解説スレ

このトピックには27件の返信、9人の参加者があり、最後に名無しさんにより7ヶ月、 4週前に更新されました。

27件の返信を表示中（うち親返信15件）

投稿者

投稿
- 2025年10月29日 9:35 PM #65635 返信
  
  名無しさん
  
  Redditのr/LocalLLaMAでDeepSeekが公開した技術論文の解説が投稿されていました。この論文ではモデルの効率化やコスト削減、プライバシー面での利点などが議論されています。ローカルLLMに興味がある方、DeepSeekのベンチマークやコード生成について知りたい方はぜひコメントしてください。ソース: https://www.reddit.com/r/LocalLLaMA/comments/1su8fya/heres_an_explanation_of_a_technical_paper/
- 2025年10月29日 9:37 PM #65636 返信
  
  名無しさん
  
  DeepSeekって最近よく聞くけど、実際どうなの？ローカルで動かすにはスペック足りる？
  - 2025年10月29日 9:44 PM #65638 返信
    
    名無しさん
    
    うちのRTX 4090で試したけど、7Bモデルなら余裕。量子化すればもっと軽くなるよ。
    - 2025年10月29日 10:03 PM #65642 返信
      
      名無しさん
      
      4090持ってる人はいいけど、一般ユーザーにはまだハードル高いかも。
- 2025年10月29日 9:40 PM #65637 返信
  
  名無しさん
  
  論文の内容をざっと見た感じ、メモリ効率が良さそう。特定のタスク向けにチューニングできるみたい。
  - 2025年10月29日 9:53 PM #65640 返信
    
    名無しさん
    
    確かにメモリ効率は良さそうだけど、精度が落ちるトレードオフがないか心配。
- 2025年10月29日 9:51 PM #65639 返信
  
  名無しさん
  
  コード生成のベンチマークが気になる。DeepSeek Coderってやつと比べてどうなんだろ。
  - 2025年10月29日 10:13 PM #65644 返信
    
    名無しさん
    
    コード生成はStarCoder2と比較してて、結構良いスコア出てたよ。
- 2025年10月29日 9:57 PM #65641 返信
  
  名無しさん
  
  コスト面ではAPI使うよりローカルで動かした方が安上がりだよね。電気代だけ。
  - 2025年10月29日 10:20 PM #65646 返信
    
    名無しさん
    
    電気代だけとはいえ、24時間稼働させると馬鹿にならない。でもまあ趣味ならOK。
- 2025年10月29日 10:12 PM #65643 返信
  
  名無しさん
  
  プライバシー重視ならローカル一択。DeepSeekの論文にもその辺の利点が書いてあった。
- 2025年10月29日 10:16 PM #65645 返信
  
  名無しさん
  
  この論文、 Attentionの最適化手法について詳しく書いてあって勉強になる。
- 2025年10月29日 10:26 PM #65647 返信
  
  名無しさん
  
  DeepSeekって中国発なのがちょっと気になる。データの取り扱いとか大丈夫？
  - 2025年10月29日 10:38 PM #65648 返信
    
    名無しさん
    
    ローカルなら外部にデータ出ないから安全だよ。ソースコードも公開されてるし。
- 2025年10月29日 10:40 PM #65649 返信
  
  名無しさん
  
  論文の内容を自分でも試してみたいけど、実装が難しそう。
  - 2025年10月29日 10:43 PM #65650 返信
    
    名無しさん
    
    Hugging Faceにサンプルコード上がってるから、それをベースにすると楽だよ。
- 2025年10月29日 10:47 PM #65651 返信
  
  名無しさん
  
  ローカルLLMは進化が早くて追いつくのが大変。でも面白い。
- 2025年10月29日 10:55 PM #65652 返信
  
  名無しさん
  
  ベンチマークの数字だけ見るとすごいけど、実際の使い勝手はどうなんだろう。
  - 2025年10月29日 10:57 PM #65653 返信
    
    名無しさん
    
    うちの業務で使ってみたけど、簡単な質問なら問題なし。複雑な推論はまだ微妙。
- 2025年10月29日 11:01 PM #65654 返信
  
  名無しさん
  
  DeepSeekのモデルサイズ展開が豊富で助かる。小さめのモデルで試せるし。
  - 2025年10月29日 11:06 PM #65655 返信
    
    名無しさん
    
    1.5Bとかだとスマホでも動くのかな？試した人いる？
- 2025年10月29日 11:16 PM #65656 返信
  
  名無しさん
  
  この論文、他の研究者にも参考になりそう。ローカルLLMコミュニティ盛り上がってるね。
- 2025年10月29日 11:18 PM #65657 返信
  
  名無しさん
  
  個人的にはLLaMA派だけど、DeepSeekも侮れない。コスパで勝ってる部分ある。
  - 2025年10月29日 11:21 PM #65658 返信
    
    名無しさん
    
    LLaMAはエコシステムが充実してるから安心感あるよね。でもDeepSeekの性能は魅力的。
- 2025年10月29日 11:25 PM #65659 返信
  
  名無しさん
  
  API使うのとローカルとでコスト比較してみたけど、利用頻度次第だな。
  - 2025年10月29日 11:32 PM #65660 返信
    
    名無しさん
    
    毎日何千回も叩くならAPIの方が安い場合もある。スケールの問題。
- 2025年10月29日 11:44 PM #65661 返信
  
  名無しさん
  
  論文の解説動画とかあったら見たい。テキストだけだと理解が追いつかない。
  - 2025年10月29日 11:45 PM #65662 返信
    
    名無しさん
    
    YouTubeにいくつか上がってるよ。DeepSeek公式チャンネルもチェックしてみて。
投稿者

投稿

27件の返信を表示中（うち親返信15件）

返信先: DeepSeekの技術論文の解説スレ

あなたの情報:

お名前 (必須)

メール (非公開) (必須):

ウェブサイト:

関連するAIトピック