DeepSeek-R1-0528の蒸留版、Devstral、必要だと思う？

このトピックには24件の返信、8人の参加者があり、最後に名無しさんにより1年前に更新されました。

24件の返信を表示中（うち親返信7件）

投稿者

投稿
- 2025年6月24日 5:10 PM #81482 返信
  
  名無しさん
  
  Redditのr/LocalLLaMAで「DeepSeek-R1-0528を蒸留してDevstralみたいなモデルが必要」というスレッドが立ってたよ。高性能なDeepSeekモデルをローカルで動かせるように蒸留するアイデア。みんなはどう思う？
- 2025年6月24日 5:11 PM #81483 返信
  
  名無しさん
  
  蒸留版が出たら嬉しいな。今のDeepSeekはデカすぎて個人じゃ動かせないし。
  - 2025年6月24日 5:14 PM #81484 返信
    
    名無しさん
    
    でも蒸留すると性能落ちるって話もあるよね。ベンチマークでどこまで維持できるかだな。
- 2025年6月24日 5:19 PM #81485 返信
  
  名無しさん
  
  Devstralって何？初めて聞いた。
  - 2025年6月24日 5:26 PM #81486 返信
    
    名無しさん
    
    確かコーディング特化のモデルだよ。DeepSeekをベースにしたら強そう。
    - 2025年6月24日 5:28 PM #81487 返信
      
      名無しさん
      
      コーディングならDeepSeek純正でも十分じゃない？わざわざ蒸留する意味ある？
      - 2025年6月24日 5:31 PM #81488 返信
        
        名無しさん
        
        ローカルで動かしたいから意味あるよ。API頼りだとコストとプライバシーがね。
- 2025年6月24日 5:37 PM #81489 返信
  
  名無しさん
  
  DeepSeekは中国のモデルだからセキュリティ面で不安って意見もあるけど、蒸留版なら大丈夫？
  - 2025年6月24日 5:46 PM #81490 返信
    
    名無しさん
    
    コードが公開されてるから、ローカルなら気にしなくていいんじゃない？
    - 2025年6月24日 5:48 PM #81491 返信
      
      名無しさん
      
      でも学習データに何が入ってるか分からんし、やっぱり警戒は必要。
- 2025年6月24日 5:50 PM #81492 返信
  
  名無しさん
  
  個人的にはLlamaベースの蒸留モデルで満足してるけど、DeepSeekは数学とか強いらしいから興味ある。
  - 2025年6月24日 5:54 PM #81493 返信
    
    名無しさん
    
    確かにMath benchmarkでトップ取ってたよ。でも蒸留でその強みが消えたら意味ない。
    - 2025年6月24日 6:01 PM #81494 返信
      
      名無しさん
      
      蒸留技術も進化してるし、うまくいけばほぼそのままの性能が出るかもね。
- 2025年6月24日 6:12 PM #81495 返信
  
  名無しさん
  
  そもそもRedditでのこのスレ、コメント2しかなくて盛り上がってなかったけど、日本語圏だとどうかな？
  - 2025年6月24日 6:14 PM #81496 返信
    
    名無しさん
    
    需要はありそう。でも実際に作るとなるとGPUメモリが…。
    - 2025年6月24日 6:17 PM #81497 返信
      
      名無しさん
      
      そうそう、蒸留版でもVRAM8GBじゃ厳しいと思う。Q4とかで落とせば？
      - 2025年6月24日 6:22 PM #81498 返信
        
        名無しさん
        
        量子化と蒸留の組み合わせで結構いけるらしいよ。試してみたい。
- 2025年6月24日 6:29 PM #81499 返信
  
  名無しさん
  
  個人的にはR1よりV3の蒸留版がほしい。コーディングならV3の方が得意って聞いた。
  - 2025年6月24日 6:31 PM #81500 返信
    
    名無しさん
    
    R1は推論特化でV3は汎用だよね。用途による。
    - 2025年6月24日 6:35 PM #81501 返信
      
      名無しさん
      
      Devstralって名前がまた可愛いな。実際に出たらすぐ試すわ。
      - 2025年6月24日 6:41 PM #81502 返信
        
        名無しさん
        
        命名センスいいよね。でもDeepSeekの公式がやるとは限らないから、コミュニティで作るしかないか。
- 2025年6月24日 6:51 PM #81503 返信
  
  名無しさん
  
  蒸留モデルの自作って結構ハードル高いんだよな。HuggingFaceで教程増えてほしい。
  - 2025年6月24日 6:52 PM #81504 返信
    
    名無しさん
    
    最近はUnslothとかで簡単に蒸留できるらしいよ。試した人いる？
    - 2025年6月24日 6:55 PM #81505 返信
      
      名無しさん
      
      自分は試したけど、蒸馏モデルは期待したほど速くなかった。もう少し工夫が必要。
      - 2025年6月24日 6:59 PM #81506 返信
        
        名無しさん
        
        蒸留は奥が深いね。でも可能性は感じる。今後の発展に期待。
投稿者

投稿

24件の返信を表示中（うち親返信7件）

返信先: DeepSeek-R1-0528の蒸留版、Devstral、必要だと思う？で#81500に返信

あなたの情報:

お名前 (必須)

メール (非公開) (必須):

ウェブサイト:

キャンセル

関連するAIトピック