- このトピックには19件の返信、6人の参加者があり、最後に名無しさんにより11ヶ月前に更新されました。
19件の返信を表示中(うち親返信5件)
-
投稿者投稿
-
-
名無しさん話題の DeepSeek 7b Base について。コード生成やプライバシー面でのローカル利用が注目されていますが、実際のベンチマークやコスト感はどうなんでしょうか?
-
名無しさん自分も試したけど、7Bにしては結構賢い印象。でもやっぱり70Bには敵わないな。
-
名無しさんそう?コード生成だと意外と7Bでも十分って意見も多いよ。コスパ重視ならアリかも。
-
名無しさんローカルで動かすなら7Bで十分って人と、絶対70B派で分かれるね。私は8GB VRAMでも動く7Bに軍配。
-
-
名無しさんベンチマークスコアはどこかで見た?MMLUとかHumanEvalとか気になる。
-
名無しさんRedditのスレでも話題になってたけど、MosaicMLの評価だとLlama 3 8Bよりやや上って結果だったよ。
-
名無しさんほんと?それは意外。てっきりLlama系列には劣ると思ってた。
-
名無しさんベンチマークの選び方次第じゃない?実用重視なら自分で試すのが一番。
-
-
-
名無しさんプライバシー面でローカルLLMに興味あるんだけど、DeepSeekって中国製だからデータの扱いがちょっと心配。
-
名無しさんオープン重み公開されてるから自分で検証できるし、ローカルなら通信無いから問題ないと思う。
-
名無しさんでもモデル自体にバックドアとかあったら怖いよね。コミュニティの監視はあるけど。
-
名無しさんそこまで paranoid になる必要ある?普通に使う分には大丈夫でしょ。
-
-
-
名無しさん実際に動かすときのメモリ使用量とか知りたい。自分の環境はRTX 3060 12GBなんだけどいけるかな?
-
名無しさん4bit量子化すれば余裕で動くよ。7Bなら6GBくらいでいける。
-
名無しさん自分の3060でも試したけど、4bitで速い。ただしコンテキスト長は限られるけどね。
-
名無しさんGGUF形式ならllama.cppでお手軽。Q4_K_Mがおすすめ。
-
-
名無しさんDeepSeekってコーディングに特化してるって聞いたけど、他の分野はどうなの?
-
名無しさん雑談とか文章作成も普通に使えるよ。ただ上位モデルに比べるとクリエイティブさは劣るかも。
-
名無しさんコード生成がメインなら十分。俺はVS Codeの補完に使ってる。
-
名無しさんそれ!コード補完に特化したモデルとして結構いいらしいね。試してみようかな。
-
-
-
-
投稿者投稿
19件の返信を表示中(うち親返信5件)
関連するAIトピック
- AIと人間の見分けがつくか? – DeepSeek新バージョンを追加したゲームの話題18件の返信最終更新 2025年10月26日 02:40
- DeepSeekが本当のオープンAI?実際に使ってみた感想21件の返信最終更新 2025年10月27日 02:20
- DeepSeek R1-0528-Qwen3-8Bが無限ツールループに陥る問題、対処法ある?20件の返信最終更新 2025年10月26日 00:54
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2025年10月27日 09:07
- DeepSeek-R1-0528-Qwen3-8B を試した人の感想27件の返信最終更新 2025年10月26日 19:01