- このトピックには23件の返信、7人の参加者があり、最後に名無しさんにより1年、 2ヶ月前に更新されました。
23件の返信を表示中(うち親返信12件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAで「DeepSeek V4 Liteを実際に使った人はいる?」というスレッドが立っていました。:。コメントは少ないものの、ローカルLLMの使用感、コスト、プライバシー、ベンチマーク比較などが話題になっています。DeepSeekモデルに関心のある方、意見をどうぞ。
-
名無しさん使ってみたよ。とりあえずQ4_K_Mで動かしたけど、コード生成は悪くなかった。ただプロンプト次第かな。
-
名無しさんどのくらいのVRAM必要?16GBでも動く?
-
名無しさんQ4なら16GBでいけるよ。でもコンテキスト長いと厳しいかも。
-
-
-
名無しさんベンチマーク見る限り、Llama 3.1 8Bと同程度?でもパラメータ増えてるし、微調整次第で化けるかも。
-
名無しさんDeepSeekって中国製だよね。プライバシー面でちょっと躊躇する。
-
名無しさんローカルで動かせば問題ないんじゃない?API経由だと気になるけど。
-
名無しさん確かに。オープンウェイトだから監査もできるし、そこまで心配しなくていいかもね。
-
-
-
名無しさん個人的にはV4(非Lite)のほうが興味ある。Liteはコスパ重視らしいけど。
-
名無しさん公式ベンチだと数学が弱いって言われてるけど、実際どう?
-
名無しさん確かに論理問題は微妙。でも日常的な質問だと十分。
-
-
名無しさんまだ使ってない。インストール手順が面倒そうで。
-
名無しさんllama.cppで結構簡単に動くよ。ドキュメント読めばすぐ。
-
-
名無しさんコーディング用途で使ってるけど、PyTorch系はそこそこ。JavaScriptは意外と使える。
-
名無しさんQwen 2.5 Coderとどっちがいいんだろ?
-
名無しさん同じベンチじゃDeepSeek Liteのほうが若干上って結果もあったけど、好みかも。
-
-
名無しさんローカルLLMってやっぱり日本語言語モデル専用のほうがいいのかな。
-
名無しさんDeepSeekは日本語微妙って話もあるね。でも英語なら普通。
-
-
名無しさんLiteって名前だけど結構重いんだよね。8Bクラスと変わらないVRAM食う。
-
名無しさんそうそう、16Bだから当然か。でも精度はその分上がってるなら許容範囲。
-
-
名無しさんRedditのスレ見てると、推論速度が気になるって人多かった。自分はまだ試せてない。
-
名無しさん3070で4bitならそこそこ速いよ。ただし長文になるとトークン/s落ちる。
-
-
名無しさんBGE M3みたいな埋め込みモデルと組み合わせてRAGに使えないかな。
-
名無しさんその用途なら結構使えるよ。EmbeddingもDeepSeekのやつあるし、試してみようかと思ってる。
-
-
-
投稿者投稿
23件の返信を表示中(うち親返信12件)
関連するAIトピック
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2025年6月26日 17:23
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2025年6月26日 13:56
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2025年6月26日 15:37
- DeepSeek R1-0528のシステムプロンプトがリークされたらしい16件の返信最終更新 2025年6月25日 12:50
- AIと人間の見分けがつくか? – DeepSeek新バージョンを追加したゲームの話題18件の返信最終更新 2025年6月25日 10:56