- このトピックには26件の返信、8人の参加者があり、最後に名無しさんにより7ヶ月前に更新されました。
26件の返信を表示中(うち親返信12件)
-
投稿者投稿
-
-
名無しさんReddit r/LocalLLaMAでDeepSeekモデルのプロキシテストスレッドが立ってたんで、話題にしてみる。コード生成やコスト、プライバシー、ベンチマーク比較とかが気になってる人が多いみたい。元スレ:https://www.reddit.com/r/LocalLLaMA/comments/1rdfigf/deepseek_proxy_test_anyone_else_running_this/
-
名無しさん自分は試してる。コード生成は結構イケるけど、日本語の精度が微妙な時もある。
-
名無しさん確かに。でもプロキシ経由なら軽量版もあるみたい。
-
-
名無しさんDeepSeekってローカルで動かすには重くない?
-
名無しさんコスト面ではGPTより安いのか?
-
名無しさんAPI価格比較だとDeepSeekの方が圧倒的に安いね。でも品質はGPT-4には劣る。
-
-
名無しさんプライバシー重視ならローカル運用がベスト。プロキシってどこまで安全なんだろ。
-
名無しさん自己ホストなら気にならないけど、サードパーティのプロキシはリスクあるよね。
-
-
名無しさんベンチマークスコア見ると、LlamaよりDeepSeekの方がコードで高いって話。
-
名無しさんそうそう、HumanEvalで結構良いスコア出てる。でも実用だと差を感じない。
-
-
名無しさん日本ではまだ認知度低いよね。もっと使われていいモデルだと思う。
-
名無しさん中国製ってのが引っかかる人もいるからじゃない?
-
名無しさん性能と価格で選ぶなら関係ないと思うけどね。
-
-
-
名無しさんプロキシの設定、簡単だった?
-
名無しさんDockerで一発だったよ。公式ドキュメントもわかりやすい。
-
-
名無しさんDeepSeekの日本語データってどのくらい入ってるんだろう。
-
名無しさん公開情報だと中国語と英語がメインで、日本語は少なそう。
-
名無しさんじゃあ日本語タスクには finetune 必須かもね。
-
-
-
名無しさんRedditのスレ見たら「404エラーが出た」って人がいたけど、直ったのかな。
-
名無しさん自分は問題なく動いてる。バージョン依存かも。
-
-
名無しさんとりあえず使ってみようかな。GPT-4oの代わりになるかも。
-
名無しさん代わりにはならないけど、コスト重視ならアリ。
-
-
名無しさんllama.cppで動かす場合の量子化モデルどこで落とす?
-
名無しさんHuggingFace公式か、TheBlokeのGGUFが安定。
-
-
名無しさんDeepSeek-V3のベンチマーク、Llama-3.1-405Bより上って本当?
-
名無しさん一部のベンチで上回ってるけど、総合力ではまだ議論あり。
-
名無しさんそうそう、実際のタスクで試さないとわからないね。
-
-
-
-
投稿者投稿
26件の返信を表示中(うち親返信12件)
関連するAIトピック
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2026年2月11日 17:18
- Deepseek-r1-0528-qwen3-8bが予想以上に良いらしい25件の返信最終更新 2026年2月11日 08:54
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2026年2月11日 18:58
- DeepSeek-r1がポケモンをプレイ? LLMでゲーム攻略はどこまで可能か23件の返信最終更新 2026年2月11日 11:08
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2026年2月11日 20:44