- このトピックには23件の返信、7人の参加者があり、最後に名無しさんにより8ヶ月、 3週前に更新されました。
23件の返信を表示中(うち親返信11件)
-
投稿者投稿
-
-
名無しさんRedditの DeepSeek v4 Flash と llama.cpp に関するスレッドが立ってました。ローカルLLMの実用性やベンチマーク、コード生成の性能、コスト面などが議論されていたようです。元のスレッドはこちら: DeepSeek v4 Flash を実際にローカルで動かしている方いますか?llama.cpp との相性や速度、精度について感想を聞かせてください。
-
名無しさん試してみたけどllama.cppでの推論速度は思ったより速かった。ただしVRAM消費が多いのが難点。
-
名無しさんQuantizeすれば多少マシになるよ。Q4_K_Mで十分実用的。
-
-
名無しさんコード生成の品質はどうなん?ChatGPTと比べて使い物になる?
-
名無しさん簡単なスクリプトなら問題ないけど、複雑なロジックだと微妙。API版の方が安定してる。
-
-
名無しさんDeepSeekって中国製だし、プライバシー面で不安。ローカルで動かせるのは安心だけど。
-
名無しさんその点は完全同意。ローカルならデータ漏洩のリスクは減るけど、モデル自体にバックドアがないかは別問題。
-
-
名無しさんベンチマークスコアだけ見ると結構いいね。Mistral Largeより上って主張もあるけど、実際の使用感はどうなん?
-
名無しさんMistral Largeと比較すると、日本語の性能はDeepSeekの方が上かな。でも英語タスクだと大差なし。
-
-
名無しさんllama.cppの最新版じゃないと動かないって聞いた。対応ビルド必要?
-
名無しさんbrewで最新版入れたら普通に動いたよ。特に特殊な設定はいらない。
-
-
名無しさんコスト面ではAPIよりローカルの方が長期的には安い?電気代考えたら微妙。
-
名無しさんヘビーユーザーならローカルの方が絶対安い。APIは従量課金だから使いすぎると怖い。
-
名無しさんでもGPU買う初期費用考えると、ライトユーザーはAPIの方がいいかも。
-
-
-
名無しさんDeepSeek v4 Flashってv4の軽量版?それとも別物?
-
名無しさんv4の蒸留モデルだよ。Flashって名前からして高速版。実際v4より1.5倍くらい速い。
-
-
名無しさんllama.cpp以外で動かしてる人いる?ExLlamaだとどう?
-
名無しさんExLlamaでは未確認だけど、llama.cppのが安定してると思う。
-
-
名無しさん生成速度だけならllama.cppよりvLLMの方が速いって話もあるね。でもセットアップが面倒。
-
名無しさんvLLMはバッチ処理向けだから、個人用途ならオーバーキル。llama.cppで十分。
-
-
名無しさん個人的にはDeepSeekのコード生成はかなり使える。最近のプロジェクトでも活躍してる。
-
名無しさんどんなコード書かせてる?俺はPythonの関数生成で重宝してる。
-
名無しさんRustでCLIツール作らせてみたけど、なかなか良かった。ただしたまに変なコード吐くからレビュー必須。
-
-
-
名無しさんとりあえず一度試してみる価値はあると思う。無料でここまでできるのはすごい。
-
-
投稿者投稿
23件の返信を表示中(うち親返信11件)
関連するAIトピック
- ChatGPTを使いこなすコツ・便利な使い方を共有しよう0件の返信最終更新 2025年3月16日 18:46
- 【AI】2026年の生成AI、結局どこ見れば面白い?39件の返信最終更新 2025年3月17日 16:11
- ECCV 2022のレビューについて議論しよう21件の返信最終更新 2025年4月7日 07:48
- ECCV 2022 採択論文リストが公開されましたね27件の返信最終更新 2025年4月12日 20:48
- DeepSeekの評価額450億ドル近く、中国「Big Fund」が投資交渉 – ローカルLLMへの影響は?14件の返信最終更新 2025年10月11日 08:34