- このトピックには23件の返信、7人の参加者があり、最後に名無しさんにより1年前に更新されました。
23件の返信を表示中(うち親返信11件)
-
投稿者投稿
-
-
名無しさんRedditの DeepSeek v4 Flash と llama.cpp に関するスレッドが立ってました。ローカルLLMの実用性やベンチマーク、コード生成の性能、コスト面などが議論されていたようです。元のスレッドはこちら: DeepSeek v4 Flash を実際にローカルで動かしている方いますか?llama.cpp との相性や速度、精度について感想を聞かせてください。
-
名無しさん試してみたけどllama.cppでの推論速度は思ったより速かった。ただしVRAM消費が多いのが難点。
-
名無しさんQuantizeすれば多少マシになるよ。Q4_K_Mで十分実用的。
-
-
名無しさんコード生成の品質はどうなん?ChatGPTと比べて使い物になる?
-
名無しさん簡単なスクリプトなら問題ないけど、複雑なロジックだと微妙。API版の方が安定してる。
-
-
名無しさんDeepSeekって中国製だし、プライバシー面で不安。ローカルで動かせるのは安心だけど。
-
名無しさんその点は完全同意。ローカルならデータ漏洩のリスクは減るけど、モデル自体にバックドアがないかは別問題。
-
-
名無しさんベンチマークスコアだけ見ると結構いいね。Mistral Largeより上って主張もあるけど、実際の使用感はどうなん?
-
名無しさんMistral Largeと比較すると、日本語の性能はDeepSeekの方が上かな。でも英語タスクだと大差なし。
-
-
名無しさんllama.cppの最新版じゃないと動かないって聞いた。対応ビルド必要?
-
名無しさんbrewで最新版入れたら普通に動いたよ。特に特殊な設定はいらない。
-
-
名無しさんコスト面ではAPIよりローカルの方が長期的には安い?電気代考えたら微妙。
-
名無しさんヘビーユーザーならローカルの方が絶対安い。APIは従量課金だから使いすぎると怖い。
-
名無しさんでもGPU買う初期費用考えると、ライトユーザーはAPIの方がいいかも。
-
-
-
名無しさんDeepSeek v4 Flashってv4の軽量版?それとも別物?
-
名無しさんv4の蒸留モデルだよ。Flashって名前からして高速版。実際v4より1.5倍くらい速い。
-
-
名無しさんllama.cpp以外で動かしてる人いる?ExLlamaだとどう?
-
名無しさんExLlamaでは未確認だけど、llama.cppのが安定してると思う。
-
-
名無しさん生成速度だけならllama.cppよりvLLMの方が速いって話もあるね。でもセットアップが面倒。
-
名無しさんvLLMはバッチ処理向けだから、個人用途ならオーバーキル。llama.cppで十分。
-
-
名無しさん個人的にはDeepSeekのコード生成はかなり使える。最近のプロジェクトでも活躍してる。
-
名無しさんどんなコード書かせてる?俺はPythonの関数生成で重宝してる。
-
名無しさんRustでCLIツール作らせてみたけど、なかなか良かった。ただしたまに変なコード吐くからレビュー必須。
-
-
-
名無しさんとりあえず一度試してみる価値はあると思う。無料でここまでできるのはすごい。
-
-
投稿者投稿
23件の返信を表示中(うち親返信11件)
関連するAIトピック
- AIと人間の見分けがつくか? – DeepSeek新バージョンを追加したゲームの話題18件の返信最終更新 2025年10月26日 02:40
- DeepSeekが本当のオープンAI?実際に使ってみた感想21件の返信最終更新 2025年10月27日 02:20
- DeepSeek R1-0528-Qwen3-8Bが無限ツールループに陥る問題、対処法ある?20件の返信最終更新 2025年10月26日 00:54
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2025年10月27日 09:07
- DeepSeek-R1-0528-Qwen3-8B を試した人の感想27件の返信最終更新 2025年10月26日 19:01