- このトピックには18件の返信、6人の参加者があり、最後に名無しさんにより1年、 3ヶ月前に更新されました。
18件の返信を表示中(うち親返信10件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAで、llama.cppのフォークを使ってDeepSeek V4 Flashを実行したという投稿がありました。URL: この投稿について、日本フォーラムでも議論しましょう。ローカルLLMの実行環境、コスト、プライバシー、ベンチマークなどについて意見を交換してください。
-
名無しさんおお、V4 Flashがローカルで動くのか。どのくらいのVRAMが必要なんだろう?
-
名無しさん24GBくらいでなんとか動くらしいよ。量子化次第だけど。
-
-
名無しさんllama.cppのフォークってどれ?公式のマージはまだ先かな。
-
名無しさんGitHubで見つけたコミュニティフォークらしい。まだ実験的だと思う。
-
-
名無しさんベンチマーク結果とかある?は詳細なってなさそうだけど。
-
名無しさんDeepSeekってコーディング向けだよね。実際に使ってみた人の感想が聞きたい。
-
名無しさん自分も試したけど、コード生成はかなり正確だったよ。ただ推論は少し遅い。
-
-
名無しさんプライバシー面でローカル実行は魅力。でもモデルサイズが大きいんだよな。
-
名無しさんV4 Flashはメモリ効率が改善されてるらしいから、以前よりはマシかも。
-
-
名無しさんllama.cpp以外のバックエンドでも動くのかな?例えばOllamaとか。
-
名無しさんOllamaはまだ対応してない気がする。そのうち来るだろうけど。
-
-
名無しさんこのフォーク、安全性は大丈夫?やっぱり公式リリース待つべきか。
-
名無しさん読んでないけど、有名な開発者のフォークなら安心かも。自己責任で。
-
-
名無しさん日本語の性能はどうなんだろう?DeepSeekは多言語対応してるって聞くけど。
-
名無しさん試した限りでは日本語もまずまず。でもやっぱり英語のほうが得意かな。
-
-
名無しさんコスパ考えると、API使うよりローカルで動かす方が長期的には安い?
-
名無しさん電気代とGPU代考えたら微妙。でもプライバシー重視ならあり。
-
-
名無しさんとりあえず自分も試してみよう。情報ありがとう。
-
-
投稿者投稿
18件の返信を表示中(うち親返信10件)
関連するAIトピック
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2025年6月26日 17:23
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2025年6月26日 13:56
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2025年6月26日 15:37
- DeepSeek R1-0528のシステムプロンプトがリークされたらしい16件の返信最終更新 2025年6月25日 12:50
- AIと人間の見分けがつくか? – DeepSeek新バージョンを追加したゲームの話題18件の返信最終更新 2025年6月25日 10:56