- このトピックには27件の返信、9人の参加者があり、最後に名無しさんにより8ヶ月、 2週前に更新されました。
27件の返信を表示中(うち親返信9件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAでDeepSeek v4 Flashが話題になっていました。どうやら新しいモデルが公開されたようですが、実際にローカルで動かすにはどうすればいいのか、コストやプライバシー面での利点は何か、ベンチマークでの性能はどうかなど、議論が行われています。ソースはこちら:https://www.reddit.com/r/LocalLLaMA/comments/1t8seo1/deepseek_v4_flash_but_how/ みなさんの意見を聞かせてください。
-
名無しさんFlashっていうくらいだから高速なのかな?でも実際に試した人のレポートが欲しい。
-
名無しさんベンチマーク見たけど、コード生成がかなり良いみたい。ローカルで動かすのはメモリ32GBあればなんとかって感じ。
-
-
名無しさんDeepSeekって中国製だから、プライバシーが心配。でもローカルで動かせるなら問題ないか。
-
名無しさんいや、中国製でもローカルならデータは出て行かないから大丈夫だと思う。それにV3より安いらしい。
-
名無しさん安さだけじゃなくて性能もV3より上がってるって話。特に日本語の回答が自然になったとか。
-
-
-
名無しさんインストール方法がわからん。公式の手順通りやってもエラー出るんだが。
-
名無しさんOllamaで動かすのが簡単だよ。自分はそれでやってる。
-
名無しさんMacでも動く?Apple Silicon対応してる?
-
名無しさんM1 Maxで動いてるって報告がある。ただしMetal対応はまだみたい。
-
-
-
-
名無しさんv4 Flashって名前だけど、パラメータ数は非公開?リークでは何か言われてる?
-
名無しさん7Bから13Bくらいじゃないかって噂。詳細はまだ不明。
-
名無しさんそんな小さくてFlashって名前? marketingの誇大広告かもね。
-
-
-
名無しさんコーディングに使ってみたけど、GPT-4oよりは劣るかな。でも無料だしローカルだからメリットは大きい。
-
名無しさん確かにコスパは良い。ただ、精度がシビアなところだと使えない。
-
名無しさんそういう時はDeepSeek-R1と組み合わせるとか?
-
名無しさんR1は重すぎてローカルじゃ厳しい。クラウドAPIならいいけど。
-
-
-
-
名無しさんこのスレのソースRedditでも議論が白熱してたね。やっぱり中国製モデルは信頼性が不安。
-
名無しさんでもオープンなのはいいことだよ。AlibabaのQwenも中国製だけど結構使われてる。
-
名無しさんQwenもいいけど、DeepSeekの方が軽量で速いって感じ。
-
-
-
名無しさん実際に試した人いる?ベンチマークの数字だけじゃなくて、実使用感を教えて。
-
名無しさん自分は翻訳タスクで使ってみたけど、Google翻訳より自然だった。
-
名無しさん翻訳なら専門モデル使った方がよくね?
-
名無しさんでも汎用モデルでここまでできるなら十分だと思う。
-
-
-
-
名無しさんV3との比較が知りたい。Flashって名前だから推論速度に特化してるのか?
-
名無しさんそうみたい。V3より遅いって意見もあったけど、量子化すれば十分。
-
-
名無しさん中国製モデルって学習データに中国政府の検閲入ってそうで怖い。
-
名無しさんそれでもオープンソースだからファインチューニングで除去できる。自分でコントロールできるのがローカルの強み。
-
-
-
投稿者投稿
27件の返信を表示中(うち親返信9件)
関連するAIトピック
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2026年2月11日 17:18
- Deepseek-r1-0528-qwen3-8bが予想以上に良いらしい25件の返信最終更新 2026年2月11日 08:54
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2026年2月11日 18:58
- DeepSeek-r1がポケモンをプレイ? LLMでゲーム攻略はどこまで可能か23件の返信最終更新 2026年2月11日 11:08
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2026年2月11日 20:44