- このトピックには27件の返信、9人の参加者があり、最後に名無しさんにより7ヶ月、 4週前に更新されました。
27件の返信を表示中(うち親返信15件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAでDeepSeekが公開した技術論文の解説が投稿されていました。この論文ではモデルの効率化やコスト削減、プライバシー面での利点などが議論されています。ローカルLLMに興味がある方、DeepSeekのベンチマークやコード生成について知りたい方はぜひコメントしてください。ソース: https://www.reddit.com/r/LocalLLaMA/comments/1su8fya/heres_an_explanation_of_a_technical_paper/
-
名無しさんDeepSeekって最近よく聞くけど、実際どうなの?ローカルで動かすにはスペック足りる?
-
名無しさんうちのRTX 4090で試したけど、7Bモデルなら余裕。量子化すればもっと軽くなるよ。
-
名無しさん4090持ってる人はいいけど、一般ユーザーにはまだハードル高いかも。
-
-
-
名無しさん論文の内容をざっと見た感じ、メモリ効率が良さそう。特定のタスク向けにチューニングできるみたい。
-
名無しさん確かにメモリ効率は良さそうだけど、精度が落ちるトレードオフがないか心配。
-
-
名無しさんコード生成のベンチマークが気になる。DeepSeek Coderってやつと比べてどうなんだろ。
-
名無しさんコード生成はStarCoder2と比較してて、結構良いスコア出てたよ。
-
-
名無しさんコスト面ではAPI使うよりローカルで動かした方が安上がりだよね。電気代だけ。
-
名無しさん電気代だけとはいえ、24時間稼働させると馬鹿にならない。でもまあ趣味ならOK。
-
-
名無しさんプライバシー重視ならローカル一択。DeepSeekの論文にもその辺の利点が書いてあった。
-
名無しさんこの論文、 Attentionの最適化手法について詳しく書いてあって勉強になる。
-
名無しさんDeepSeekって中国発なのがちょっと気になる。データの取り扱いとか大丈夫?
-
名無しさんローカルなら外部にデータ出ないから安全だよ。ソースコードも公開されてるし。
-
-
名無しさん論文の内容を自分でも試してみたいけど、実装が難しそう。
-
名無しさんHugging Faceにサンプルコード上がってるから、それをベースにすると楽だよ。
-
-
名無しさんローカルLLMは進化が早くて追いつくのが大変。でも面白い。
-
名無しさんベンチマークの数字だけ見るとすごいけど、実際の使い勝手はどうなんだろう。
-
名無しさんうちの業務で使ってみたけど、簡単な質問なら問題なし。複雑な推論はまだ微妙。
-
-
名無しさんDeepSeekのモデルサイズ展開が豊富で助かる。小さめのモデルで試せるし。
-
名無しさん1.5Bとかだとスマホでも動くのかな?試した人いる?
-
-
名無しさんこの論文、他の研究者にも参考になりそう。ローカルLLMコミュニティ盛り上がってるね。
-
名無しさん個人的にはLLaMA派だけど、DeepSeekも侮れない。コスパで勝ってる部分ある。
-
名無しさんLLaMAはエコシステムが充実してるから安心感あるよね。でもDeepSeekの性能は魅力的。
-
-
名無しさんAPI使うのとローカルとでコスト比較してみたけど、利用頻度次第だな。
-
名無しさん毎日何千回も叩くならAPIの方が安い場合もある。スケールの問題。
-
-
名無しさん論文の解説動画とかあったら見たい。テキストだけだと理解が追いつかない。
-
名無しさんYouTubeにいくつか上がってるよ。DeepSeek公式チャンネルもチェックしてみて。
-
-
-
投稿者投稿
27件の返信を表示中(うち親返信15件)
関連するAIトピック
- DeepSeekが本当のオープンAI?実際に使ってみた感想21件の返信最終更新 2026年2月11日 13:57
- Deepseek-r1-0528-qwen3-8bが予想以上に良いらしい25件の返信最終更新 2026年2月11日 08:54
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2026年2月11日 18:58
- DeepSeek-r1がポケモンをプレイ? LLMでゲーム攻略はどこまで可能か23件の返信最終更新 2026年2月11日 11:08
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2026年2月11日 20:44