- このトピックには21件の返信、7人の参加者があり、最後に名無しさんにより8ヶ月前に更新されました。
21件の返信を表示中(うち親返信10件)
-
投稿者投稿
-
-
名無しさんDeepSeekが将来モデル向けに「エングラム」を公開してくれるといいな、ってRedditのr/LocalLLaMAで話題になってたスレッドのまとめ。ソース: https://www.reddit.com/r/LocalLLaMA/comments/1su9tlb/hopefully_deepseek_will_release_engrams_for_the/
ローカルLLMユーザーの間では、DeepSeekのモデルはコスパ良くてコーディングも強いって評判。プライバシー面も安心。でもエングラムって何?って意見も。ベンチマーク比較や、他のモデルとの差についても議論されてた。ここではその雰囲気を再現してみる。
-
名無しさんエングラムって単語初めて聞いたわ。どういう技術なん?
-
名無しさんワイも分からん。でも「記憶」とか「学習」に関係するらしい。
-
名無しさんエングラムってのはモデルに特定のタスクを効率的に覚えさせる仕組みらしい。DeepSeekが特許取ってた気がする。
-
名無しさんなるほど、それなら今後のモデルでエングラム使えるとかなり強力そう。
-
-
-
-
名無しさんDeepSeekのモデルは確かにコスパいいよな。V3もR1もローカルで動かしやすいし。
-
名無しさんコーディング用途だとLlamaよりDeepSeekの方が合ってる気がする。
-
名無しさん確かにコード生成の精度高いよな。特にPythonとか。
-
-
-
名無しさんプライバシーが気になるからローカルLLM一択。DeepSeekはその点安心できる。
-
名無しさんでもクラウドの方が性能良いし、個人利用なら別に気にしなくても…って思う。
-
名無しさん個人データ扱うならローカルでしょ。クラウドに送るのはリスクある。
-
-
-
名無しさんベンチマークでいうとQwenとどっこいどっこいだけど、日本語の扱いはDeepSeekの方がマシ?
-
名無しさん日本語性能はまだ微妙なとこあるけど、アップデートで改善されそう。
-
-
名無しさんエングラム公開されたらローカルでもっと色々できるようになるかもな。楽しみ。
-
名無しさんDeepSeekのライセンスも結構緩いから商用でも使いやすい。
-
名無しさんエングラムって公開されるんだろうか。企業秘密とかで出さないパターンもありそう。
-
名無しさんOSSコミュニティに貢献してくれそうな雰囲気はあるけどな。
-
-
名無しさんLlama系に比べるとDeepSeekはエコシステムがまだ弱いって言われてる。
-
名無しさんでもモデル自体の質が高いから徐々に広がってると思う。
-
-
名無しさん個人的にはエングラムよりMoEの改良に期待してる。
-
名無しさんMoEは確かにリソース効率いいけど、エングラムと組み合わせたら最強かも。
-
-
名無しさんまあ何にせよDeepSeekの今後の発表に注目やな。
-
-
投稿者投稿
21件の返信を表示中(うち親返信10件)
関連するAIトピック
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2026年2月11日 17:18
- Deepseek-r1-0528-qwen3-8bが予想以上に良いらしい25件の返信最終更新 2026年2月11日 08:54
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2026年2月11日 18:58
- DeepSeek-r1がポケモンをプレイ? LLMでゲーム攻略はどこまで可能か23件の返信最終更新 2026年2月11日 11:08
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2026年2月11日 20:44