- このトピックには25件の返信、8人の参加者があり、最後に名無しさんにより7ヶ月、 1週前に更新されました。
25件の返信を表示中(うち親返信11件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAで話題になってる「slutty-deepseek-obliterated-6.5-20280512」ってモデルについて。タイトルが過激だけど、中身はDeepSeekの新しいローカルLLMらしい。ベンチマークやコスト、プライバシーの議論が盛り上がってる。
-
名無しさんこのモデル名、さすがに冗談だよね?
-
名無しさん実際に使ってみたけど、コード生成はかなり良いよ。でもVRAMが12GBじゃ足りなかった。
-
名無しさん量子化バージョンなら動くかも。GGUFで試した?
-
名無しさんいや、まだ試してない。でも4bit量子化で8GBくらいならいけるらしい。
-
-
-
名無しさん「slutty」って命名、誰得なんだよ…。性能で評価しようぜ。
-
名無しさんベンチマーク見たけど、GPT-4には及ばないが、ローカルにしては優秀。特に日本語タスクは意外と良い。
-
名無しさん日本語のベンチってどれ?Rakudaとか?
-
名無しさんそう、Rakudaスコアが65くらいで、他の8Bモデルより上。
-
-
-
名無しさんDeepSeekは中国のモデルだから監視が怖い。ローカルならセーフか?
-
名無しさんオープンソースだし、自分でファインチューンすれば大丈夫じゃない?
-
-
名無しさんタイトルが過激すぎてRedditで炎上してたよ。でも中身は真面目な議論。
-
名無しさんあれはパロディで、実際は真面目なモデル。でも名前は変えて欲しい。
-
-
名無しさんこのモデル、A100とかで動かすとすごいらしいけど、個人じゃ無理だな。
-
名無しさんクラウドでレンタルすれば?でもコスト次第。
-
名無しさんいや、ローカルで動かす意義が薄れる。
-
-
-
名無しさんDeepSeekのMoEモデルと比べてどう?
-
名無しさんこっちはdenseモデルだから、推論が速いけどパラメータ多い。
-
名無しさんMoEの方がメモリ効率良いけど、速度はdenseに負ける。
-
-
-
名無しさん個人的にはLLaMA系で十分。DeepSeekは過大評価?
-
名無しさんでもコード生成はDeepSeekの方が得意みたい。
-
名無しさん確かに。HumanEvalで良いスコア出てる。
-
-
-
名無しさん「compute credits」って部分、どういう意味?
-
名無しさん多分、モデルを使うためにAPI課金が必要ってことの皮肉。
-
-
名無しさんともかく、ローカルLLMの進化はすごい。このモデルもその一環。
-
名無しさんそうだね。次のバージョンに期待。
-
-
-
投稿者投稿
25件の返信を表示中(うち親返信11件)
関連するAIトピック
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2026年2月11日 17:18
- Deepseek-r1-0528-qwen3-8bが予想以上に良いらしい25件の返信最終更新 2026年2月11日 08:54
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2026年2月11日 18:58
- DeepSeek-r1がポケモンをプレイ? LLMでゲーム攻略はどこまで可能か23件の返信最終更新 2026年2月11日 11:08
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2026年2月11日 20:44