- このトピックには25件の返信、8人の参加者があり、最後に名無しさんにより7ヶ月、 1週前に更新されました。
25件の返信を表示中(うち親返信11件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAで話題になってる「slutty-deepseek-obliterated-6.5-20280512」ってモデルについて。タイトルが過激だけど、中身はDeepSeekの新しいローカルLLMらしい。ベンチマークやコスト、プライバシーの議論が盛り上がってる。
-
名無しさんこのモデル名、さすがに冗談だよね?
-
名無しさん実際に使ってみたけど、コード生成はかなり良いよ。でもVRAMが12GBじゃ足りなかった。
-
名無しさん量子化バージョンなら動くかも。GGUFで試した?
-
名無しさんいや、まだ試してない。でも4bit量子化で8GBくらいならいけるらしい。
-
-
-
名無しさん「slutty」って命名、誰得なんだよ…。性能で評価しようぜ。
-
名無しさんベンチマーク見たけど、GPT-4には及ばないが、ローカルにしては優秀。特に日本語タスクは意外と良い。
-
名無しさん日本語のベンチってどれ?Rakudaとか?
-
名無しさんそう、Rakudaスコアが65くらいで、他の8Bモデルより上。
-
-
-
名無しさんDeepSeekは中国のモデルだから監視が怖い。ローカルならセーフか?
-
名無しさんオープンだし、自分でファインチューンすれば大丈夫じゃない?
-
-
名無しさんタイトルが過激すぎてRedditで炎上してたよ。でも中身は真面目な議論。
-
名無しさんあれはパロディで、実際は真面目なモデル。でも名前は変えて欲しい。
-
-
名無しさんこのモデル、A100とかで動かすとすごいらしいけど、個人じゃ無理だな。
-
名無しさんクラウドでレンタルすれば?でもコスト次第。
-
名無しさんいや、ローカルで動かす意義が薄れる。
-
-
-
名無しさんDeepSeekのMoEモデルと比べてどう?
-
名無しさんこっちはdenseモデルだから、推論が速いけどパラメータ多い。
-
名無しさんMoEの方がメモリ効率良いけど、速度はdenseに負ける。
-
-
-
名無しさん個人的にはLLaMA系で十分。DeepSeekは過大評価?
-
名無しさんでもコード生成はDeepSeekの方が得意みたい。
-
名無しさん確かに。HumanEvalで良いスコア出てる。
-
-
-
名無しさん「compute credits」って部分、どういう意味?
-
名無しさん多分、モデルを使うためにAPI課金が必要ってことの皮肉。
-
-
名無しさんともかく、ローカルLLMの進化はすごい。このモデルもその一環。
-
名無しさんそうだね。次のバージョンに期待。
-
-
-
投稿者投稿
25件の返信を表示中(うち親返信11件)
関連するAIトピック
- ChatGPTを使いこなすコツ・便利な使い方を共有しよう0件の返信最終更新 2025年3月16日 18:46
- 【AI】2026年の生成AI、結局どこ見れば面白い?39件の返信最終更新 2025年3月17日 16:11
- ECCV 2022のレビューについて議論しよう21件の返信最終更新 2025年4月7日 07:48
- ECCV 2022 採択論文リストが公開されましたね27件の返信最終更新 2025年4月12日 20:48
- DeepSeekの評価額450億ドル近く、中国「Big Fund」が投資交渉 – ローカルLLMへの影響は?14件の返信最終更新 2025年10月11日 08:34