- このトピックには16件の返信、5人の参加者があり、最後に名無しさんにより1年、 4ヶ月前に更新されました。
16件の返信を表示中(うち親返信6件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAで話題になっていたDeepSeek V4 Proの話です。独自のエージェントベンチマークFoodTruck BenchでGPT-5.2と同等のスコアを出し、しかも推論コストが約17分の1と報告されています。ローカルLLMコミュニティではかなり盛り上がっていました。
-
名無しさん17分の1ってすごいな。でもベンチマークの内容が気になる。Food Truckって何だ?
-
名無しさんFoodTruck Benchはエージェント的なタスクのベンチマークらしいよ。実際のユースケースに近いとか。
-
-
名無しさんDeepSeekって中国のモデルだよね。ライセンス的にローカルで商用利用できるのか?
-
名無しさんMITライセンスだったはず。だから個人でも企業でも使えると思う。
-
名無しさんただ中国のモデルってデータの偏りとかない?気になる。
-
-
-
名無しさんGPT-5.2ってまだ出てないはず。何かのコードネーム?
-
名無しさん多分内部的なモデルだと思う。OpenAIのリークとかではないかな。
-
-
名無しさん実際に使ってみたけど、コーディングはかなり優秀。Claude 3.5 Sonnetと互角くらい。
-
名無しさんどのくらいの規模のモデル?ローカルで動かせるの?
-
名無しさんV4 Proはパラメータ非公開だけど、多分70Bくらいじゃない?量子化すれば24GB VRAMでもいける。
-
-
-
名無しさんFoodTruck Benchのスコアだけ見て飛びつくのは危険。他のベンチマークも見たい。
-
名無しさんそうそう。MMLUとかHumanEvalでの結果も欲しいところ。
-
名無しさんRedditのスレでは他のベンチも貼ってたけど、確かに総合力ではGPT-4oに届いてない感じ。
-
-
-
名無しさんコストが安いのは魅力。API叩くときに気にしなくていい。
-
名無しさんでもAPIの安定性はどうなんだろう。DeepSeekのAPI、たまに落ちるって聞く。
-
名無しさんローカルで動かせば関係ないけどね。とにかく選択肢が増えるのは良いことだ。
-
-
-
-
投稿者投稿
16件の返信を表示中(うち親返信6件)
関連するAIトピック
- DeepSeek V4のプロンプトキャッシュ、本当に節約になってる?自分でトラッカー作って調べてみた21件の返信最終更新 2025年3月6日 22:55
- DeepSeekの次世代モデル、エングラム公開に期待21件の返信最終更新 2025年7月7日 20:54
- DeepSeek V4 がリリース! 1.6T Proと284B Flash、MITライセンス、100万トークンコンテキスト。すごい。20件の返信最終更新 2025年3月7日 01:34
- DeepSeekが「V4じゃない」と主張する理由についての議論25件の返信最終更新 2025年3月6日 09:23
- DeepSeek V4のアーキテクチャについての議論と実践的な知見24件の返信最終更新 2025年3月5日 22:52