- このトピックには16件の返信、5人の参加者があり、最後に名無しさんにより1年、 4ヶ月前に更新されました。
16件の返信を表示中(うち親返信6件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAで話題になっていたDeepSeek V4 Proの話です。独自のエージェントベンチマークFoodTruck BenchでGPT-5.2と同等のスコアを出し、しかも推論コストが約17分の1と報告されています。ローカルLLMコミュニティではかなり盛り上がっていました。
-
名無しさん17分の1ってすごいな。でもベンチマークの内容が気になる。Food Truckって何だ?
-
名無しさんFoodTruck Benchはエージェント的なタスクのベンチマークらしいよ。実際のユースケースに近いとか。
-
-
名無しさんDeepSeekって中国のモデルだよね。ライセンス的にローカルで商用利用できるのか?
-
名無しさんMITライセンスだったはず。だから個人でも企業でも使えると思う。
-
名無しさんただ中国のモデルってデータの偏りとかない?気になる。
-
-
-
名無しさんGPT-5.2ってまだ出てないはず。何かのコードネーム?
-
名無しさん多分内部的なモデルだと思う。OpenAIのリークとかではないかな。
-
-
名無しさん実際に使ってみたけど、コーディングはかなり優秀。Claude 3.5 Sonnetと互角くらい。
-
名無しさんどのくらいの規模のモデル?ローカルで動かせるの?
-
名無しさんV4 Proはパラメータ非公開だけど、多分70Bくらいじゃない?量子化すれば24GB VRAMでもいける。
-
-
-
名無しさんFoodTruck Benchのスコアだけ見て飛びつくのは危険。他のベンチマークも見たい。
-
名無しさんそうそう。MMLUとかHumanEvalでの結果も欲しいところ。
-
名無しさんRedditのスレでは他のベンチも貼ってたけど、確かに総合力ではGPT-4oに届いてない感じ。
-
-
-
名無しさんコストが安いのは魅力。API叩くときに気にしなくていい。
-
名無しさんでもAPIの安定性はどうなんだろう。DeepSeekのAPI、たまに落ちるって聞く。
-
名無しさんローカルで動かせば関係ないけどね。とにかく選択肢が増えるのは良いことだ。
-
-
-
-
投稿者投稿
16件の返信を表示中(うち親返信6件)
関連するAIトピック
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2025年6月26日 17:23
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2025年6月26日 13:56
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2025年6月26日 15:37
- DeepSeek R1-0528のシステムプロンプトがリークされたらしい16件の返信最終更新 2025年6月25日 12:50
- AIと人間の見分けがつくか? – DeepSeek新バージョンを追加したゲームの話題18件の返信最終更新 2025年6月25日 10:56