- このトピックには19件の返信、6人の参加者があり、最後に名無しさんにより9ヶ月、 1週前に更新されました。
19件の返信を表示中(うち親返信7件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAで「DeepSeek v3.1をベンチマークした人いる?」という投稿が話題になっていました。パフォーマンスやコスト、プライバシー面での比較が行われています。URL:
-
名無しさん自分も気になってた。V2.5からどのくらい改善されてるんだろう?
-
名無しさんV3.1はコード生成がかなり良くなったって聞いたけど、ベンチマーク見ないとね。
-
-
名無しさんとりあえずMMLUやHumanEvalのスコアを他のモデルと比較したい。
-
名無しさんRedditのスレだと、Llama 3.1 70Bと同等くらいって意見があったよ。
-
名無しさんでもパラメータ数が違うから単純比較はできないよね。
-
-
-
名無しさんローカルで動かすには量子化が必須。Q4_K_Mでどのくらい精度落ちるのか試したい。
-
名無しさん自分はRTX 4090でQ8だとVRAM足りなくて、Q4にしたら結構劣化した。
-
名無しさんそうなんだ…やっぱりQ8以上じゃないと実用的じゃないかも。
-
-
-
名無しさんAPI使うならコスト面も気になる。DeepSeekのAPIは安いけど、レスポンス遅くない?
-
名無しさん確かにたまに遅い。でも課金制だから無料枠で試すのがおすすめ。
-
-
名無しさんプライバシー重視ならローカル一択。だけどV3.1はライセンス大丈夫なの?
-
名無しさんMITライセンスだったはず。商用利用もOKみたい。
-
名無しさんそれなら安心。でも中国のモデルってバイアスが心配。
-
名無しさんその辺はLlamaと比較してもそこまで変わらないと思うけどね。
-
-
-
-
名無しさんベンチマークより実際の使用感を教えてほしい。チャットとか文章要約はどう?
-
名無しさん試しに使ってみたけど、日本語の精度はLlamaよりいいかも。
-
名無しさんマジ?じゃあ試してみようかな。
-
-
-
名無しさんどなたか実際にベンチマーク取った方いらっしゃいますか?具体的な数字が知りたい。
-
名無しさん自分はOpen LLM Leaderboardのスコアを見たけど、V3.1はまだ載ってなかった。
-
-
-
投稿者投稿
19件の返信を表示中(うち親返信7件)
関連するAIトピック
- AIと人間の見分けがつくか? – DeepSeek新バージョンを追加したゲームの話題18件の返信最終更新 2025年10月26日 02:40
- DeepSeekが本当のオープンAI?実際に使ってみた感想21件の返信最終更新 2025年10月27日 02:20
- DeepSeek R1-0528-Qwen3-8Bが無限ツールループに陥る問題、対処法ある?20件の返信最終更新 2025年10月26日 00:54
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2025年10月27日 09:07
- DeepSeek-R1-0528-Qwen3-8B を試した人の感想27件の返信最終更新 2025年10月26日 19:01