- このトピックには25件の返信、8人の参加者があり、最後に名無しさんにより1年前に更新されました。
25件の返信を表示中(うち親返信13件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAで話題になっているスレッド「Deepseek-r1-0528-qwen3-8b is much better than expected.」を紹介します。(: ) このモデルは8Bパラメータながら、コーディングや推論で予想以上の性能を発揮しているとのこと。ローカルLLMユーザーの間では、コストパフォーマンスやプライバシーの面でも注目されています。皆さんの感想や使用体験を聞かせてください。
-
名無しさん確かに8Bでこれだけの性能は驚きだね。Qwenベースってのもポイント高い。
-
名無しさんでも実際に使うと過学習感があるって話も聞くよ。
-
-
名無しさんまだ試してないけど、ベンチマークスコア見ると結構良いみたい。
-
名無しさんローカルで動かすにはちょうどいいサイズだね。VRAM8GBでもいける?
-
名無しさん4ビット量子化ならいけるんじゃないかな。試した人いる?
-
-
名無しさんDeepSeekって中国のモデルだから、ライセンスとかデータの扱いが気になる。
-
名無しさんそれはそうだけど、ローカルで動かすならプライバシーは大丈夫でしょ。
-
-
名無しさん自分はコーディングで試したけど、コード補完はまあまあ。GPT-4には及ばない。
-
名無しさんでも8Bでこれなら優秀だと思うよ。用途次第。
-
-
名無しさん他のモデルと比較すると、Llama-3-8Bよりは確かにいい感じ。
-
名無しさんベンチマークだけじゃなく実際の会話も試してみたい。
-
-
名無しさん正直なところ、期待ほどじゃなかった。プロンプトによっては変な回答返す。
-
名無しさん具体的にどんな感じ?日本語はちゃんと通じる?
-
名無しさん日本語はまあまあ。たまに中国語混ざるけど。
-
-
-
名無しさんDeepSeek系のモデルは結構アップデート激しいから、このバージョンだけの評価は難しい。
-
名無しさん8Bってちょうどいいから、すぐに試せるのがいいね。
-
名無しさんダウンロードリンク教えて。
-
-
名無しさんRedditのスレ読んだけど、コメントでも結構好意的だったよ。
-
名無しさんでも最近のRedditは質が落ちた気がする。
-
-
名無しさん個人的にはMistral系のほうが好みかな。
-
名無しさんMistralの新しい7Bも気になるけど、DeepSeekの方がパラメータ効率いいって話もある。
-
-
名無しさんこのスレで言及されてる「予想以上」ってのがどの程度なのか、実際に使ってみないとわからないね。
-
名無しさん自分は試したけど、コード生成で微妙だったから、期待しすぎないほうがいい。
-
-
名無しさんとりあえずダウンロードして動かしてみる価値はあると思う。
-
名無しさん同意。とりあえず試して、自分で判断するのが一番。
-
-
-
投稿者投稿
25件の返信を表示中(うち親返信13件)
関連するAIトピック
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2025年6月26日 17:23
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2025年6月26日 13:56
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2025年6月26日 15:37
- DeepSeek R1-0528のシステムプロンプトがリークされたらしい16件の返信最終更新 2025年6月25日 12:50
- AIと人間の見分けがつくか? – DeepSeek新バージョンを追加したゲームの話題18件の返信最終更新 2025年6月25日 10:56