- このトピックには21件の返信、7人の参加者があり、最後に名無しさんにより1年、 2ヶ月前に更新されました。
21件の返信を表示中(うち親返信11件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAで、Windowsユーザーを対象にChatGPT、Gemini、DeepSeekなどのLLM性能をテストする学術研究の協力依頼がありました。ネットワーク研究の一環で、実際のユーザー環境でのパフォーマンスデータを収集したいとのこと。協力するとしたら何に気をつけるべき?ベンチマーク結果の共有やプライバシー面など、意見を聞かせてください。ッド:
-
名無しさんこれ面白そう。スペックと実行時間を提供するだけでいいなら協力してもいいかな。
-
名無しさんでも学術研究って言っても本当に信用できるの?個人情報抜かれないか心配。
-
-
名無しさんDeepSeekのローカル性能に興味あるから参加してみたい。API経由じゃなくてローカル実行のデータってあんまりないし。
-
名無しさんそうそう、でもWindowsでDeepSeek動かすの結構メモリ食うよね。自分の環境でちゃんと走るか試すいい機会かも。
-
-
名無しさん協力してあげたいけど、ベンチマークツールがどこまで信頼できるかだよな。研究者側が適切に測定してるのか疑問。
-
名無しさん確かに。同じLLMでもシステム設定で結構変わるし、統一した条件にしないと意味ないかも。
-
-
名無しさんChatGPTとGeminiはクラウドだからネットワーク速度が影響するし、比較するならローカルLLMと分けないと不公平だな。
-
名無しさんその点、DeepSeekはローカルでも動くから面白いけど、APIもあるって話だね。研究の目的はネットワーク周りのパフォーマンスらしいから、遅延とかも計測するのかな。
-
-
名無しさん自分もWindowsユーザーだけど、どのバージョンのWindowsを想定してるんだろ?Win11とWin10で違いが出るかもしれん。
-
名無しさんGPUの有無も大きいよな。RTX積んでる人と内蔵GPUだけじゃ全然差が出る。研究側はそれ系の情報も集めるのかな。
-
-
名無しさん参加する場合は仮想環境かDockerで隔離してやろうと思う。ホストに変なの残らないようにね。
-
名無しさんそれ賢い。学術って言ってもリスクゼロじゃないし、自分もサブマシンで試すわ。
-
-
名無しさん英語のスレッドだけど、日本からもデータ提供したら研究の多様性に貢献できそう。
-
名無しさんでも返報はあるの?論文の謝辞に載るとか?そこらへん明記してほしいな。
-
-
名無しさんベンチマークの種類にもよるけど、コード生成やタスクなら得意なモデルが偏るから、結果の解釈は慎重にね。
-
名無しさんそうそう。汎用性能を測りたいなら複数タスクで評価しないとね。研究側もその辺はわかってると思うけど。
-
-
名無しさん協力する前にIRB(倫理審査)通ってるか確認した方がいいな。学術なら普通通ってるはずだけど。
-
名無しさんその点Redditのスレッドには詳しく書いてなかったね。リンク先のフォームとか見てみないと。
-
-
名無しさんそもそもネットワーク研究って言うからには、どの通信プロトコル使ってるかとかも気になる。HTTP2か3かで遅延変わるし。
-
名無しさんああ、それでクラウドモデル含めてるのか。ローカルLLMだけじゃネットワーク部分は測れないもんな。
-
-
名無しさんとりあえず自分は興味あるから連絡してみる。後でどんな内容だったかレポートするよ。
-
-
投稿者投稿
21件の返信を表示中(うち親返信11件)
関連するAIトピック
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2025年6月26日 17:23
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2025年6月26日 13:56
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2025年6月26日 15:37
- DeepSeek R1-0528のシステムプロンプトがリークされたらしい16件の返信最終更新 2025年6月25日 12:50
- AIと人間の見分けがつくか? – DeepSeek新バージョンを追加したゲームの話題18件の返信最終更新 2025年6月25日 10:56