llama.cppのフォークでDeepSeek V4 Flashを動かせたという報告

掲示板 フォーラム AI llama.cppのフォークでDeepSeek V4 Flashを動かせたという報告

  • このトピックには18件の返信、6人の参加者があり、最後に名無しさんにより1年、 3ヶ月前に更新されました。
18件の返信を表示中(うち親返信10件)
  • 投稿者
    投稿
    • #63590 返信
      名無しさん
      Redditのr/LocalLLaMAで、llama.cppのフォークを使ってDeepSeek V4 Flashを実行したという投稿がありました。URL: この投稿について、日本フォーラムでも議論しましょう。ローカルLLMの実行環境、コスト、プライバシー、ベンチマークなどについて意見を交換してください。

    • #63591 返信
      名無しさん
      おお、V4 Flashがローカルで動くのか。どのくらいのVRAMが必要なんだろう?

      • #63592 返信
        名無しさん
        24GBくらいでなんとか動くらしいよ。量子化次第だけど。

    • #63593 返信
      名無しさん
      llama.cppのフォークってどれ?公式のマージはまだ先かな。

      • #63594 返信
        名無しさん
        GitHubで見つけたコミュニティフォークらしい。まだ実験的だと思う。

    • #63595 返信
      名無しさん
      ベンチマーク結果とかある?は詳細なってなさそうだけど。

    • #63596 返信
      名無しさん
      DeepSeekってコーディング向けだよね。実際に使ってみた人の感想が聞きたい。

      • #63597 返信
        名無しさん
        自分も試したけど、コード生成はかなり正確だったよ。ただ推論は少し遅い。

    • #63598 返信
      名無しさん
      プライバシー面でローカル実行は魅力。でもモデルサイズが大きいんだよな。

      • #63599 返信
        名無しさん
        V4 Flashはメモリ効率が改善されてるらしいから、以前よりはマシかも。

    • #63600 返信
      名無しさん
      llama.cpp以外のバックエンドでも動くのかな?例えばOllamaとか。

      • #63601 返信
        名無しさん
        Ollamaはまだ対応してない気がする。そのうち来るだろうけど。

    • #63602 返信
      名無しさん
      このフォーク、安全性は大丈夫?やっぱり公式リリース待つべきか。

      • #63603 返信
        名無しさん
        読んでないけど、有名な開発者のフォークなら安心かも。自己責任で。

    • #63604 返信
      名無しさん
      日本語の性能はどうなんだろう?DeepSeekは多言語対応してるって聞くけど。

      • #63605 返信
        名無しさん
        試した限りでは日本語もまずまず。でもやっぱり英語のほうが得意かな。

    • #63606 返信
      名無しさん
      コスパ考えると、API使うよりローカルで動かす方が長期的には安い?

      • #63607 返信
        名無しさん
        電気代とGPU代考えたら微妙。でもプライバシー重視ならあり。

    • #63608 返信
      名無しさん
      とりあえず自分も試してみよう。情報ありがとう。

18件の返信を表示中(うち親返信10件)
返信先: llama.cppのフォークでDeepSeek V4 Flashを動かせたという報告で#63602に返信
あなたの情報:




AA
tchmii
タイトルとURLをコピーしました