DeepSeekのマルチモーダルモデル、ローカルで使える?

掲示板 フォーラム AI DeepSeekのマルチモーダルモデル、ローカルで使える?

  • このトピックには27件の返信、9人の参加者があり、最後に名無しさんにより8ヶ月、 1週前に更新されました。
27件の返信を表示中(うち親返信12件)
  • 投稿者
    投稿
    • #63421 返信
      名無しさん
      Redditのr/LocalLLaMAでDeepSeekのマルチモーダルモデル(Vision)が話題になってました。ローカルLLMとしての使い勝手、コーディング性能、コスト、プライバシー、ベンチマーク比較など、様々な観点から議論されています。

    • #63422 返信
      名無しさん
      DeepSeekのマルチモーダルってどんな感じ?画像認識もできるの?

      • #63424 返信
        名無しさん
        画像入力もテキストも扱えるみたい。ただ、ローカルで動かすには結構なメモリが必要そう。

        • #63426 返信
          名無しさん
          メモリ64GBあればなんとか動くって人もいた。量子化バージョンが出ればもっと手軽になるかも。

    • #63423 返信
      名無しさん
      V3よりさらに進化してるらしいね。コーディングのベンチマークでも結構いいスコア出してるって話。

    • #63425 返信
      名無しさん
      コスト面ではAPI使った方が安いのかな?ローカルは電気代とか考えると…

      • #63428 返信
        名無しさん
        APIって一回いくら?DeepSeek結構安いって聞いたけど。

        • #63429 返信
          名無しさん
          入力トークン100万あたり$0.14とか?GPT-4oよりは安いよね。

    • #63427 返信
      名無しさん
      プライバシー重視ならローカル一択だけど、性能はクラウドの方が上って意見も多いね。

    • #63430 返信
      名無しさん
      でも中国のモデルだからデータがどう使われるか不安って声もあったな。

      • #63431 返信
        名無しさん
        そこはローカルで動かせば問題ないんじゃない?コードも公開されてるし。

    • #63432 返信
      名無しさん
      ベンチマークではClaudeやGPTと同等って話もあるけど、実際のタスクだとどうなんだろ。

      • #63433 返信
        名無しさん
        コーディングは結構優秀って評判。特にPythonとか。

        • #63434 返信
          名無しさん
          俺も試したけど、簡単なスクリプトなら一発で動いたわ。

    • #63435 返信
      名無しさん
      マルチモーダルって具体的に何ができるの?画像の説明とか?

      • #63436 返信
        名無しさん
        画像の中の文字読み取ったり、物体認識したりできるっぽい。ドキュメント解析に使えるかも。

    • #63437 返信
      名無しさん
      でもRedditのスレッド見る限り、まだバグ多いって意見もあるね。量子化で精度落ちるとか。

      • #63438 返信
        名無しさん
        FP16で動かせば大丈夫らしいけど、VRAMが爆食い。

    • #63439 返信
      名無しさん
      個人的にはローカルLLMの選択肢が増えるのはいいこと。DeepSeekはオープンウェイトだから安心。

      • #63440 返信
        名無しさん
        でもライセンスがちょっと気になる。商用利用はOK?

        • #63441 返信
          名無しさん
          MITライセンスらしいから商用も大丈夫だよ。

    • #63442 返信
      名無しさん
      ローカルで動かすならllama.cpp対応してる?

      • #63443 返信
        名無しさん
        対応してるみたい。GGUF形式で配布されてる。

        • #63444 返信
          名無しさん
          マジか、じゃあ今度試してみよう。

    • #63445 返信
      名無しさん
      でも結局、用途によるよね。チャットボットならClaude、コーディングならDeepSeekって住み分け?

      • #63446 返信
        名無しさん
        そうかも。あとは日本語の性能がどうか気になる。

    • #63447 返信
      名無しさん
      Redditのスレッドでも日本語の話題はあんまりなかったな。

      • #63448 返信
        名無しさん
        試してみないとわかんないね。とりあえずダウンロードしてみるわ。

27件の返信を表示中(うち親返信12件)
返信先: DeepSeekのマルチモーダルモデル、ローカルで使える?で#63445に返信
あなたの情報:




AA
tchmii
タイトルとURLをコピーしました