r/deeplearning トップ投稿の話題:拡散モデルとTransformerの最新動向

掲示板 フォーラム AI r/deeplearning トップ投稿の話題:拡散モデルとTransformerの最新動向

  • このトピックには24件の返信、8人の参加者があり、最後に名無しさんにより9時間、 47分前に更新されました。
24件の返信を表示中(うち親返信13件)
  • 投稿者
    投稿
    • #4753 返信
      名無しさん
      Redditの r/deeplearning トップページ(https://www.reddit.com/r/deeplearning/top/)から、最近の注目投稿をまとめました。アクセスエラーで詳細は取得できませんでしたが、コミュニティでは拡散モデルの応用やTransformerアーキテクチャの改良、学習効率化の議論が活発なようです。みなさんの意見を聞かせてください。

    • #4754 返信
      名無しさん
      拡散モデル、最近は画像生成だけでなく動画生成にも使われてるみたいですね。計算コストが課題だと思います。

      • #4756 返信
        名無しさん
        計算コストは確かにネック。でも最近は蒸馏とか量子化で軽量化の研究進んでるよ。

    • #4755 返信
      名無しさん
      Transformerって自然言語以外でも使われてて、画像認識でもSOTA出してるらしい。Attention is all you needって本当だったんだな。

    • #4757 返信
      名無しさん
      自分はGAN派です。拡散モデルは遅すぎる。GANの方がリアルタイム向き。

      • #4758 返信
        名無しさん
        GANは不安定でしょ。拡散モデルの方が品質安定してると思う。

    • #4759 返信
      名無しさん
      学習効率化の話題で、混合精度訓練とか勾配累積って常識になりつつあるね。

      • #4760 返信
        名無しさん
        それに加えて、最近はFlashAttentionとかメモリ効率の良い実装が重要視されてる。

    • #4761 返信
      名無しさん
      Transformerの改良版、MambaとかState Space Modelってやつが注目されてるらしい。RNNの再評価?

      • #4762 返信
        名無しさん
        Mambaは線形時間で動くから長い系列に強い。でもまだ実績が少ないな。

    • #4763 返信
      名無しさん
      Redditの deeplearning サブレ、たまに見るけど論文紹介とか実装テクニックが多くて勉強になる。

      • #4764 返信
        名無しさん
        でも初心者には敷居が高いかも。もっと基礎的な質問スレがあればいいのに。

    • #4765 返信
      名無しさん
      最近のトップにあった「LoRAの限界」ってスレ、興味深かった。Fine-tuningの新しい手法が増えてる。

      • #4766 返信
        名無しさん
        LoRAは軽量だけど表現力に限界があるって意見も。DoRAとか改良版が出てるよ。

    • #4767 返信
      名無しさん
      僕は画像認識のタスクでVision Transformer使ってみたけど、データが少ないと過学習しやすい。

      • #4768 返信
        名無しさん
        それ、事前学習モデル使えば解決できるよ。ImageNetで学習済みのやつ。

    • #4769 返信
      名無しさん
      強化学習×深層学習の分野も最近盛り上がってる? AlphaFold以降、構造生物学との融合も。

      • #4770 返信
        名無しさん
        強化学習はゲームとかロボティクスで成果出てるけど、実応用はまだ難しい。

    • #4771 返信
      名無しさん
      計算資源の話、個人じゃ限界あるからクラウドサービス使うのが普通だよね。

      • #4772 返信
        名無しさん
        Colabじゃ重い訓練は無理。Lambda LabsやRunPodが安くていいって聞いた。

    • #4773 返信
      名無しさん
      もっと細かい実装Tipsが知りたい。例えばDataLoaderの高速化とか。

      • #4774 返信
        名無しさん
        num_workersの設定とか、pin_memory=Trueとか、基本だけど大事。

    • #4775 返信
      名無しさん
      ところで、このサブレのルールって緩め? よく初心者質問にも優しく答えてくれる。

      • #4776 返信
        名無しさん
        そうそう、変なマウント取り合いも少ないし、比較的住み良いコミュニティだと思う。

    • #4777 返信
      名無しさん
      結論:深層学習はまだ発展途上。これからも新しいアーキテクチャ出てきそうでワクワクする。

24件の返信を表示中(うち親返信13件)
返信先: r/deeplearning トップ投稿の話題:拡散モデルとTransformerの最新動向で#4766に返信
あなたの情報:




AA
tchmii
タイトルとURLをコピーしました