本稿は、生成AIを支える代表的な要素技術を通観し、どの仕組みがどの課題に強く、どんな落とし穴があるのかを実務の目線でまとめたガイドです。 自己回帰モデル、ディープラーニングの考え方、そしてCNN・VAE・GAN・RNN・LSTMという主要アーキテクチャを ...
自然言語処理分野におけるブレイクスルーとなったTransformerをコンピュータビジョンに応用したモデルがVision Transformer(ViT)です。さまざまなコンピュータビジョンのタスクにおいて、ディープラーニングではスタンダードとなっているRNN、CNN、および既存 ...
ニューラルネットワークの中でもリカレントニューラルネットワーク(RNN)は、言語モデリングや機械翻訳、質疑応答といった言語理解タスクに対する主要なアプローチ方法と見なされています。そんな中、GoogleがRNNよりも言語理解タスクに秀でた新しい ...