深層学習の学習：BERT

BERT BERTとは、2018年にGoogleが発表した自然言語処理用の深層学習モデルである。論文タイトル BERT:Pre-training of Deep Bidirectional Transformers for Language Understanding 投稿日 2018/10/11 著者 Jacob Devlin, Ming-Wei Chang, Kenton Lee, Kri…

2021-12-26

LSTM/RNNの実装

通常のニューラルネットワーク一般のニューラルネットワークにおける順伝搬は下記のように表せる。下図のニューラルネットワークでは、下記の式になる。と置けば、下記のように書ける。 ...(1) ...(2) 誤差逆伝搬法損失関数をLとすると、誤差の勾配は(1)…

2021-12-17

ラビットチャレンジレポート　深層学習　その5

DCGAN GAN(Generative Adversarial Network)とは生成器と識別機を競わせて学習する生成＆識別モデル。 Generator（生成器）：乱数からデータを生成 Discriminator（識別器）：入力データが真値（学習データ）であるかを識別する。 2プレイヤーのミニマック…

2021-12-16

ラビットチャレンジレポート　深層学習　その４

Section5 物体検知とセマンティックセグメンテーション物体認識の種類分類(Classification) 画面全体のクラスラベル物体検知(Object Detection) 画面の中で物体を個別にボックス(bounding boxでとらえる意味領域分割(Semantic Segmentation) 各ピクセル…

2021-12-13

ラビットチャレンジレポート　深層学習Day4 その３

Section 5 Transformer 5-1 Seq2seq seq2seqとは系列(sequence)を入力として、系列を出すもの。Encoder-Decoderモデルとも呼ばれる。入力系列が内部状態に変換(encode)され、内部状態から系列に変換(decode)される。実応用上も、入力・出力ともに系列情報…