深層学習の学習：BERT

BERT BERTとは、2018年にGoogleが発表した自然言語処理用の深層学習モデルである。論文タイトル BERT:Pre-training of Deep Bidirectional Transformers for Language Understanding 投稿日 2018/10/11 著者 Jacob Devlin, Ming-Wei Chang, Kenton Lee, Kri…

2021-12-26

LSTM/RNNの実装

通常のニューラルネットワーク一般のニューラルネットワークにおける順伝搬は下記のように表せる。下図のニューラルネットワークでは、下記の式になる。と置けば、下記のように書ける。 ...(1) ...(2) 誤差逆伝搬法損失関数をLとすると、誤差の勾配は(1)…

2021-12-17

ラビットチャレンジレポート　深層学習　その5

DCGAN GAN(Generative Adversarial Network)とは生成器と識別機を競わせて学習する生成＆識別モデル。 Generator（生成器）：乱数からデータを生成 Discriminator（識別器）：入力データが真値（学習データ）であるかを識別する。 2プレイヤーのミニマック…

2021-12-16

ラビットチャレンジレポート　深層学習　その４

Section5 物体検知とセマンティックセグメンテーション物体認識の種類分類(Classification) 画面全体のクラスラベル物体検知(Object Detection) 画面の中で物体を個別にボックス(bounding boxでとらえる意味領域分割(Semantic Segmentation) 各ピクセル…

2021-12-13

ラビットチャレンジレポート　深層学習Day4 その３

Section 5 Transformer 5-1 Seq2seq seq2seqとは系列(sequence)を入力として、系列を出すもの。Encoder-Decoderモデルとも呼ばれる。入力系列が内部状態に変換(encode)され、内部状態から系列に変換(decode)される。実応用上も、入力・出力ともに系列情報…

2021-12-10

ラビットチャレンジレポート　深層学習Day4 その２

Section3 軽量化・高速化技術軽量化・高速化が必要な理由深層学習は、計算量が多く、計算機の負担が大きいネットワークである。しかも、年10倍程度の速度で、処理データが増加し、モデルが複雑になっている。対して、コンピュータの処理速度の向上は、ほ…

2021-12-07

ラビットチャレンジレポート　深層学習　Day4　その１

Section1 強化学習 1-1強化学習とは長期的に報酬を最大化できるように環境のなかで行動を選択できるエージェントを作ることを目標とする機械学習の一分野である。下記のように、ある方策Πに基づいた行動をとり、状態Sの変化を観測して価値Vを報酬として受…

2021-12-01

ラビットチャレンジ　深層学習Day3 その３

Section5 Seq2Seq Seq2Seq2は、2014年にGoogleにより発表された技術であり、機械翻訳やチャットボットのようなシーケンシャルなデータの処理に向いた技術である。基本的な構造は下図のようになっている。入力データを中間データに変換するEncoderと言われ…

2021-11-30

ラビットチャレンジ　深層学習Day3 その２

Section2 LSTM RNNの課題勾配消失時間を遡るほど勾配が消失してしまうため、長い時系列の学習が困難だった。勾配消失は、誤差逆伝搬法で深い層のニューラルネットワークを遡る時に見られる現象で、1より小さい値になる微分値が多数乗算されることにより引…

2021-11-28

ラビットチャレンジレポート　深層学習Day3 その１

Section1 RNN 1-1 RNN全体像 1-1-1 RNNとは RNNとは、時系列データに対応可能なニューラルネットワークである。 1-1-2 時系列データ時系列データとは、時間的順序を追って一定間隔ごとに観察され、しかも相互に統計的依存関係が認められるようなデータの系…

2021-11-21

ラビットチャレンジレポート　深層学習Day2 その３

Section4 畳み込みニューラルネットワークの概念畳み込みニューラルネットワーク(CNN)は各次元で連続性のあるデータを扱うのに適したネットワークである。 CNNの構造の代表例は下記である。入力層 ↓ 畳み込み層 ↓ 畳み込み層 ↓ プーリング層 ↓ 畳み込み層 …

2021-11-20

ラビットチャレンジレポート　深層学習DAY2 その２

Section2 学習率最適化手法について学習率とは学習を通して教師データとの誤差を最小にするネットワークを作成するために取られる手法を勾配降下法という。勾配降下法では、パラメータ更新する際の変化を規定する係数εを学習率という。 · 学習率の値が大き…

2021-11-19

ラビットチャレンジレポート　深層学習DAY2その１

Section1 勾配消失問題誤差逆伝搬法誤差逆伝搬法とは、計算結果から微分を逆算することで、不要な再帰的計算を避けて微分を算出する手法である。確認テスト連鎖律の原理を使い、下記の式のdz/dxを求めよ [解答] 勾配消失問題とは誤差逆伝搬法が下位層に…

2021-11-18

ラビットチャレンジレポート　深層学習DAY1

Section 1 入力層～活性層確認テスト [答え] ディープラーニングは明示的なプログラムの代わりに、ニューラルネットワークを用いて各種パラメータを最適化することによって、入力値から目的とする出力地に変換する数学モデルを構築すること最適化の最終目…

2021-11-14

ラビットチャレンジレポート　機械学習後半

非線形回帰モデル複雑な非線形構造を内在する現象に関しては、非線形モデルを適用する。規定展開法回帰関数として基底関数と呼ばれる非線形関数とパラメータベクトルの線形結合を使用するよく使われる既定関数は、多項式関数やガウス型既定関数、スプラ…

2021-11-12

ラビットチャレンジレポート：機械学習前半

回帰モデル回帰問題：ある入力から出力を予測する問題直線で予測→線形回帰曲線で予測→非線形回帰線形回帰モデル回帰問題を解くための機械学習モデル教師あり学習パラメータ：線形結合（入力とパラメータの内積）入力と未知のパラメータの各要素を掛…

tibetter’s blog

2021-01-01から1年間の記事一覧