ぴよ猫ちゃんの機械学習

AI、人工知能、機械学習について色々記事にしています。

ディープラーニングのモデルまとめ

こんにちはー。管理人のピヨ猫でーす。

疑問

ディープラーニングのモデルってCNNとかLeNETとかネットに記事が色々あるけれど、用語がいっぱいあるし全部略語で良く分からないんだー。 ディープラーニングの種類ってどんなものがあるのか分かり易く教えてよ。

f:id:shibayu2002:20190310112521j:plain

ディープラーニングって幅が広くて、何がどういうものか良く分からなかったりするよね。分かり易く体系立ててまとめてみたよ。

1.機械学習の基本モデルと応用モデル

機械学習のモデルは大別すると基本モデルと応用モデルに分かれます。
注)基本モデルと応用モデルはぴよ猫の造語です。巷で基本モデルと応用モデルという分け方はあまり聞きませんが、そう考えた方がシンプルに説明できるので、ここでは基本モデルと応用モデルという言葉を使います。

例えばテキスト予想や株価予想は連続するデータから何かを予想するということは変わりません。 この、連続するデータから何かを予想するといった基本的な仕組みを基本モデルと呼び、基本モデルを応用してテキストの予想をするとか株価の予想をするといった、予想したいことに適した仕組みにしたモデルを応用モデルと呼ぶこととします。

2.機械学習の基本モデル

全ての基本となるモデル ~ オートエンコーダー

オートエンコーダーディープラーニングの全ての基礎となるモデルです。
オートエンコーダーは入力層、隠れ層、出力層で成り立っており、入力層で与えられた情報を隠れそうで特長を分析して出力層の次元に情報を圧縮します。
オートエンコーダー

特徴抽出とか次元圧縮と聞くと何のことかピンとこないかと思いますが、我々が日常で行っていることです。
例えば、車にはセリカトヨタ)、シルビア(日産)、シビック(ホンダ)とか色々ありますが全て「車」です。 また、道路には車やバイクや自転車が走っています。我々は道路で走っている物をみて、あれは車、あれはバイクと見分けています。
この物を見分けることを特徴抽出と言います。
また似たようなものを同じ概念と捉えることを次元圧縮と言います。

例)

  • 特徴抽出 ・・・ 車とバイクと自転車を見分けること
  • 次元圧縮 ・・・ セリカもシルビアもシビックも車と一括りにすること

画像解析の基本となるモデル ~ CNN(Convolutional Neural Network) ~

CNNは畳み込みニューラルネットワークと言い、画像解析を行うためのモデルとなります。
CNNは隠れ層に畳み込みフィルターを用いることで画像の特長を高い精度で抽出できるモデルとなります。
CNN

やりたいことはオートエンコーダーと同じです。画像の特長抽出と次元圧縮を行います。
但し、畳み込み層を用いることでオートエンコーダーより画像の特長抽出能力が向上したモデルとなります。

CNNの発展モデル

画像解析の基本となるモデルとなるCNNですが、現在はより画像の特長抽出能力が増した様々なモデルが存在します。
【画像解析の基本モデル】

  • LeNet
  • AlexNet
  • ReLU
  • NIM
  • VGGNet
  • GoogLeNet
  • ResNet

結論を述べると、現在の主流はResNetです。画像解析を行う場合はResNetを使うのが良いです。 ここの解説はQiitaに丸投げします(;^_^A qiita.com

連続データ分析の基本となるモデル ~ RNN(Recurrent Neural Network) ~

RNNは隠れ層の出力を隠れ層の入力に戻すことで連続データの特長抽出を可能としたディープラーニングのモデルになります。
RNN

やりたいことはオートエンコーダーと同じです。連続データの特長抽出と次元圧縮を行います。
但し、隠れ層の出力を隠れ層の入力に戻すことでオートエンコーダーより連続データの特長抽出能力が向上したモデルとなります。

RNNの発展モデル

連続データの解析の基本となるモデルとなるRNNですが、現在はより連続データの特長抽出能力が増した様々なモデルが存在します。
【連続データ解析の基本モデル】

  • LSTM
  • BRNN
  • BLSTM
  • GRU

結論を述べると、現在の主流はLSTMです。連続データ解析を行う場合は迷ったらLSTMを使うのが良いです。
ただ、LSTMは重いので、最近はLSTMを軽量化したGRUも用いられることがある様です。
BLSTMはLSTMの改良版で過去から未来と未来から過去へそれぞれデータの重みづけが出来ます。時間はかかりますがLSTMより高い精度を求める場合はBLSTMを使った方が良いです。 ここの解説はQiitaに丸投げします(;^_^A qiita.com

3.機械学習の応用モデル

物体検出

◆ モデルの種類

  • R-CNN
  • Fast R-CNN,
  • Faster R-CNN,
  • Mask R-CNN

◆ モデルの説明
qiita.com

セマンティックセグメンテーション

◆ モデルの種類

  • FCN
  • U-Net

◆ モデルの説明
qiita.com

自然言語処理

◆ モデルの種類

  • CBOW
  • fastText
  • ELMo

◆ モデルの説明
qiita.com

画像脚注付け

◆ モデルの種類

◆ モデルの説明
qiita.com

ニューラルチューリングマシン

◆ モデルの種類
調査中

◆ モデルの説明
qiita.com

音声認識

◆ モデルの種類

  • WaveNet

◆ モデルの説明
qiita.com

強化学習

◆ モデルの種類

  • Double DQN
  • Dueling Network
  • Categorical DQN
  • Rainbow

◆ モデルの説明
qiita.com

画像生成モデル

◆ モデルの種類

  • DCGAN

◆ モデルの説明
qiita.com

まとめてみた感想

ちょっと量が多すぎたーー。
途中からQuiitaに丸投げしまくりました。反省。
この記事は自分の理解度が上がって時間が出来たらまとめ直したいと思いまーす。

f:id:shibayu2002:20190310112521j:plain


(参考)日本ディープラーニング協会(JDLA)のその他の推薦図書

◆◆AI白書 2019 / 情報処理推進機構AI白書編集委員会/編 / 角川アスキー総合研究所

価格:3,888円
(2019/4/3 22:46時点)
感想(0件)

人工知能は人間を超えるか ディープラーニングの先にあるもの (角川EPUB選書) [ 松尾豊 ]

価格:1,512円
(2019/4/3 22:46時点)
感想(2件)