用語意味
AdaBoostエイダブースト(アダブースト)は、Yoav FreundとRobert Schapireによって考案された機械学習アルゴリズム。AdaBoost は、それぞれの標本に対し、弱い分類器順に適用し、それぞれの分類器が正解したか否かを判断する。間違って分類された標本に対応する重みより重くされる
Adam勾配降下法の改良アルゴリズム。Adamは過去の勾配のスライディングウィンドウに基づいて学習率をパラメータごとに調整し計算を行うアルゴリズム。画像認識など良く利用されている。
AI人工知能。推論、認識、判断など、人間と同じ知的な処理能力を持つ機械のこととされる。ただし専門家の間でも明確な定義はされていない。
AI効果AIで何か新しいことが実現されると、「それは自動化であって知能ではない」と思いたがる人間の心理的効果のこと
AlexNetAlexNetは、Hinton教授らのチームによって発表された物体認識のためのモデル。AlexNetが、物体認識のために、初めて深層学習の概念および畳み込みニューラルネットワークの概念を取り入れた。画像分類チャレンジコンテスト(ILSVRC)において、AlexNetが飛躍てきな性能を果たした。
AlphaGoディープマインド社が開発した囲碁プログラム。2016年にトップレベルのプロ棋士に勝った。
AlphaGo ZeroAlphaGo の改良版。2017年に発表された。AlphaGoが過去の棋譜を使って学習したのに対し、AlphaGo Zeroは棋譜を全く使わず自己学習のみでAlphaGoを超える強さを獲得した。
Attentionseq2seq の改良のため、2つの時系列データ間の対応関係を学習するAttention層を追加したニューラルネットワーク。
Bidirectional RNNRNNの改良で、LSTMを2つ組み合わせて、過去方向だけでなく未来方向からの情報もフィードバックできるようにしたもの。時間情報の欠損部分を予測することができる。
BoWBag of Wordsの略。テキストデータを数値化する技法の1つ。ある文書における単語の出現回数を数えるアルゴリズム。単語数を数えることにより、複数の文書を比較したり類似性を測定することができる
BPTTBackPropagation Through-Time。RNNにおける誤差逆伝搬が、過去に遡って誤差を反映することになるため、こう呼ばれる。
CBOWword2vecの一手法。周囲の単語からある単語を予測するモデル。skip-gramも参照のこと。
Chainer国内企業であるPreferredNetworks社が開発したディープラーニング用のフレームワーク。
Cycプロジェクトすべての一般常識をコンピュータに取り込むことを目的としたプロジェクト。開始から30年以上経った今も継続中、
DCGNNDeep Convolution GAN。CNNを用いたGANを指す。
DENDRAL有機化合物を特定するためのエキスパートシステム
DNNディープニューラルネットワークのことを。ニューラルネットワークの層を深くしたモデルのこと言う。
DQN従来の強化学習の手法であるQ学習にディープラーニングを組み合わせたもの。
early stopingニューラルネットワークでの学習において、オーバーフィッティングを避けるため、学習を早めに打ち切る手法。
ElasticNet正則化L1正則化とL2正則化の両方をしようした正則化の手法。
ELIZA高度な技術を使わずに知的な振る舞いをする例として、1966年に開発された。人工無能の例
ELMo2 層の双方向リカレントネットワーク言語モデルを用いた、文章のベクトル表現を得る手法。
ENIAC世界初の汎用コンピュータ。1946年、アメリカのペンシルバニア大学で開発された。
fastRCNNR-CNNにおいて領域切り出しと物体認識を同時に行うことで、処理の高速化を実現したシステム。さらに改良されたfasterRNNも提案されている。
fastTextword2vecを提案したトマス・ミコロフにより2013年に提唱された自然言語処理の手法。単語の表現に文字の情報を含めることで、訓練データにない単語も表現可能とした。
FCN完全畳み込みネットワーク(Full Convolutional Network)。全層が畳み込み層であるCNN。入力画像の画素数分だけ出力層ができあがり、画素単位の分類(セマンティックセグメンテーション)が可能となる。
GAN敵対的生成ネットワークモデルとよばれるアルゴリズム。画像を生成したり、変換したりすることに利用されている。画像を生成するジェネレータと、画像を本物かジェネレータが生成した偽物かを判断するディスクリミネータがお互いを超えるように学習をしていく構成。
GooglePhotoGoogle社が開発した画像認識システム。アフリカ系の男女をゴリラと判定してしまうことで大きな問題となった。
GPGPUGeneral-Purpuse compiting on GPU。GPUを本来の画像処理以外の目的で使用できるように汎用化したもの。
GPUGraphic Processing Unit。画像処理用に最適化された演算処理装置。同一演算を多数同時並列で行うという特徴がディープラーニングでの処理に適しているため、頻繁に流用される。
HadoopApache Hadoopは大規模データの分散処理を支えるオープンソースのソフトウェアフレームワークであり、Javaで書かれている。Hadoopはアプリケーションが数千ノードおよびペタバイト級のデータを処理することを可能としている。
Heの初期値ニューラルネットワークにおいて、パラメータの初期値として与えておく値の例。シグモイド関数に対して有効であるとされている。
ILSVRCImageNet Large Scale Visual Recognition Challenge。大規模な画像データセットの代名詞でもあるImageNetを使った画像認識コンペティションのこと。2010年から開催されている。2012年にAlexNetがCNNを取り入れ驚異的な性能を示した。
ImageNet画像認識用の学習・研究用に良質な画像を集めたデータセットの1つ。1400万枚を超える画像がデータセットととして納められている。
k-means教師なしの機械学習の1つであるクラスタリングの計算を行うアルゴリズム。K平均法とも言う。
k-分割交差検証交差検証の一種。訓練データと評価データへの分割を複数回行い、それぞれで学習、検証を行う手法。ホールドアウト検証も参照のこと。
L1正則化過学習を防ぐ正則化の手法。特定のデータの重みを0にする事で、不要なデータを削除する手法。LASSO(ラッソ)回帰も参照のこと。
L2正則化過学習を防ぐ正則化の手法。データの大きさに応じて0に近づけて、滑らかなモデルとする手法。Ridge(リッジ)回帰も参照のこと。
LeNet1998年に、Yann LeCunによって考案された初の畳み込みネットワーク。構造としては、畳み込み層とプーリング層のセットを2回繰り返すのが特徴である。近年開発されたものと比較すると、層が浅く単純である。
LSTM時系列データを扱いディープラーニングの手法の1つ。RNNの欠点を改良したアルゴリズム。長期的な依存関係を学習することが可能
Mini-Max法ゲーム戦略で、自分の手順は自分が有利に、相手の手順は自分が不利になるよう戦略と立てる手法
MNIST「0」から「9」までの手書き数字画像60,000枚と、テスト用画像10,000枚を集めたデータセット。Mixed National Institute of Standards and Technology databaseの略。手書きの数字の認識用データセットとしてよく使われる。
MYCIN感染症の診断支援をするエキスパートシステム
NICニューラル画像脚注付け(Neural Image Captioning)。CNNによる画像認識とRNNによる言語モデルを組み合わせて画像の脚注を自動でつけるシステム。
NTMニューラルチューリングマシン(Nueral Turing Machine)。チューリングマシンをニューラルネットワークにより実現する試み。プログラムの入出力からプログラムを生成、すなわちプログラムの自動生成が可能となる。
NVIDIAGPU メーカ。ディープラーニング用のライブラリではNVIDIA製GPUしかサポートしていないものが多い。
one-hot-encodingn種類のカテゴリデータを、n次元ベクトルに変換して表現し、1桁のみ1とし残りの桁を全て0で表現したもの。学習時に正解ラベルをone-hot-encoding形式に加工することが良くある。
OpenCVインテル社が開発した画像処理用のオープンソースライブラリ。
PyTorchFacebook社が開発したディープラーニング用フレームワーク。
R-CNNRegional CNN。画像から物体がある領域を切り出し、切り出した領域ごとにCNNで処理をする手法。
RAINBOW強化学習の改善手法である、方策ベース、Q関数ベース、モデルベースのすべてを入れた強化学習のシステム。
ReLU関数ランプ関数とも呼ばれる活性化関数の1つ。微分しても0にならず、勾配消失しないため隠れ層(中間層)で良く使用される。派生として Leaky ReLU、Perametrc ReLU、Randomized ReLUなどもある。
Ridge(リッジ)回帰線形回帰に対しL2正則化を適用した手法。
RMSprop勾配降下法の改良アルゴリズム。鞍点問題を回避するための手法。RNNに適しているといわれている。
RNNRecurrent Neural Network(リカレントニューラルネットワーク)。再帰型ニューラルネットワークと呼ばれる。時系列データ予測の学習するに用いられる。隠れ層の出力の次の入力とすることで時系列に連続したデータの学習が可能となる。長期的な記憶の維持が困難になる欠点があり、LSTMで改良されている。
RNN Encoder-Docoder2つのLSTMを一つは入力を処理するエンコーダ、もう一つは出力を処理するデコーダとして組み合わせ、出力を時系列化するRNN。
RPARPA(Robotic Process Automation)。これまで人間が行ってきた作業を高性能な認知技術(ルールエンジン・機械学習・人工知能など)を用いることによって、業務の自動化や効率化を実現すること。
seq2seq入力、出力ともに時系列データとなるニューラルネットワークの総称。入力を処理するニューラルネットワークと出力を処理するニューラルネットワークからなる。
SHRDLU1970年、スタンフォード大学のテリー・ウィノグラードによって開発された「積み木の世界」のプランニングシステム。英語による指示が可能であった。
skip-gramword2vecの一手法。ある単語を与えて周囲の単語を予測するモデル。CBOWも参照のこと。
SQL関係データベースシステムにおいてデータの操作や、定義を行うためのデータベース言語。業務システムの多くは関係データベースを使用していおり、これらのデータを使用して機械学習を行う際はSQLを使用してデータを取り出すことになる。
SSDSingle Shot Decoder。領域の切り出しと認識を同時の行うことで画像の高速な検出処理を可能とした。
STRIPSStandard Reserch Institute Problem Solver。1971年に開発されたプランニングのための人工知能
SuperVisionトロント大学が開発したディープラーニングを用いた画像認識システム。2012年のILSVRCにおいて圧倒的な勝利を収め、ディープラーニングのブームの火付け役となった。
SVMサポートベクトルマシンと呼ばれる機械学習の手法。マージンの最大というコンセプトに基づいて設計されている。カーネトリックと呼ばれる技法を使い非線形問題にも対処できる
tanh関数ハイパボリックタンジェント。双曲線関数の1つ。ディープラーニングの活性化関数の1つ。隠れ層に良く利用される。
Tayマイクロソフト社が開発したTwitterボット
TensorflowGoogle社が開発した、ディープラーニング用のフレームワーク。最も利用されているフレームワーク。GPU版やブラウザでどうさするJavaScript版などが存在する。
TPUTensor Processing Unit。Google社製のテンソル計算に最適化された演算処理装置。
VAE変分オートエンコーダ(Variantional AutoEncoder)。画像分野での生成モデル。オートエンコーダにおいて入力を統計分布に変換しそれを学習の対象とする。
VGG16ImageNetと呼ばれる大規模画像データセットで学習された16層からなるCNNモデル。Oxford大学の研究グループが提案し2014年のILSVRで好成績を収めました。
Watsonワトソンは、IBMが開発した質問応答・意思決定支援システムのことで「自然言語を理解・学習し人間の意思決定を支援するもの」と定義されている。AWSやGoogleと同じようにクラウド上で画像認識などのサービスが利用できる。
WaveNet2016年にDeepMindから発表された音声合成システム。それまでの音声合成に比べ、はるかに自然な音声を生成する。時系列データを扱っているがRNNではなくCNNを用いている。
word2vec単語をベクトル化して表現し、テキスト処理をこなうニューラルネットワークのこと
Xavierの初期値ニューラルネットワークにおいて、パラメータの初期値として与えておく値の例。ReLU関数に対して有効であるとされている。
XgBoost勾配Boostingとランダムフォレストを組み合わせたアンサンブル学習のアルゴリズム。
YOLOYou Look Only Onseの略。YOLOはリアルタイムオブジェクト検出アルゴリズム。画像を一度CNNに通すことで、高速オブジェクトを検出することが可能になっている。
アファイン変換幾何学の分野で、ある図形を回転させたり引き延ばしたりする変換。
アンサンブル学習複数の機械学習アルゴリズムを組み合わせて学習すること。
アンダーフィッティングオーバーフィッティング(過学習)に対し、正則化などの対策をし過ぎて予測性能が低下してしまうこと。
イテレーションディープラーニングの学習において、重みを更新する回数を表す指標のこと。
インスタンスセグメンテーション画像処理のための領域分割の手法の一つ。各画素がどの物体に属するかを物体の重なりまで考慮して識別する手法。セマンティックセグメンテーション、インスタンスセグメンテーションも参照のこと。
エキスパートシステム第2次AIブームで登場した専門知識を保持させ、質問に答える形式で専門と同等の判断をさせようと開発されたAIシステム。
エッジコンピューディングIoTデバイスの発展により、利用者に近い場所(エッジ側)でデータを処理することを言う。ディープラーニングもデバイスの発展によりエッジ側で処理が出来るようになりつつある。
エポックディープラーニングの学習において、訓練データを何度学習に用いたかを表す数値のこと。
オートエンコーダ自己符号化器とも呼ばれる。ニューラルネットワークを使った次元削減の手法。画像のノイズ除去や製品の異常検知などに応用ができる。
オントロジー知識をコンピュータに効率よく、正確に覚えさせるため、あらかじめ決めた形式、仕様
オンライン学習1つひとつの学習データごとに学習処理を行い、重みを更新する手法。学習データセットのサイズが大きく、それらが互いに独立していない場合、バッチ学習よりもより良い結果が得られる言われている。逐次学習とも言う。
カーネル畳み込みニューラルネットワーク(CNN)の畳み込み層で使用されるフィルターのことをカーネルとも呼ばれる。
カーネルトリックサポートベクトルマシンにおいて、カーネルトリックと呼ばれる技法を使えば、線形分離できないデータでも、上手く問題を解くことができる。
回帰問題入力値から出力値(スカラー値)を予測する問題の総称。気温から清涼飲料水の売り上げを予測ような問題。最も基本的な技法に最小二乗法と呼ばれるアルゴリズムがある。(対語:分類問題)
過学習オーバーフィッテイングとも言う。機械学習において、学習モデルが訓練データにフィットしすぎて、訓練データでは良い精度を示すがテストデータでは、それほど精度を示さない状態を言う。
学習率勾配降下法において、一度にどの程度パラメータを変更するかを決める値。学習率を大きくしすぎると発散し、小さくしすぎると収束まで遅くなる。