G検定対策重要用語集（サンプル）

用語	意味
AdaBoost	エイダブースト(アダブースト)は、Yoav FreundとRobert Schapireによって考案された機械学習アルゴリズム。AdaBoost は、それぞれの標本に対し、弱い分類器順に適用し、それぞれの分類器が正解したか否かを判断する。間違って分類された標本に対応する重みより重くされる
Adam	勾配降下法の改良アルゴリズム。Adamは過去の勾配のスライディングウィンドウに基づいて学習率をパラメータごとに調整し計算を行うアルゴリズム。画像認識など良く利用されている。
AI	人工知能。推論、認識、判断など、人間と同じ知的な処理能力を持つ機械のこととされる。ただし専門家の間でも明確な定義はされていない。
AI効果	AIで何か新しいことが実現されると、「それは自動化であって知能ではない」と思いたがる人間の心理的効果のこと
AlexNet	AlexNetは、Hinton教授らのチームによって発表された物体認識のためのモデル。AlexNetが、物体認識のために、初めて深層学習の概念および畳み込みニューラルネットワークの概念を取り入れた。画像分類チャレンジコンテスト(ILSVRC)において、AlexNetが飛躍てきな性能を果たした。
AlphaGo	ディープマインド社が開発した囲碁プログラム。2016年にトップレベルのプロ棋士に勝った。
AlphaGo Zero	AlphaGo の改良版。2017年に発表された。AlphaGoが過去の棋譜を使って学習したのに対し、AlphaGo Zeroは棋譜を全く使わず自己学習のみでAlphaGoを超える強さを獲得した。
Attention	seq2seq の改良のため、2つの時系列データ間の対応関係を学習するAttention層を追加したニューラルネットワーク。
Bidirectional RNN	RNNの改良で、LSTMを2つ組み合わせて、過去方向だけでなく未来方向からの情報もフィードバックできるようにしたもの。時間情報の欠損部分を予測することができる。
BoW	Bag of Wordsの略。テキストデータを数値化する技法の1つ。ある文書における単語の出現回数を数えるアルゴリズム。単語数を数えることにより、複数の文書を比較したり類似性を測定することができる
BPTT	BackPropagation Through-Time。RNNにおける誤差逆伝搬が、過去に遡って誤差を反映することになるため、こう呼ばれる。
Cycプロジェクト	すべての一般常識をコンピュータに取り込むことを目的としたプロジェクト。開始から30年以上経った今も継続中
DCGNN	Deep Convolution GAN。CNNを用いたGANを指す。
DENDRAL	有機化合物を特定するためのエキスパートシステム
DNN	ディープニューラルネットワークのことを。ニューラルネットワークの層を深くしたモデルのこと言う。
DQN	従来の強化学習の手法であるQ学習にディープラーニングを組み合わせたもの。
ElasticNet正則化	L1正則化とL2正則化の両方をしようした正則化の手法。
ELIZA	高度な技術を使わずに知的な振る舞いをする例として、1966年に開発された。人工無能の例
ENIAC	世界初の汎用コンピュータ。1946年、アメリカのペンシルバニア大学で開発された。
fastRCNN	R-CNNにおいて領域切り出しと物体認識を同時に行うことで、処理の高速化を実現したシステム。さらに改良されたfasterRNNも提案されている。
GAN	敵対的生成ネットワークモデルとよばれるアルゴリズム。画像を生成したり、変換したりすることに利用されている。画像を生成するジェネレータと、画像を本物かジェネレータが生成した偽物かを判断するディスクリミネータがお互いを超えるように学習をしていく構成。
GooglePhoto	Google社が開発した画像認識システム。アフリカ系の男女をゴリラと判定してしまうことで大きな問題となった。
GPU	Graphic Processing Unit。画像処理用に最適化された演算処理装置。同一演算を多数同時並列で行うという特徴がディープラーニングでの処理に適しているため、頻繁に流用される。
ILSVRC	ImageNet Large Scale Visual Recognition Challenge。大規模な画像データセットの代名詞でもあるImageNetを使った画像認識コンペティションのこと。2010年から開催されている。2012年にAlexNetがCNNを取り入れ驚異的な性能を示した。
ImageNet	画像認識用の学習・研究用に良質な画像を集めたデータセットの1つ。1400万枚を超える画像がデータセットととして納められている。
k-means	教師なしの機械学習の1つであるクラスタリングの計算を行うアルゴリズム。K平均法とも言う。
k-分割交差検証	交差検証の一種。訓練データと評価データへの分割を複数回行い、それぞれで学習、検証を行う手法。ホールドアウト検証も参照のこと。
L1正則化	過学習を防ぐ正則化の手法。特定のデータの重みを0にする事で、不要なデータを削除する手法。LASSO(ラッソ)回帰も参照のこと。
L2正則化	過学習を防ぐ正則化の手法。データの大きさに応じて0に近づけて、滑らかなモデルとする手法。Ridge(リッジ)回帰も参照のこと。
LeNet	1998年に、Yann LeCunによって考案された初の畳み込みネットワーク。構造としては、畳み込み層とプーリング層のセットを2回繰り返すのが特徴である。近年開発されたものと比較すると、層が浅く単純である。
LSTM	時系列データを扱いディープラーニングの手法の1つ。RNNの欠点を改良したアルゴリズム。長期的な依存関係を学習することが可能
Mini-Max法	ゲーム戦略で、自分の手順は自分が有利に、相手の手順は自分が不利になるよう戦略と立てる手法
MNIST	「０」から「9」までの手書き数字画像60,000枚と、テスト用画像10,000枚を集めたデータセット。Mixed National Institute of Standards and Technology databaseの略。手書きの数字の認識用データセットとしてよく使われる。
NTM	ニューラルチューリングマシン(Nueral Turing Machine)。チューリングマシンをニューラルネットワークにより実現する試み。プログラムの入出力からプログラムを生成、すなわちプログラムの自動生成が可能となる。
NVIDIA	GPU メーカ。ディープラーニング用のライブラリではNVIDIA製GPUしかサポートしていないものが多い。
one-hot-encoding	n種類のカテゴリデータを、n次元ベクトルに変換して表現し、1桁のみ1とし残りの桁を全て0で表現したもの。学習時に正解ラベルをone-hot-encoding形式に加工することが良くある。
R-CNN	Regional CNN。画像から物体がある領域を切り出し、切り出した領域ごとにCNNで処理をする手法。
ReLU関数	ランプ関数とも呼ばれる活性化関数の1つ。微分しても0にならず、勾配消失しないため隠れ層(中間層)で良く使用される。派生として Leaky ReLU、Perametrc ReLU、Randomized ReLUなどもある。
Ridge(リッジ)回帰	線形回帰に対しL2正則化を適用した手法。
RNN	Recurrent Neural Network(リカレントニューラルネットワーク)。再帰型ニューラルネットワークと呼ばれる。時系列データ予測の学習するに用いられる。隠れ層の出力の次の入力とすることで時系列に連続したデータの学習が可能となる。長期的な記憶の維持が困難になる欠点があり、LSTMで改良されている。
RNN Encoder-Docoder	2つのLSTMを一つは入力を処理するエンコーダ、もう一つは出力を処理するデコーダとして組み合わせ、出力を時系列化するRNN。
RPA	RPA(Robotic Process Automation)。これまで人間が行ってきた作業を高性能な認知技術(ルールエンジン・機械学習・人工知能など)を用いることによって、業務の自動化や効率化を実現すること。
skip-gram	word2vecの一手法。ある単語を与えて周囲の単語を予測するモデル。CBOWも参照のこと。
SSD	Single Shot Decoder。領域の切り出しと認識を同時の行うことで画像の高速な検出処理を可能とした。
STRIPS	Standard Reserch Institute Problem Solver。1971年に開発されたプランニングのための人工知能
SuperVision	トロント大学が開発したディープラーニングを用いた画像認識システム。2012年のILSVRCにおいて圧倒的な勝利を収め、ディープラーニングのブームの火付け役となった。
SVM	サポートベクトルマシンと呼ばれる機械学習の手法。マージンの最大というコンセプトに基づいて設計されている。カーネトリックと呼ばれる技法を使い非線形問題にも対処できる
tanh関数	ハイパボリックタンジェント。双曲線関数の1つ。ディープラーニングの活性化関数の1つ。隠れ層に良く利用される。
Tensorflow	Google社が開発した、ディープラーニング用のフレームワーク。最も利用されているフレームワーク。GPU版やブラウザでどうさするJavaScript版などが存在する。
TPU	Tensor Processing Unit。Google社製のテンソル計算に最適化された演算処理装置。
VAE	変分オートエンコーダ(Variantional AutoEncoder)。画像分野での生成モデル。オートエンコーダにおいて入力を統計分布に変換しそれを学習の対象とする。
VGG16	ImageNetと呼ばれる大規模画像データセットで学習された16層からなるCNNモデル。Oxford大学の研究グループが提案し2014年のILSVRで好成績を収めました。
Watson	ワトソンは、IBMが開発した質問応答・意思決定支援システムのことで「自然言語を理解・学習し人間の意思決定を支援するもの」と定義されている。AWSやGoogleと同じようにクラウド上で画像認識などのサービスが利用できる。
word2vec	単語をベクトル化して表現し、テキスト処理をこなうニューラルネットワークのこと
Xavierの初期値	ニューラルネットワークにおいて、パラメータの初期値として与えておく値の例。ReLU関数に対して有効であるとされている。
YOLO	You Look Only Onseの略。YOLOはリアルタイムオブジェクト検出アルゴリズム。画像を一度CNNに通すことで、高速オブジェクトを検出することが可能になっている。
アファイン変換	幾何学の分野で、ある図形を回転させたり引き延ばしたりする変換。
アンサンブル学習	複数の機械学習アルゴリズムを組み合わせて学習すること。
アンダーフィッティング	オーバーフィッティング（過学習）に対し、正則化などの対策をし過ぎて予測性能が低下してしまうこと。
イテレーション	ディープラーニングの学習において、重みを更新する回数を表す指標のこと。
エキスパートシステム	第2次AIブームで登場した専門知識を保持させ、質問に答える形式で専門と同等の判断をさせようと開発されたAIシステム。
エッジコンピューディング	IoTデバイスの発展により、利用者に近い場所(エッジ側)でデータを処理することを言う。ディープラーニングもデバイスの発展によりエッジ側で処理が出来るようになりつつある。
オートエンコーダ	自己符号化器とも呼ばれる。ニューラルネットワークを使った次元削減の手法。画像のノイズ除去や製品の異常検知などに応用ができる。
オンライン学習	1つひとつの学習データごとに学習処理を行い、重みを更新する手法。学習データセットのサイズが大きく、それらが互いに独立していない場合、バッチ学習よりもより良い結果が得られる言われている。逐次学習とも言う。
カーネル	畳み込みニューラルネットワーク(CNN)の畳み込み層で使用されるフィルターのことをカーネルとも呼ばれる。
回帰問題	入力値から出力値(スカラー値)を予測する問題の総称。気温から清涼飲料水の売り上げを予測ような問題。最も基本的な技法に最小二乗法と呼ばれるアルゴリズムがある。(対語：分類問題）
過学習	オーバーフィッテイングとも言う。機械学習において、学習モデルが訓練データにフィットしすぎて、訓練データでは良い精度を示すがテストデータでは、それほど精度を示さない状態を言う。

研修・教材

About Us

ITエンジニア向け