CNNへの道のり(24)
従来、ILSVRCでの物体認識は、Bag-of-Featuresと呼ばれる物体画像の局所特徴量をベースとする手法が用いられていた。ところが、2012年、トロント大学チームがCNNで出した結果はエラー率17%と、Bag-of-Features時代のエラー率26%から飛躍的に進歩した結果だった。
そのため、このときから画像認識研究者に一気にCNNを使い始めたのである。しかし、トロント大学のこのときの論文にもネオコグニトロンの参照はなく、ヤン・ルカンの論文を参照にあげていた。
現在では、CNNの源流はネオコグニトロンだと研究者(少なくとも日本の)はわかっている。欧米の研究者はどう思っているか、機会があれば確認してみよう。ウィキペディアのネオコグニトロンの英語版では、「the inspiration for convolutional neural networks」と紹介されている。ネオコグニトロンはCNNそのものだと思うのだが、世界的にはCNNのヒントになったと思われているのかも知れない。ネオコグニトロンがCNNの源流と認識されないのは、発表時期や場所、タイミングが冬の時代だったためブームに乗らなかったといえる。また、ヤン・ルカンの論文が出たときにアピールが不足していたのではないかと思われる。現代は世界中で一瞬にして技術が共有できる時代である。ただし、英語で情報発信すればという前提を忘れてはならない。
CNNへの道のりは今回で終了する。明日からは新シリーズを予定している。
最近のコメント