成長戦略【Vol.3】AI活用検討を始めています

【Vol.3】AI活用検討を始めています

作成日:2018/03/06

作成者:R&Dセンター 松井良行


弊社では、昨年夏頃から社長の掛け声の元、技術戦略会議の活動の中で、AIを自部門の業務で活用できないかどうかの検討を始めました。 株式会社テクムズ(http://www.tkmes.jp/)にAIやIoTの指導をいただいています。

 

テーマの選定


主要テーマは、弊社の原点でもある"画像技術"のうち、AIでの実装が進んでいる"画像認識"に設定しました。

各部門・部署からAI活用検討をしてみたいテーマを応募したところ、17テーマが集まりました。
これらから

  • 受注業務での影響
  • 新規受注への影響
  • 内製可能性
  • 予算規模
  • データ整備有無
  • 技術的課題(障壁)の有無

などを評価し、"実現できそうで効果が大きい"ものを選択した結果
下記のテーマを実施することとなりました。

  • 電力部 送電設備の識別
  • 文化情報部 (土器の接合作業効率化のための)破片の仕分け支援
  • 交通G空間事業室 土木構造物の変状抽出

全社に展開


各部門の部門長は技術戦略会議で、将来を見通した技術戦略面の検討を行い、戦略会議配下の分科会で、具体的な適用検討を進めていきます。

ディープラーニングには、膨大な学習データが必要ですが、データ作成に各部門が協力し、速やかに学習フェーズに入れるように配慮しています。

環境面においては、コンピューティングパワーが必要と言うことで、GPU(※1)を搭載したゲーミングPC(※2)を複数台新規購入し、モデルの学習を行える環境を構築し始めました。

新技術の検討・検証を担当するR&Dセンターでは、Tensorflow(※3)、Chainer(※4)などの主要なディープラーニングフレームワークを試験導入・検証し、「どうやったら自前のモデルを持てるのか」「どのように効率的な学習ができるのか」「学習したモデルをどのように活用できるのか」などを実行していきます。

ディープラーニングの手順
テスト

 

最近やっていること

 

転移学習


既存のモデルを使って、転移学習(or ファインチューニング)によって、画像識別をする実験を繰り返します。

  • 学習データの作り方
  • 適切な区分の仕方
  • 学習の方法
  • 精度の評価の仕方
  • 実用面の評価
などやらなければならないことは山積しています。
効率的なデータの集め方として、スクレイピング技術も必須になります。
社内の技術者は、Linux(※5)やPython(※6)など今まで使ったことがないオープンソースの技術にトライしています。

 

ディープラーニング用共有マシン

株式会社UEI(https://www.uei.co.jp)を展示会で知り、早速DeepStationのエントリーモデルを導入しました。

"Chainer"という国産のディープラーニングフレームワーク+SONYが開発したGUIを採用した、使いやすい入門機です。わずか27万5000円という、圧倒的なコストパフォーマンス。
DeepStationは、R&Dセンターの机の上に鎮座し、各部門部署から使えるように解放されています。

DeepStation https://deepstation.jp/hardware/#model-Basic

Chainerで学習
学習

クラックの識別にトライ
テスト.jpg

装柱品の識別にトライ
テスト

 

強力なゲーミングPCの援用


R&DセンターのメンバーのPCリプレースで、HPのOmenというゲーミングPCを採用した際、全社PC導入担当は「R&Dの中二病PC(※7)」と形容しました。まさに、この見た目が派手なマッチョなマシンの上に、Anaconda(※8)(OpenCV(※9)、Python、Tensorflow、Chainer、Keras(※10))の環境を作り、Linuxのソフトウェアと格闘中です。

世の中に出ている、一般物体認識モデルであるVGG(※11)、Inceptionv3(※12)、一つの画像に含まれる複数の物体を高速に認識するSSD(Single Shot Multi Detector)(※13)、YOLO(※14)、Style Transformation(※15)、Pix2Pix(※16)など、将来使えそうか?
徹底的にやってみて、試してみて、自分たちの武器にできそうかどうかを判断します。

自前学習モデル構築のために、マシンが何時間も、酷いときには1週間も!稼働し続けているなんていう光景も、R&Dセンターでは日常になりました。(その結果、「全然だめだ」なんていうこともまた日常です。 )

このOmenというマシン、メモリ:32GB、SSD:512GB、HDD:2TB、GPU:Nvidia GeForce GTX1070を積んだ、ハイスペックなゲーミングPCでありながら、25万円程度で購入できるおすすめ機種です。
会社が求める"Windows10 Professional"の要件もクリアできます。

HP Omen http://jp.ext.hp.com/desktops/personal/omen_hp_880_100jp/

Omen HP880
中二病PC


 

たくさんの失敗を重ねて経験値を積む!


オリジナルの画像認識(識別)モデルを構築するために、まだまだ高いハードルの前で足踏みしている状態です。
なんとか自分たちでできそうな範囲が分かってきましたが、実業務で人の代わりに画像を判断できて、効率化に寄与している状態は程遠いというのが実感です。

一見学習が収束しているように見える認識精度でも、「100%の自信たっぷりって出てるのに、間違ってる!」となったり、「どうしてこれを誤認するんだろう?」「分類が良くないのかな?」「学習に使ったデータセットが悪いのかな?」「データが少ないのかな?」と悩みの連続です。

動画の物体認識
SSD

PCのリソースを食い尽くす
PC負荷

 

華々しくメディアを賑わす、「AIが人間の能力を超えた」とのニュースに心を持っていかれながらも、惑わされることなく、自分たちの手で、何をしているのか、何を実現したいのかを明確に意識しながら、しかし思考即行動の心がけで、地道に進めていきます。

 


語彙の説明

※1 GPU :グラフィック性能を向上させるためのプロセッサー。3Dを使うゲームの他、ディープラーニングや仮想通貨の演算のために使われている。

※2 ゲーミングPC :GPU(必須)、高速なCPU、大容量のメモリとHDD、LEDで光るキーボードと本体、場合によっては水冷システムを搭載した過剰にハイスペックなデスクトップまたはノートPC。

※3 Tensorflow(テンソルフロー) :Googleがオープンソースで公開しているディープラーニングフレームワーク。GoogleのサービスがTensorflowで多く採用されていると言われ、信頼性、スケーラビリティ、対応プラットフォームの多さ、参考情報の多さから人気を博している。

※4 Chainer(チェイナー) :東大発ベンチャーとして企業したPFN(プリファードネットワークス)が公開しているオープンソースのディープラーニングフレームワーク。PFNは2017/8にトヨタから105億円の出資を受け、国内のAI企業として注目を浴びている。


※5 Linux: 最も多くのハードウェアプラットフォーム向けにリリースされたOS。オープンソースで開発され、現在も活発に進化している。デスクトップ、モバイル、サーバ、スパコン、組み込み機器に広く採用されている。

※6 Python: 統計処理、機械学習でよく使われる軽量プログラミング言語。

※7 中二病:非現実的な特別な世界観や設定そのもの(Wikipediaより)

※8 Anaconda(アナコンダ):WindowsPC上で、バージョンの異なるPythonやライブラリ等の環境を複数作成し、実行を切り替えられる仮想環境構築ソフトウェア。

※9 OpenCV(オープンシーブイ):インテルが開発した画像処理用ライブラリ一式。オープンソースで公開され、パターン認識や画像変換、機械学習など良く使われている。 

※10 Keras(ケラス):ChainerやTensorflowを扱いやすくするラッパープログラム。

※11 VGG:畳み込みニューラルネットワークモデルの一種。認識精度と高速性のバランスが良いため、SSDで採用されている。

※12 Inception v3(インセプション):Googleが採用する畳み込みネットワークモデル。認識精度の高さが特徴。

※13 SSD(SingleShotMultiDetector):一枚の画像に含まれる複数の物体を認識し、対象領域を決定するプログラム方式。

※14 YOLO(You Only Look Once):SSDと同様に一枚の画像に含まれる複数の物体を認識、対象領域を決定するプログラム方式。SSDよりも高速だが、小さな物体を認識しない。

※15 StyleTransformation:スタイル変換、フィルタ。1枚の画像をテンプレートとして特徴を抽出し、未知の画像のスタイルを変換する。ダリの絵のスタイルを真似て、撮影した写真をダリ風に変換したりできる。(あくまでも同じような構図である必要がある)

※15 Pix2Pix(ピックスツーピックス):1枚の画像を目標として、もう一枚の疑似的な画像を自動生成する。航空写真と道路地図、植生分布などを対応付けさせて覚えさせることにより、未知の航空写真から道路地図を生成したり、道路地図から衛星写真をそれっぽく生成できる。

 

おすすめの関連記事


成長戦略の最新記事


お問い合わせ

ご意見・ご質問などお気軽にお問い合わせ下さい。
ナカシャクリエイテブ株式会社

●富士見事務所 TEL : 052-228-8733 FAX : 052-323-3337
〒460-0014 愛知県名古屋市中区富士見町13−22 ファミール富士見711  地図
交通部 R&Dセンター

Email:メールでのお問い合わせ