IDCF Tech-Blog

IDCF テックブログ

クラウド・データセンター・ビッグデータを提供するIDCフロンティアの公式テックブログ

Deep Learningで進化するAIと次世代インフラ

こんにちは、金杉です。7月31日に次のタイトルで、IDCフロンティア主催のセミナーを開催しました。

必見、ヤフーも語る! 「ディープラーニングで進化するAIと次世代インフラ&プラットフォーム」

先月、そんな記事見たような?と思われる方もいらっしゃるかと思いますが、今回のセミナーでも前回のセミナーと同じように豪華なセッションを揃えることができました!ヤフーの音声認識技術「YJVOICE」におけるディープラーニングの実用化に加え、なんとあの「DMM.comラボ」や、“AIの民主化”を目指す「クロスコンパス・インテリジェンス」にも登壇いただきました。ヤフーからは、話題のGREEN500ランクインスパコン「kukai」の運用事例についても紹介していただけました。

f:id:skawai488:20170809182516j:plain

では、当日のセッション概要をみなさまにお伝えしたいと思います。

セッションのポイント

f:id:skawai488:20170809182533p:plain

1. DMM.comにおけるレコメンドへの Deep Learning の活用

登壇者 株式会社DMM.comラボ 中野 裕貴 氏、領家 飛鳥 氏

DMMはゲーム、DVD、FX事業で知られる先進的なTech企業であり、もちろんDeep Learningも始めています。今回紹介していただいたDeep Learningの活用事例は、ゲームのレコメンドです。ゲームのパッケージ画像を分析し、とあるゲームをクリックすると、他の類似したパッケージ画像をユーザーにレコメンドしてくれるというスマートな仕組みです。モデルは元々Illustration2Vecを使っていたものの、それではアニメ画像の特徴検出が難しかったため、自作を選択したとのこと。

  • 学習データはGoogle Open DatasetやWeb Search APIを使用
  • 加工は"目grep"、顔にフォーカスしノイズを最小限へ
  • Caffeを利用、DIGITSや過去実績が多いのが理由
  • 過学習防止のためにdrop out方式や学習レイヤーを調整

ライブラリを有効に使うのがコツみたいですね。次の目標は学習データの加工部分を自動化することらしいですが、楽しみです!DMMの開発者ブログでも当日登壇のブログが上がっていましたので、こちらの記事もぜひご覧ください!

【資料公開】「ディープラーニングで進化するAIと次世代インフラ&プラットフォーム」で登壇しました - DMM.comラボエンジニアブログ

2. AIのあるある話。「こんな◯◯はいやだ!?」

登壇者 株式会社クロスコンパス・インテリジェンス 佐藤 聡 氏

クロスコンパス・インテリジェンスは「誰もがAIを使えるように」と人工知能の民主化を提唱しており、特に製造業に強いAIソリューションを提供しています。第三次AIブームともよばれる繁栄期を迎えた昨今、たくさんのクライアントから相談を受けるクロスコンパス・インテリジェンスならではのAIあるあるを語っていただきました。

あるあるポイント

  • 人工知能で何ができるかをそもそも理解していない
  • 学習データが少なかったり、正確でないとモデル作成は難しい
  • AIは一部の特化した領域で人間を越えているが、脳の代替はできていない
  • 歴史的に人工知能は氷河期を迎えたことがあるが、前向きに頑張るべき
  • 人手不足が深刻している今こそ、AIで対応する必要がある

まだまだAIへの認識がぼんやりとしていたり、後ろ向きな声もあるので、AIがもたらす本当のメリットをもっと普及させる必要がありますね。IDCフロンティアもAIサービスの基盤となるGPUの提供者として頑張らなきゃ!

3. ヤフー音声認識YJVOICEにおけるディープラーニングの実用化

登壇者 ヤフー株式会社 三宅 純平 氏

YJVOICEをみなさんは知っていますでしょうか?YJVOICE単体はともかく、現時点ではヤフーの15弱のアプリの中にYJVOICEの機能が組み込まれています。その名の通り、YJVOICEは音声を認識することができ、そして音声認識のコアな部分はDeep Learningが活用されているのです。例えば、「天気教えて」とYJVOICEに問いかけると、デバイスは単純な音声データのみをサーバーに送り、サーバー側で音声データをちゃんとした日本語に変換し、認識結果をデバイスにフィードバックします。

  • 30%〜40%改善!音声区間検出と音響モデルにおいてDeep Learningを使用
  • 音声系列のパターン認識の手法はLeft-to-Right Hidden Markov Model (HMM)
  • 学習データはヤフーが持っていたデータ、TITAN Xで約2週間
  • フレームワークはTensorFlow、アルゴリズムはMinibatch SGD
  • 本番ではIntelのCPUサーバーを使用、Intel MKLライブラリが活躍

今後は学習時にマルチGPU、マルチスレッドを活用し、モデル学習の大規模化を目指すとのことでした。YJVOICEのさらなる進化に期待です!

4. kukai: 省エネ世界2位のディープラーニング・スパコン

登壇者 ヤフー株式会社 角田 直行 氏

世界のスパコンランキングはTOP500、GREEN500など色々ありますが、簡単に言うと世界のスーパーコンピューターのランキングです。TOP500はLINPACKというベンチマークの値をベースにスーパーコンピューターをランキングする指標で、計測単位はTFlops(演算性能)を使用しており、スパコンの高速さを示すものです。一方で、GREEN500の単位はMFlops/Wで、スーパーコンピューターのエネルギー消費効率の良さを示すものです。

ヤフーのスパコン「kukai」は、GREEN500で見事2位を獲得しております!そして、GREEN500へのランクイン条件として、TOP500に入る必要があるため、kukaiはTOP500にもランクインしており、"省エネかつできる子"なのです。そして、気になるkukaiの設置場所ですが、実はIDCフロンティアの白河データセンターにあります!

  • 20ブリック構成、計80ノード (1ブリックあたり4CPU、8GPU)
  • GPUはNVIDIA Tesla P100 PCIe 16GBを採用
  • 冷却はフロリナートによる液浸方式
  • LINPACKチューニングは職人的スキルが必要
  • ベンチマークでハードウェア故障が発生したり苦労もあった

ヤフーでは様々な場面でDeep Learningを活用しています。前のセッションで紹介されたYJVOICEなどの既存Deep Learningの実装も、今後はkukaiに移行していく予定なので、より学習が効率的になっていきますね。kukaiは斬新な液浸方式を採用してますが、もっと面白い方法も出てくるのかも!?

5. 次世代のIT技術を支える、高度なファシリティ ~ディープラーニングを支えるデータセンター~

登壇者 株式会社IDCフロンティア 皆川 真一朗

ものすごいペースでDeep Learningの挑戦者が増える一方、インフラに対してのニーズも同じように増えています。IDCフロンティアでは1ラック20kVA以上の超高負荷冷却の相談も受けたりします。従来の解決策以外に、新しい方法も模索して、Deep Learningの熱を支えきれるデータセンター設計を目指しています!

  • 超高負荷ラックの熱を処理するためにデッドスペースができてしまう
  • 対策その1 白河の冷たい外気を利用した従来の外気冷却システム
  • 対策その2 チムニー効果を利用した屋外への熱放出
  • 対策その3 InRow空調で熱と風量を制御
  • 対策その4 熱搬送能力が空気の1000倍ある液浸冷却方式

また、Deep Learningを支えるだけでなく、データセンターの運用自体にも機械学習を活用していけるのが理想的です。例えば、ルールベースではなく、機械学習を用いて空調システムを制御する技術など、IDCフロンティアは今後もインフラ事業者として超高負荷ラックを最適化する研究開発を推進していきます!

まとめ

AIや人工知能がバズワード化する今、一刻も早くAIシフトせねば!と焦っていらっしゃる方も多いのではないでしょうか。今回のセッションで紹介があった成功事例のように、工夫をすればきっとDeep Learningは成功するので、将来への投資だと思ってぜひはじめてみませんか?今後もIDCフロンティアでセミナーを開催しますので、ぜひまたの機会にご参加ください!

f:id:skawai488:20170809182552p:plain

写真:Yahoo! JAPAN公式カメラ隊(倉増 崇史)

Copyright © IDC Frontier Inc.