IDCF テックブログ

IDCF テックブログ

クラウド・データセンターを提供するIDCフロンティアの公式テックブログ

AI(人工知能)・Deep Learningの最前線セミナーレポート

こんにちは、松本です。6月13日(火)にYahoo! JAPANの本社にて、社会にイノベーションを起こすであろう、AI(人工知能)・Deep Learningの最新技術動向と事例を紹介したセミナーを開催しました。

今話題の半導体メーカーのエヌビディアや株式会社ABEJA、HPCシステムズ株式会社など国内最先端の企業の方々に登壇いただきました。IDCフロンティア(以下IDCF)も最後に少しお時間をいただき、GPUクラウドの運用のウラ話をさせていただきました。GPUのクラウドサービスを提供する事業者としても、国内最先端のお話ばかりで大盛況であった当日の様子をこのブログにてお伝えいたします。

エヌビディア GPU技術最新情報

最初は、エヌビディアの佐々木邦暢様のご講演です。
ここ数年で、いつしかGPUメーカーといえばエヌビディアの時代になってきました。先月のGPU Technology Conference 2017(以下 GTC 2017)であったGPU Tesla V100の発表もそうですが、技術革新のスピードが早く、そんな勢いを大切にしている印象でした。

f:id:Matsu_IDCF:20170622101442p:plain ▲エヌビディア 佐々木 邦暢様

①10年間の振り返り
AI業界はここ10年で目まぐるしい進化を遂げています。2006年は、CUDAが発表された年です。当時は、やっと物体認識を少しできるようになりましたが、特定の物体を正確に認知するのはまだ困難でした。それが10年経った今では、AIが人間を超えたというニュースもちらほら聞くようになりましたし、様々な分野での応用例が公開されています。ディープニューラルネットワーク(DNN)、ビッグデータとGPU、この3つの要素の進歩によって、Deep Learningは加速を続けています。

②事例紹介
GTC 2017でエヌビディアとSAPが提携すると発表がありました。これにより、ブランドインパクトのROIの測定が容易にできるようになります。例えば、テレビで放送される試合のスポンサーは、今まで自社の広告がどれだけの収益に繋がったのか可視化するのは困難でした。Deep Learningを活用すれば、リアルタイムで画面に表示されるロゴの露出時間を測定でき、即時かつ正確にスポンサーへフィードバックすることができます。このような応用が増えていけば、ビジネスがさらにスマートになりますし、新たなビジネスモデルも生まれてくるでしょう。

③最新のGPU事情
エヌビディアのGPUは主にHPC & Cloud用のTeslaシリーズ、プロフェッショナルグラフィックス用のQuadroとゲーミング用のGeForceがありますが、今回注目していきたいのはHPC & Cloud用のTeslaシリーズです。先日の GTC 2017 で最新アーキテクチャ Voltaとその最初の製品であるTesla V100が発表されました。Tesla V100(Volta)は前世代のP100(Pascal)と比べ、トレーニング速度が12倍、推論速度が6倍と大きな飛躍を遂げました。さらに、このV100を8基搭載したDGX-1というスーパーコンピューターやNVIDIA GPUクラウドなど、たくさんの新製品の話もありましたので、さらに知りたい方はぜひ次の資料をご覧ください。

ハードウェアがソフトウェアやビジネスを引っ張っていくのは斬新であり、夢が無限に膨らんでいきます。今後もエヌビディアのイノベーションに注目していきたいと思います。

IoT、ビッグデータ、人工知能がリードする第四次産業革命

次に、株式会社ABEJA代表取締役社長の岡田陽介様にABEJAのAIプラットフォームについてご講演いただきました。 ABEJAはAI業界で有名なベンチャー企業で、エヌビディアがアジアで唯一出資している会社です。とにかくイノベーションにこだわっており、その想いと技術力が、今皆始めようとしているIoT×ビッグデータをより簡単に実現してくれるのだと岡田社長の講演で感じました。

f:id:Matsu_IDCF:20170622101623p:plain ▲株式会社ABEJA 岡田 陽介様

①ABEJA Platformとは?
ABEJA PlatformはビッグデータやIoTの集積・学習・推論・レポーティングをシンプルかつワンストップで実現させるAIプラットフォームです。クラウドで学習させた結果を簡単にエッジにデプロイする仕組みを持っており、また、プラットフォームには全てAPIベースでアクセスできます。AIに関しての深い知識がなくても、最低限のエンジニア知識があれば、誰でもインテリジェントにデータを扱うことができるプラットフォームです。

②事例の紹介
実際にABEJA Platformを利用している事例で、実店舗での顧客滞在データの解析があげられました。顧客属性から行動や滞在場所・時間などの可視化するものでした。また、製造業では部品の故障予知・検知で活用されていたり、サービス業ではBOTによるサポートで活用されていたりと、改めてAI活用分野でのABEJAの優位性を知ることができました。

③Operationにおける強み
ABEJAの強みはOperationにあります。IoTデバイスのよくある問題は、部品故障です。デバイスの故障は、データが取れなくなるくらいと思われがちですが、貴重なビジネスチャンスを逃している可能性もあります。ABEJAは、IoTデバイスにホットスタンバイを用意しておき、問題発生時にロストなく切り替わりができるよう自動化しておくようなソリューションも提供しています。また、ABEJAのエコシステムでは全レイヤーを網羅できる強いパートナーが揃っているため、導入から運用の一貫性が保てます。さらに知りたい方は次の資料もご覧ください。

【資料】株式会社ABEJAが考える第四次産業革命とABEJA Platformの構成

Deep Learningを知っている人はたくさんいますが、成功した事例はまだほんの一部にしかすぎません。そこにはコスト、ナレッジの問題もありますが、機械学習には唯一の解がないという特徴があります。ABEJAのプラットフォームは、正解への近道であるのは間違いありません。今後もABEJAの第四次産業革命に期待です。

HPCとAIをつなぐGPUクラウド

続いて、HPCシステムズ株式会社の渡邊啓正様よりGPU活用における今後の課題点のご講演です。 HPCシステムズはこれまでのHPC(ハイパフォーマンス・コンピューティング)のナレッジを活かし、AI×HPCの2軸でより賢くビジネスを加速させる取り組みを行っています。また、GPU活用においては、量・効率的な冷却・HPCによる高利便性が大事ということで、GPUとクラウドの親和性が強調されていました。

f:id:Matsu_IDCF:20170622101657p:plain ▲HPCシステムズ株式会社 渡邊 啓正様

Deep Learning用の計算リソースは、今後もきっとデータ量が膨大になっていくにつれて需要が増えていきます。もちろん、GPUの数は多ければ多いほど嬉しいお話ですが、キャパシティ制御に課題もあります。

課題① 分散学習環境の構築
大量のGPUを有効活用するには分散学習環境の構築が必要になってきます。大量のマシンとユーザーの一元管理や、ネットワーク周りの設計、そして並列計算の設定もそれぞれ実施する必要があります。これらを問題なくこなすにはインフラ面の知識が相当必要になってきますが、これらはHPCシステムズにとっては得意な技術であります。

課題② 資源利用の最適化
アクセスするユーザーが増えれば、GPUリソースを最適な形で割り当てる必要があります。ポイントとしてまずあるのは、GPU使用を排他制御できることです。続いて、ユースケースとしてDockerコンテナ経由でGPUを扱うことが増えているので、Dockerコンテナの自動配備、またコンテナからCUDAでGPUを問題なく使えることも重要です。最後に、ジョブスケジューリング機能も必要で、現状うまく制御できるツールが存在しないため新しいジョブスケジューラーが必要という結論になりました。

今後も加速していくAI業界はきっとたくさんのビジネスチャンスをもたらしてくれますが、運用における課題も増えていくでしょう。そんな課題を解決するには自力で頑張るという方法もありますが、HPCシステムズのノウハウに頼ってみるのも賢明な選択肢ではないのでしょうか。

激アツ!GPUのパワーとインフラの戦い

IDCFから菊石のセッションは、「GPUのインフラ運用は結構大変なのです」の一言から始まりました。AI(人工知能)・Deep Learningが進化していく中、その土台となるGPUインフラの課題と当社の解決方法を本音ベースで紹介しつつ、その試行錯誤の過程を共有させていただきました。

f:id:Matsu_IDCF:20170622101724p:plain ▲株式会社 IDCフロンティア 菊石 謙介様

IDCFはデータセンターとクラウドの事業を提供しております。GPUサーバーも、当然IDCFのデータセンターのラック内に収容しており、今回はラックの収容設計について紹介しました。

標準仕様のラックはCPUを搭載した一般的なサーバー向けのため、GPUサーバーをフル搭載すると空調性能が追いつかない課題がありました。また、GPUサーバーを冷却させるファンが強力なため、データセンターのエアフローに影響してしまうという課題もサービス開始前に発覚しました。これらの課題に対して、ラック内の収容設計を見直したり、エアフローを変えるなど試行錯誤を行い、現在の安定したGPUサービス提供に至ります。

IDCF は今後インフラ事業者として、GPUの進歩に追随するだけではなく、それらが問題なく稼働できるデータセンターの設計や考案も行っています。AIを試してみたい!GPUを体験してみたい!という方がいらっしゃれば、ぜひIDCF にご相談下さい。

まとめ

今回のセミナーでは、注目度の高い企業の方々にご登壇いただき感謝しております。また、雨の中にも関わらず、会場はほぼ満席でした。皆様ご来場、本当にありがとうございました。

f:id:Matsu_IDCF:20170622101744p:plain

f:id:Matsu_IDCF:20170622101810p:plain

今後もさらにAI(人工知能)・DeepLearningは進化し、GPUが処理できるTFLOPS数も桁が変わっていくことでしょう。よく「AIの波がそこまで来ている」と言われていますが、それは人を巻き込んではくれません。波に乗るか乗らないかは、自分たち次第です。 きっと何かが変わっていきます。 IDCFでは今後もみなさまと、よりよいパートナーシップを組めるようなきっかけを提供していきたいと思います。 是非またIDCFのセミナーに参加いただければ幸いです。

写真:Yahoo! JAPAN公式カメラ隊(倉長 拓海・Vikram Malhotra)

Copyright © IDC Frontier Inc.