teratail Report vol.5

2017/12/14

「使ってもらうことで真価を見極めたい。」Oracleのスペシャリストが追い続ける技術の深淵

「使ってもらうことで真価を見極めたい。」Oracleのスペシャリストが追い続ける技術の深淵

teratail Report第5弾はエンジニアインタビューです。

今回のインタビューは、前回のレポートでin-Databaseの機械学習について語ってくださった日本オラクル社の山中氏にフォーカス。オラクルを離れて海外の大学で研究したり、「自分の好きな技術を広めたい」と個人で勉強会を開催したりと技術への熱量が溢れ出る山中氏。

”老舗のIT屋”というオラクルのイメージを覆す、ギークでエネルギッシュな活動に取り組む山中氏の生態に迫ります!

山中 遼太 氏

やまなか りょうた山中 遼太

日本オラクル Big Data & Analytics ソリューション部 エンジニア

オラクルのコンサルティング部門にてデータベースのエンジニアとして従事した後、退職してバイオインフォマティクスとゲノム科学の学位を取得。その後、日本オラクルに復帰し、現職にて機械学習やグラフ分析の製品担当として、ビッグデータ活用ソリューションの提案をリードしている。

  • Twitterアカウント
  • GitHubアカウント
  • Facebookアカウント

実際にデータ分析に携わらないと人には伝えられない

── 前回記事『超高速!in-Databaseの機械学習とは』のイベントはかなりの盛り上がりでしたが、実際の反響などはどうでしたか?

イベントでは懇親会も盛り上がって、たくさん質問をいただきました。世の中のデータ分析のニーズは高まっていて「うちもやりたい」という声を多く聞きますが、オラクルの機械学習はまだあまり知られていないので、便利さを伝えることができてよかったです。

── 「説明がとても分かりやすかった」との声も多く、専門外の私もよく理解できて感動しました!普段からデータ分析を広めるお仕事をされているんでしょうか。

データ分析の技術を広める仕事と、実際のお客様のデータを分析する仕事を両軸で進めています。実データに触れられる今の環境は恵まれていますが、本当はもっと多くのデータ分析に携わっているくらいでないと、自信を持って話せないんじゃないかなと思っています。

今いる部署は「Big Data & Analytics ソリューション部」というんですが、部内にはビッグデータの基盤技術に強い人、そのデータを使ったアナリティクスに強い人がそれぞれいます。データが大きいほど機械学習が効果を発揮するので、一つのチームで課題に取り組めるのは非常に嬉しいところです。

── 生きたデータに触れながら最新の技術を追っているんですね。実際に携わっている人のお話を伺えるのはすごく心強いです。

技術の深みを追って3年でオラクルを退職

── 実は山中さんは「一度オラクルを辞めた」と伺ったのですが…。

そうなんです。僕は学部の研究室でバイオインフォマティクスを学び、「DNA情報をデータベースにする仕事は面白そうだなあ」と漠然と思っていました。その当時、Oracle Database 10gには遺伝子のDNA配列に対してこれと似た配列を検索するというプロシージャがあって「なんて先見の明があるんだ!」と心打たれて入社を決めたのですが、入社後の11gではその機能がなくなっていまして…。とはいえ、配属されたコンサルティングのデータベース・チームは職人気質のエンジニアが多くとても勉強になりました。

バイオインフォマティクス:生命情報学の意。遺伝子やタンパク質の構造といった、生体が持つ情報を分析する分野のこと。

Oracle Database 10g:Oracleの関係データベース管理システムの2003〜2007年のリリース。現在のバージョンは 12c。

プロシージャ:プログラムにおいて繰り返し出現する処理を行うために、一連の命令を一つの手順にまとめたもののこと。

その後、初心に戻ってDNAという「データ」の勉強をするため、3年間働いたオラクルを離れ、ロンドン大学でバイオインフォマティクスの修士、東京大学に戻ってゲノム科学の博士を取得しました。その間にオラクルも変わっていて、これからはHadoopやセマンティック・ウェブ、機械学習といったデータ分析も広めていこうということだったので、それなら面白そうだと思って戻ってきてしまいました。

今はデータ分析関連製品の担当エンジニアとして社内外に製品機能を説明するといった仕事をしています。ただ、オラクル・ラボのPGX(Parallel Graph AnalytiX)というグラフ分析フレームワークなど、技術コンセプト自体をもっと社外に広めないといけないなと感じていて、PGX ユーザー勉強会などのイベントも開催しています。

Hadoop:Apache Hadoop。大規模データ分析用の並行分散処理を行うOSSフレームワーク。

セマンティック・ウェブ:Webページやその記述内容に対しメタデータを付加し、コンピュータによる情報収集/解釈の効率化を図る構想。

- 集中したい夜はオラクルカフェの一日限定30食のパスタをゲットして作業していると語る山中氏。 -

「あえて社外に広めたい。」データ分析の魅力

── すごい!自分の好きな技術を追うことに貪欲なんですね。でも、もともと専門であったゲノム科学とグラフ分析は遠い分野のように見えるのですが、どのような部分に惹かれたのでしょうか?

多くの情報は、モノとそれらの関係を表現しています。コミュニティにおける人間関係も、誰が何を買ったかという購買行動も、多数の部品からなる工業製品の設計も、細胞内のタンパク質の相互作用も、全てノードとエッジで描かれるグラフに抽象化することができます。このようなグラフの考え方は、生物学の研究では前々から注目されていて、細胞の中でタンパク質同士がどういった相互作用をしているか、臓器同士がどうやってお互いを働きを制御しているか、といった分析に使われています。

最近では、ソーシャル・ネットワークから、興味の傾向が似ている人達のクラスターを見つけたり、その中で影響力の高い人(インフルエンサー)をスコアリングしたりするといった発想は一般的になりました。自然界で形成されるグラフは対象によらず構造が似ているといった報告もあり、生物学で使われてきたアルゴリズムも実社会のグラフ分析に活用できます。逆に、データが増え続ける生物学にとっても、PGXのようなフレームワークがあればグラフ分析を高速かつ簡単にすることができるはずです。

── 少し聞いただけでも、すごく面白そうですね。でも、こういった新しい技術について、いきなり社外に向けて勉強会を開催するのは、ハードルが高くなかったですか?

PGXはオラクル・ラボの開発した新製品なので社内でも知っている人がまだ少ないです。僕自身も米国のオラクル・ラボの研究者とたまたま話す機会が多かったのでよく知ることになりました。まずは社内でこの製品の使い方を考えましょうとしてもよかったのですが、そもそも企業システムでまだ使われていないグラフ分析となると、ユースケースをベンダーが考えつくだろうかと感じました。

だからこの製品はあえて社外の技術者に使ってもらって、いち早くユースケースを開拓していくことにしたんです。社外のエンジニアの方々はもちろんオラクル以外の技術もご存じなので、逆にオラクルの技術の良い部分に気づいてくれるんです。そういった方々に使ってもらって「OSSや他社のものとはこう違いますね、だからこういうところで使えますね」と教えてもらって、初めてその技術の真価を見極められるんだと感じています。

僕の開催しているPGXユーザー勉強会は、様々な分野のユーザーに活用事例を発表頂いているのでそれぞれのテーマの背景を理解するまで少し敷居が高いところがあります。ただ、そうすることで技術の可能性について柔軟に考える機会が得られますし、製品ベンダーが一方的に「こう使ってください」という勉強会よりも、ずっと楽しんでもらえていると期待しています。

── 本当に技術に対する真摯な気持ちが強く、脱帽です……。もう少し、グラフ分析について詳しく教えてください!

データベースとして一般的にはRDBMS(リレーショナル・データベース管理システム)が使われますが、場合によってはこのモデルは適していないことがあるんです。RDBMSの表はデータの値の集計を得意としますが、これに対してグラフはデータの「つながり」を辿ったり定量化することが得意です。

例えば、小学校のクラスで「この子はみんなと仲良くしていますか?」というとき、友達の数を集計すればいいわけではなさそうです。グラフ分析を使えば、コミュニティを抽出したり、その中の影響力の高い子をランク付けしたり、また、二人の間のパスを探索したりと、さまざまな分析ができます。子供たちをグループに分けてみようというとき、属性値を使ったクラスタリングでは「好きな遊び」や「好きな食べ物」をもとにグループがつくられますが、グラフ構造を使ったクラスタリングでは「友達である」といった関係性をもとにしたグループが得られるのでより直感的かもしれません。

- 実際にサンプルデータを使ってグラフ分析を用いた分析事例を教えていただいた。「グラフについて話し出すと長くなってしまいまして…」と山中氏は照れくさそうに語る。 -

「エンタープライズ、だからこそいい」

── 山中さんは「大好きな技術に熱中している」という印象が強いですが、会社全体としての雰囲気はどうですか?

僕らはお客様に恵まれていて、日々ビジネス上の課題が持ち掛けられるので、いつも技術だけに熱中できるわけではありません。ただ、社内はみんな技術に対してとても真摯に取り組んでいて、僕が若手で入ってきた頃から、上司や先輩が「教えてくれ」と声をかけてくれるんです。そういった、個人をリスペクトする風土がオラクルにはあります。

エンタープライズ向け製品のベンダーというと、一見レガシーな技術の企業と見られがちですよね。確かに、キャリアの長いエンジニアが多いのは事実ですが、新たに入ってくるエンジニアも優秀ですし、お互いに刺激を受けています。社内では勉強会も盛んで、機械学習のセミナーなどは若手もシニアも集まってビアバッシュ形式でやっています。インフラ一筋といった雰囲気の熟練のデータベース・エンジニアが「さて、そろそろデータを分析する時代ですね」といって最新のアルゴリズムを勉強して、使いこなして、そのビジネス価値をとくとくと語ってしまうんですから、おそろしいというか…(笑)

オラクルは社会的責任のあるグローバル企業なので、面倒くさい仕事がないと言えばウソになります。とはいえ、業務時間も働く場所も自由ですし、風通しがよくて何を言っていてもわりと許される社風ですし、そういうバランスが僕にはちょうどいいなと思っています。なにより、イベントの開催者としては、駅直結の展望の良いカフェが使えるのが嬉しいですね(笑)

「データ分析できる」から一歩先の未来へ

── データ分析の深みを追い続ける山中さんですが、今後の展望や夢はありますか?

データ分析の技術やツールも進化していますが、それ以上にIoTなど新しい切り口のデータ収集で今まで手に入れられなかったデータが分析対象になってきました。今まで分析対象にしていなかった画像も、ディープ・ラーニングなどの技術でデータとして扱いやすくなってきています。

分析ツールと分析対象のデータのそれぞれが揃ってきた今、「どうやってこの双方を繋げて投資対効果を得るか?」というビジネス上の問いに誰かが答えられないといけないと思います。それこそがデータ・マネジメントを専門とするオラクルが担うべきミッションであると考えています。

例えば、製造業において品質向上や歩留まり改善のためにデータ分析の活用が期待されるとき、現場の職人たちが肌で感じて築いてきた感覚を代替しようとしたら、データを集めてアルゴリズムを発展させるのに時間がかかり過ぎるかもしれません。こういったとき、収集できるデータによって新たなサービスが創出できる可能性もないだろうかと、平行して考えていかないと十分な投資ができません。

お客様とお話するときは、データを分析できることを前提に、データの収集にどれだけ投資して、どれだけの価値を得られるか考えています。当然のことかもしれませんが、お客様はいつも僕らのイマジネーションを超えたビジョンをお持ちなので、お話を伺うときはいつもワクワクしています。

── 山中さんの技術に対する熱量と真摯な姿勢がよく伝わるお話でした。インタビューをしていた私も、データ分析を始めたくなってしまいました。今日は本当にありがとうございました!