AIの真実

DaXtra Robot AI ML

ロボットがすべてにとって代わるのか?
(Daxtra Technologies CTO Steve Finch氏に聞く)

ロボットが本当にすべてに取って代わるのでしょうか?
弊社CTOのSteve Finchに誇張されたAIと現在の人材業界の実態との乖離を聞いてみました。採用テクノロジーにおける最新のAI、機械学習やディープラーニングの実態についてわかりやすく解説してもらいました。

人材業界について書かれているネットの情報を斜め読みすると、まるで映画のマトリックスやブレードランナーで見る、ほとんどのことがロボット化された近未来の世界に我々は急速に向かっているような気になったりします。
しかし、片やそういったことを否定するような記事を読むと、実は何も変わっていないのではないか、という気もしてきます。 こんな感じで現状ではAIに関する議論は熱風(一瞬だけ熱いと感じる)や誇大広告のようなもののようです。

機械学習(と、その一部であるディープラーニング)という非常にレベルの高い概念をマーケティング目的で安易に使用するのは意味がありません。
採用テクノロジー(RecTech)において、AIの影響は正確にかつ真実に基づいて理解されなければなりません。

機械学習に関する話題

間違いなく機械学習(とくにディープラーニング)は今日のAI開発の中心的な存在です。
この分野ではGoogleが大変な努力で貢献しています。
ディープラーニングは個別のタスク処理ではなく、推論的な表現にしたがって処理を行うアルゴリズムです。
採用テクノロジーに関して言えば、ディープラーニングは最終的には履歴書内に記載されているニュアンスまでをも抽出できるようになるはずです。Daxtraの開発部門も、ここに向かって果敢に取り組んでいます。
したがって履歴書の解析に関する目的は明確で、それはニュアンスや文脈判断の精度を上げていくことなのですが、しかし実際にはその道のりはまだまだ遠いものです。

Googleのゴリラ事件が技術的な問題解決の難しさを表す良い例と言えるでしょう。
ご存じない方に簡単にその失態を説明しますと:2015年にあるソフトウエア技術者がGoogleのフォトアルゴリズムが彼の黒人の友人を「ゴリラ」と自動的に分類したと指摘しました。とんでもない失敗ですが、2年以上を経過した今なお状況は解決しないばかりか、悪化しています。結局、技術の巨人の唯一の解決策は、いかなる画像にもゴリラ、チンパンジーまたはサルというラベルを表示させないことだったのです。

つまり、研究開発に年間何十億ドルも費やしているGoogleでさえ、ニュアンスと文脈を正確に読み取るアルゴリズムをコーディングすることができないのです。すべての人間は、人間がゴリラではないことを直感的に理解しますが、コンピュータはそうはいかないのです。決められた分類システムに基づいて結論を処理するしかできません。
Googleはこの問題を意図的に取り上げていないのですが、しかし大きな問題点が残ったままなのは明白です。
2018年の今でも機械学習は私たちが期待していた状態には全く到達していません。それはいまだに巨大なブラックボックスが統計的な規則性をマッピングし、その分析結果をもとに新しいデータを作成し、結論を導き、予測を行う処理を行っているからで、その工程で全く見当違いの判断をすることが往々にしてあります。

これが採用において、どのような影響があるか、は明らかです。日常的な言葉の無限のバリエーションを考慮すると、履歴書解析においてエラーが発生する可能性も甚大です。たとえば、あなたの姓が「オーランド」で、そして自分自身をメディカルドクターの略としてMDとして記述している医師だとしましょう。 まず、今日のアルゴリズムでは、あなたの名前をフロリダ州にあるオーランドという地名だと認識する可能性があります。 次に(これはもっと頻繁に起きる可能性がありますが)、コンピュータは、あなたの役職であるMDを、管理ディレクター(MD・マネージングダイレクターの略)、あるいは米国メリーランド州(MDと略されることがあります)と考えるかもしれません。

ルールベースシステム – 今後の方向性

今後のAIの進化を考える上では誰もが悩む課題です。人間の直感や演繹(えんえき)的推論能力をコンピュータにプログラミングするという課題はとにかく大変だからです。 DaXtraでは、機械学習技術に加えて、かなりの時間をかけてルールベースのアルゴリズムを開発しています。 弊社が開発したアルゴリズムが情報を収集し、様々な関係性を吟味して予測を行っています。 結果として弊社のエンジンは文脈のニュアンスを学習し、例えば、MDという単語が履歴書の学歴の医学部に関する情報の前後にリストされている場合、アルゴリズムはこのMDはメリーランド州の略語ではない、という判断をします。もちろんルールベースのアルゴリズムでもエラーは発生しますが、従来の統計手法型の判断と違うのはその間違いを修正することができるということです。 実際、ディープラーニング技術とは、自分自身を自ら修正することができるということを意味しています。

繰り返しますが、我々はこの新技術に関して、まだ出発ゲートにすら到達していない状態です。マーケティング部門が何と言おうとも、過去30年間に機械学習のアルゴリズムは何も変わっていないというは事実です。SF愛好家の皆さんには申し訳ないですが、ロボットがすべてに取って代わる時代はまだまだ先の話です。平文の自動解析領域においては、まだ文脈情報のニュアンスを読み取る方法をロボットに教え込んでいる初期段階です。

もしも今後、どこかのテクノロジー会社が、自社で機械学習の改善して、文脈解析精度を30%向上させた、などというマーケティング情報を聞かれたとしたら、ぜひ慎重に聞いてみてください。
あの Googleですら解決できない謎を一体その会社はどうやって解決したのかを。

The Global Recruiter過去掲載記事からの転載)