履歴書のParsing(構文解析)の真偽:あなたが決める

異なる Parserは、それぞれに異なるデータセットと精度をもって実行されますので、正確な解析が重要だとお考えの場合は、お客様に最も適した Parserを見つける唯一の方法は、お客様のデータのサンプルで実際にテストしてみることです。

弊社は常にご興味のあるお客様に、実際のご自身のデータからの履歴書/職経歴書を使って弊社 Parserの精度のテストを実施することをお勧めしており、テスト後実感いただくのが、たいていの場合、以前にテストしたすべての解析ツールの中で弊社Parserが最も正確であるということです。

履歴書/職経歴書 Parserに関する一般的に主張されていること

Parserについては、多くの異なる主張がありますが、そのうちのいくつかは他のものよりも真実を語っていることがあります。 以下が2つの最も一般的な主張です:

私達が世界中で最も優れた/最も精度の高い Parserを取り扱っています。”

この主張が正しいかは、 Parserが処理するはずのデータに依存します。 履歴書は、誰が書いたのか、受け取る書類の書式、書かれた言語などによって大きく異なるからです。

たとえば、あるParserは、英国またはアイルランドの履歴書と、米国またはオーストラリアの履歴書とでは全く異なる正確性を持つ可能性があります。 また、異なる言語で書かれた履歴書ごとに明らかに異なる精度がでてきます。 Parserが十分にあなたにとって正確であるかどうかを調べる唯一の方法は、ご自身のデータでテストを行うか、非常に似たデータを処理する人に尋ねてみることです。

お客様が精度を懸念される場合(もちろん、重要視すべき点ですが)、我々Daxtra社では、お客様のデータで弊社parserの精度テストを行うためにいつでも喜んでご協力させて頂きます。なぜなら人々が弊社の精度を評価するたびに、ほぼ常に弊社が最も精度があると評価いただいているからです。

“場所、言語、専門性に関係なく、正確に構文解析できるように Parserに自動的に訓練し精度向上ができます。

統計 Parser企業によって広められたこの中途半端な真実は、彼らが第2位または第3位として評価されている理由を説明するためによく使われます。

真実は、新しいデータによって統計システムを訓練させることによって確かにある程度までは精度を高めることが常に可能ですが、これは通常、十分な精度を生成するために多大な努力を必要とします。 これらの Parserで使用される統計アルゴリズムは、膨大なデータに対して既に訓練されており、その多くデータはおそらくお客様のデータに似ています。問題になるのは、 Parserが「箱から出したらそのまま」動作しなければならない場合です。

あなたが “訓練”のために評価するデータを送る場合、 Parserが突然この特定のデータに対してうまく機能するようになっても、あなたは驚くべきではありません。 結局のところ、訓練はそのためにあるからです。しかし、非常に重要になってくるのが、以前の一度も見たことがなかったデータで訓練後、どのくらい精度向上ができているのか、異なるデータでParserを再評価することです。(つまり実際のビジネスで使用時にどのように機能するかの評価です。) よくあるのが、その「訓練した」が見たことがないデータのパフォーマンスに少ししか効果がなかったことがわかります。

Daxtraでは、Parserを訓練し改善し続けることで、誰もがビジネスの中で適用する際に、最も正確な Parserをご使用いただけるように最善を尽くしています。

では、どうしてDaxtraは履歴書/職経歴書のParsing(構文解析)の世界的リーダーなのでしょうか?