優れた Parserを判断する重要な比較基準

履歴書 Parserを比較するために2つの重要な判断基準は、カバレッジ(網羅率)と精度です。

カバレッジ(網羅率)

 Parserが実際に何を抽出しようとしているのか説明します

すべての Parserは、候補者の連絡先情報を抽出しようとします。それに加えて、ほとんどの Parserは候補者のスキル、作業履歴、資格も抽出します。 最も高度な履歴書 Parser(Daxtraを含む)は、さらに推薦人、趣味、候補者の要約内容、希望給与、希望する所在地、国籍、ビザの状況、およびその他のさまざまな分野の情報を抽出することさえできます。

これらの情報はすべて、候補者の完全な記録を作成するために必要ですので、一般に、 Parserが抽出する情報が多ければ多いほど、より良い記録が作成することができます。

正確さ

 Parserがどれだけ優れているか判断するには、履歴書/職経歴書からの情報をしっかりと識別できているかです。

正確度は、 Parserが実際にどれくらいの頻度で正しいかで判断します。 たとえば、名前の識別で95%という精度は、履歴書 Parserがすべての受け取った履歴書の95%で候補者の名前を正しく抽出することができることを意味します。この比較基準は重要です。なぜなら 精度が低いほど、履歴書 Parserがおかしたエラーを訂正するコストが高くなるためです。

一般に、 Parserが約90%未満の精度であれば、エラーの数が多すぎるために、一貫した人間の監督なしには履歴書のデータベースにデータを格納するのが難しくなります。

興味深い事実:89%と95%の差はさほど大きくないように見えるかもしれませんが、訂正する必要のあるエラー率が二倍になりますので、それに連なって訂正コストも倍増します。