SNSの投稿などでWeb上に残る痕跡は、デジタルフィンガープリントとしてユーザーのパーソナリティ特性を表している。これを解析することでその人の適職が70%以上の精度でわかるという。
米国科学アカデミー紀要(PNAS)に掲載された論文では、ツイートのデータ解析と機械学習アプローチを用いて、10万人以上の職業を分類。パーソナリティ特性に基づいた適職レコメンドシステムの構築手法について説明している。
・ツイート分析で職業によるパーソナリティ特性の違いが浮き彫りに
本格的な解析の前に研究者らは、トップランクのテニスプレイヤーやGitHub上プロジェクトのコントリビューターといった、データがオープンになっていて収集しやすい9つの職業(1035人)で概念実証を行っている。ちなみに、トップレベルの専門家を扱うっているのは、適性と選択した職業の間のギャップが少ないほど個人および社会にとって有益……との考えによるもの(頭角を現している人は適性が高い)。
まずは、パーソナリティ特性の心理学的分類モデル、ビッグファイブのみを指標として考慮。ツイートから単語を抽出してパーソナリティ特性を割り出したところ、職業ごとの特徴が浮き彫りになった。
例えばテニスプレーヤーは、開放性が比較的低く、誠実性、協調性、外向性が高い。これに対してコントリビューターは、開放性が比較的高く、誠実性、外向性、協調性が低い……といった具合だ。
・パーソナリティ特性に応じて1227職種をクラスタリング
概念実証で得られた手法を、10万1152人のユーザーに展開。ビッグファイブに加えて、シュワルツの価値理論から5つの基本的価値を指標として採用している。
パーソナリティ特性の分類にはIBMのPersonality Insightsを利用し、ツイート中の単語を抽出して10指標でスコア付けした。得られたパーソナリティ特性に応じて1227職種をクラスタリング。職業マップ(Vocations Map)の作成にあたっては教師なし機械学習アルゴリズムも用いたとのこと。
分類はおおむね既存の職業カテゴリーと一致していたが、なかには意外な分類も含まれていたようだ。例えば、看護師マネージャーは、医療クラスターの一部ではなく、仕事に必要とされるスキルの近いキャンペーン担当者などと同じクラスターに属していた。
・パーソナリティ特性から職業を予測
ユーザー数が最も多い10の職業に関して、パーソナリティ特性から職業を予測したところ、70%以上の精度となり、予測をはずしたケースに関しても、同様のスキルセットが求められる職業を予測していたとのこと。
このアプローチが、進路相談やキャリアカウンセリングなどに導入されれば、能力の発揮できる可能性が高い"天職"の発見に役立つだろう。
なお、職業マップはオンラインで公開されているので、ここから職業の分類を確認することができる。