お知らせ
2022 IEEE International Conference on Big Dataに当社代表 高田悠矢の執筆した論文が採択
当社代表 高田悠矢が執筆した論文が、ビッグデータ分野の最新研究を扱う国際カンファレンス「2022 IEEE International Conference on Big Data(IEEE Big Data 2022)」に採択されました。
以下、株式会社リクルートのホームページより引用
今回採択された論文「Implementation of Biased Big Data to the Japanese Official Labor Statistics Using Supervised Learning under Covariate Shift」では、リクルートが事業を運営するなかで捕捉されるビッグデータを用いて、厚生労働省「雇用動向調査」における転職入職者の賃金変動状況という指標の速報化を試みています。
近年、各国の統計作成機関は公的統計の作成において、POS(Point of Sales)データや、携帯電話端末のGPSによって捕捉される位置情報データ、衛星画像データ、Webの検索データ等、いわゆる民間のビッグデータを新たなデータソースとして活用し始めています*。公的統計作成のために政府等が行うサーベイは、企業や世帯に対して回答を依頼するため、データの収集には多くの時間が必要であり、集計から公表までのタイムラグが発生します。一方、民間企業等が保有するビッグデータは、リアルタイムに取得することが可能であり、タイムラグはほとんど存在しません。つまり、ビッグデータを活用することで、公的統計の公表を大幅に早めることが可能となります。公的統計は、経済政策の判断に用いられるほか、企業の経営判断にも用いられており、その速報化はこうした意思決定の質向上につながると考えられます。
ただし、公的統計作成における民間ビッグデータの活用には課題があります。これらは公的統計作成を意図して取得されたデータではないため、捕捉したい対象の全体を捉えていることはまれであり、部分的にしか捕捉できていないケースがほとんどです。したがって、これらを「捕捉したい対象全体を捉えるためのデータ」と見做す場合、セレクションバイアスの影響を取り除くことが必要となります。
当論文では、機械学習分野で発展した共変量シフト下での教師付き学習のアイデアを応用することで、この課題が解決できることを示しています。
- *日本では、例えば、総務省により、各府省、地方公共団体、民間企業等におけるデータ等の相互利活用を推進するため、「ビッグデータ等の利活用推進に関する産官学協議のための連携会議」が開催されています。
関連リンク
- 株式会社リクルート
https://www.recruit.co.jp/newsroom/pressrelease/2022/1213_11876.html - Recruit Holdings Co., Ltd.
https://recruit-holdings.com/en/newsroom/20221213_0001/ - IEEE Xplore
https://ieeexplore.ieee.org/document/10020563