MRI Research Associates
公共政策第一部
PROJECT STORY
郵送調査の「欠測値」をどう埋めるか。
EBPMを支えるデータ分析の挑戦
行政分野でEBPM(Evidence Based Policy Making:科学的根拠に基づく政策立案)が重視される中、
その基盤となる統計調査のあり方が、いま大きな転換点を迎えている。
訪問調査から郵送調査へ移行する際に生じる
本来あるはずのデータが空欄になってしまう「未回答(欠測値)」という課題に、
MRAのデータアナリティクス技術チームはどう向き合ったのか。
米持と千羽、二人の視点からプロジェクトのリアルをひもとく。
米持 潤也

チームリーダー
データアナリティクス技術チーム
2018年中途入社
情報セキュリティ科 修了

データアナリティクス技術チームのリーダーとして、分析モデルの設計や基盤づくり、プロジェクトの全体管理を担当。休日は散歩や自転車、読書、料理などを家族と楽しむ。息子が統計に興味を持ったことで自らの仕事の意義を再認識し、品質の高いアウトプットを心掛けている。

Junya Yonemochi
千羽 敏史

データアナリティクス技術チーム
2019年中途入社
経済学部経済学科 修了

学生時代に専攻した計量経済学や統計分析への関心をきっかけにMRAへ転職。プライベートでもデータ分析コンペ(Kaggle、SIGNATE等)に参加し、スキルの研鑽を続けている。「数字の裏にある生活や背景を想像する」視点を大切にし、地道な前処理作業の積み重ねを価値ある工程ととらえている。

Toshinori Senba

01
プロジェクトの背景

郵送調査への転換がもたらす、新たな課題

従来の統計調査では、調査員が現地に赴き、対面で聞き取りを行う調査方法が主流だった。しかし近年は、人員やコストの制約から郵送調査への切り替えが検討されている。今回のプロジェクトも、そうした流れの中で生まれたものだ。

米持
「調査員調査であれば、調査員が調査対象先を訪問し、その場で『この欄には何を書けばいいのか』を説明できます。郵送調査ではそれができないため、特に金額や数量などの項目で空欄が増えることが想定されました。こうした未回答の増加は、集計結果の信頼性を下げたり、時系列での比較を難しくしたりする恐れがあります。そこで、郵送調査への本格移行に先立ち、欠測値をどのように補完すればよいのかを検証する事前調査研究として、本プロジェクトが立ち上がりました」
千羽
「分析の立場からすると、空欄(欠測)の増加は推定精度を直接下げるリスクです。欠測が増えれば真の値を特定しにくくなり、補完の仮定次第では結果が大きく変わってしまいます。調査方法の変更による見かけの変化と実態変化の切り分けも難しくなるため、事前に影響を検証する必要がありました」

02
MRAの取り組み

限られた時間の中で、「精度」と「説明性」の最適解を探る

本件の依頼主は農林水産省で、プロジェクト期間は約3か月。当社側3名を含む体制で、農業分野に知見を持つ親会社と連携しながら、MRAは主に分析モデルの設計・検証を担った。

千羽
「欠測値補完の方法には複数の選択肢があります。空欄に一定の値を入れる単純な方法から、他の項目との関係性を踏まえて推定する統計モデルまで、考え方の異なる手法があります。本プロジェクトでは、それぞれの手法を適用し、結果の差異を比較しました。統計モデルは、変数の選び方やパラメータ設定次第で結果が大きく変わります。すべてを試行することは現実的ではありません。納期内で、品質を担保するために不可欠だったのは、『なぜこの手法を採用したのか』を誰にでも説明できることでした。精度が高いだけでは、政策の現場では使えないからです」

一方で、分析を進めるうえでは時間的な制約が大きかった。米持はプロジェクトリーダーとして全体を俯瞰し、関係者との調整に注力した。

米持
「3か月という限られた期間で、『できること・できないこと』を整理しながら、何をどこまでやるのか、実施できる範囲を見極める必要がありました。説明性を重視するのか、あるいは、精度を重視するのか。その判断軸を関係者と丁寧に共有しながら進めることが重要でした。分析担当としての理想と、プロジェクト全体としての現実的な制約の間で、どこに線を引くかは難しい判断がありましたね」

03
プロジェクトの成果と展望

説明性を重視した提案、そして次の挑戦へ

最終的な提案では、複数手法の比較結果を提示したうえで、説明性に優れたホワイトボックス型の統計モデルを軸とした分析結果をまとめ、提案を行った。

米持
「最終的には、説明性を重視したホワイトボックス型の統計モデルを中心に提案しました。結果の妥当性を、利用者自身が理解し、説明できることを優先しました。官公庁の業務では、『精度が高い』だけでは十分ではありません。意思決定の根拠として、自ら説明できることが求められます。『なぜこの結果になったのか』を自分たちの言葉で説明できることが重要です。今回はその点を重視しました」

一方で、より高い精度を目指す別の選択肢も見えていたという。

千羽
「精度のみを重視すれば、別の選択肢もありました。実際、今回のプロジェクトでもより高い精度を示すモデルも検証しています。ただ、それをどのように説明し、合意形成に用いるかを考えた結果、今回は採用を見送りました。機械学習のようなブラックボックス型のモデルを使えば、精度をさらに上げられる可能性はあります。ただ、説明資料としては難解になります。説明性と精度、そのバランスは今後も大きなテーマです」

今回の経験は、次の分析業務にも活かされていく。

千羽
「今回の判断により、次に取り組むべき課題も明確になりました。XAI(説明可能なAI)などの技術を活用することで、説明性と精度の両立を図れる可能性があります。EBPMを支えるデータ分析の幅を、これからも広げていきたいですね」

最後に、これからこの業界を目指す学生へのメッセージをもらった。

千羽
「データ分析というと華やかなイメージがありますが、今回のような郵送調査データの分析では、前処理など地道な作業が大半を占めます。一見すると非効率に見えるかもしれませんが、その過程でしか得られない気づきがあります。その積み重ねが最終的な分析の質につながります。そこで手を抜かず、楽しめる人が向いている仕事だと思います」
米持
「当社では、やりたいことや構想を論理的に伝えていけば、挑戦を後押ししてくれる会社です。調査の背景から分析まで一貫して関われる環境はそう多くありません。社会に役立つデータと向き合ってみたい人には、MRAは面白いフィールドだと思います」

Formation