新型コロナウイルス感染症に関して、日本は海外に比べて検査数が少ないから陽性が少ないのではないか、日本でもどんどん検査対象を広げるべきだという主張が結構あって、ちょっと引っかかっていたので考えてみた。都民全員に「ある病気」に関して高精度の検査を実施したらどういうことがおきるか。最初は中央区民で考えたのだが、母数が小さすぎるので都民にした(2020/04/03)。
前提
例えば、東京都から都民全員に簡易検査キットが送られてきて、それを使った後に東京都に送り返し結果を郵送で受け取る、といったケースを考えてみる。
○東京都民は1300万人
①罹患率は0・01%
②検査法として次のようなものを考える
・ある病気を罹患した人の99%を「罹患している」と正しく判定できる
・ある病気を罹患していない人の99%を「罹患していない」と正しく判定できる
考察(全数検査した場合)
この検査を受けた場合に4つのグループわけが可能
1:実際に罹患していない人 99・99%
1A 検査で罹患していると出た人 0.9999%
1B 検査で罹患していないと出た人 98・9901%
2:実際に罹患している人 0・01%
2A 検査で罹患していると出た人 0・0099%
2B 検査で罹患していないと出た人 0.0001%
「検査で罹患している」と出る人は
1A+2A 0・0099%+0・9999%=1・0098%
このうち、実際に罹患している人は2A=0・0099%
「罹患している」という通知を受けた人が実際に罹患している確率は
2A/(1A+2A)=約0・98%
だいたい100人に1人ということになる。
参考:東京都の人口1300万人に当てはめる
1:実際に罹患していない人 1299万8700人
1A 検査で罹患していると出た人 12万9987人
1B 検査で罹患していないと出た人 1286万8713人
2:実際に罹患している人 1300人
2A 検査で罹患していると出た人 1287人
2B 検査で罹患していないと出た人 13人
「あなたは罹患しているという検査結果が出ました」と通知されるのは
1A+2A:131265人。
この中で実際に罹患しているのは2A:1287人
考察(スクリーニングで検査対象の罹患率を0・01%→20%)
東京都民から特定の症状を示した人に絞って検査を実施した場合を考えてみる。
例えば、新型コロナ特有の37・5度以上が4日以上とか。で、統計的に検査対象の罹患率がだいたい20%になったとする。そこに検査を実施する。
1:実際に罹患していない人 80%
1A 検査で罹患していると出た人 0・8%
1B 検査で罹患していないと出た人 79・2%
2:実際に罹患している人 20%
2A 検査で罹患していると出た人 19・8%
2B 検査で罹患していないと出た人 0・2%
「検査で罹患している」と出る人は
1A+2A 0・8%+19・8%=20・6%
このうち、実際に罹患している人は2A=19・8%
「罹患している」という通知を受けた人が実際に罹患している確率は
2A/(1A+2A)=約96・1%
通知された人はほぼ罹患したと言える結果になった。
感想・まとめ
適切な絞り込みをしないで手当たり次第検査をすると、
総数として「罹患していない」のに「罹患している」判定の人が多くなりすぎて、
検査の意味をなさなくなるだろうという話。
計算、あってるかな。