2021年8月19日木曜日

クロス表とベイズの公式に基づく新型コロナPCR検査抑制論の検討(授業用資料) - 朴勝俊 Park SeungJoonのブログ

クロス表とベイズの公式に基づく新型コロナPCR検査抑制論の検討(授業用資料) - 朴勝俊 Park SeungJoonのブログ

クロス表とベイズの公式に基づく新型コロナPCR検査抑制論の検討(授業用資料)

 日本のPCR検査数(人口比)は先進国で最下位レベルです。ニュージーランドや台湾、韓国、中国などは少数でも感染者が見つかれば大量のPCR検査と隔離を行い、感染ゼロを目指していますが、日本は「専門家」たちがPCR検査の精度が低い、徹底的な検査を行うとニセ陽性が出るのでよくない、などと言う説を流布し、政府もそうした説明に影響されて住民に対する検査は徹底されていません。例えば、2021/7/1~8/16までの、東京都(人口1400万人の検査数は計54万2781件、陽性者数11万1699件、陽性率約20.6%です。他方で、東京オリンピックの選手・関係者の数万人には世界水準の徹底した検査と隔離が行われてきました(2021/7/1~8/16までの総計で73万0979件、陽性件数204件、陽性率約0.03%)[1]。

 今回はクロス表とベイズの公式に基づいて、PCR検査の精度についてやさしく学び、コロナ対策について考えてみましょう(途中の数式展開など、完全に分からなくてもかまいません)。

全文PDF版はこちらからDLできます。

drive.google.com

PCR検査の正確さ分析シートはこちらからDLできます。

docs.google.com

■ 感染とは何か
 PCR検査はウイルスの遺伝子を数億倍から数兆倍に複製して検出する検査です。日本において、PCR検査抑制論者の中には「検査の陽性者は感染者ではない」と主張する人がいます[2]。一般に感染という用語は、体内で病原体が増殖するようになることと定義されるので、もっともな議論にきこえます。しかし新型コロナは無症状でも他人に伝染するなどの特徴があり、慎重な扱いが求められます。国立環境研究所等の「病原体検査の指針」では「病原体が検出された場合、検体採取時点における感染が確定される」としています[3]。NHKのサイトでは、陽性などという言葉を使わずに、ただ「感染者数」として記録しています。
 この授業では、正しく行われたPCR検査での陽性を、被験者の体内から遺伝子が見つかったと、つまり体内にウイルスがいたという意味で感染と同じように用います。それが体内で増殖するか、他の人に伝染するかは関係ないものとします。他方、ニセ陽性は、被験者の体内にはウイルスはいないのに陽性になったという意味であり、これは他の被験者のウイルス遺伝子が間違って混入するなど、検査が正しく行われなかった場合のこととします。

 まず下の表のとおり整理します。アルファベットの上に横線が引いてあるものは否定を意味します(感染(A)の否定が非感染(nA)であり、陽性(B)の否定が陰性(nB))。人数がNです(※表ではAやBの文字の上に横線で記していますが、このブログの地の文ではこの記号が使えませんので、否定の意味をnで表しnA、nBとします。PDFファイルは正しく記されています)。

f:id:ParkSeungJoon:20210819144314j:plain

f:id:ParkSeungJoon:20210819144228j:plain

表1に基づいて、検査の結果に関係する用語と計算式を整理したものが表2です。

PCR検査抑制論: 陽性者のほとんどはニセ陽性?
 PCR検査抑制論者は、PCRは精度が低く、陽性者のほとんどはニセ陽性なのだから、検査を増やすとニセ陽性者の入院が増えて、医療崩壊が起こる、などと主張してきました。ここでいう精度については、「感度」と「特異度」という指標に特に注目しましょう。上の表にあるとおり、感度は感染者が正しく陽性判定される率、特異度は非感染者が正しく陰性判定される率です。

 PCR検査抑制論者は、新型コロナが日本にも上陸した2020年の春ごろから、この感度は70%程度、特異度は90~99.9%程度しかないと主張していました[4]。実際には、後で見るように特異度がこんなに低いことはありませんが、極端な例として特異度90%で考えてみます。

 人口1万人の場合に、有病率が1%として、感度70%、特異度90%に合致するのは以下の数値例です(文章と表の数字を照らし合わせて、よく確認してください)。

f:id:ParkSeungJoon:20210819144357j:plain

この場合のニセ陽性はいくらになるでしょうか? 陽性者数N(B)が1060人ですから、そのうちのわずか70人(6.6%)が本当の陽性、990人(93.4%)がニセ陽性ということになります(確認してください)。だから検査を増やすべきではないというのが検査抑制論です。

ベイズの公式を用いて
 上のような例を用いた検査抑制論は、ベイズの公式を用いてまことしやかに広められました。ベイズの公式を用いれば陽性的中率を一発で計算することができるのです。

f:id:ParkSeungJoon:20210819144446j:plain

 ここで条件付き確率を定義します。ある事象Aが確定したあとで、そのうちさらにBが決まる確率を条件付き確率といい、P(B|A)と書きます(P(B) given (A)と読みます、書き順に気を付けてください)。ここでは、表4の左上のセルだけに注目してください。例えば、感染(A)していることが分かっている人々が、ためしに検査をしてみて実際に陽性(B)となる確率はP(B|A)となります(条件Aが後ろに書かれます)。感染者数N(A)をかけると、感染者で陽性の人の数はP(B|A)×N(A)となります。逆に、陽性(B)となった人が、感染(A)している確率はP(A|B)となります。ここで陽性者数N(B)をかけると、陽性で感染している人の数はP(A|B)×N(B)となります。どちらの計算をしても、その数は等しいので、
P(A|B)×N(B)=P(B|A)×N(A)
が成立します。この両辺をNで割ると、
P(A|B)×N(B)/N=P(B|A)×N(A)/N、ただしN(B)/N=P(B)、N(A)/N=P(A)なので
P(A|B)×P(B)=P(B|A)×P(A)
となります。この式の両辺をP(B)で割ると、陽性的中率を求める公式が、

f:id:ParkSeungJoon:20210819144549j:plain

として得られます。これがベイズの公式です。ところで、陽性になる確率P(B)は、感染(A)となったうえでさらに陽性になる確率P(B|A)×P(A)と、非感染(nA)となったうえでさらに陽性になる確率P(B|nA)×P(nA)との和です(𝑃(𝐵)=𝑃(𝐵|𝐴)×𝑃(𝐴)+P(𝐵|nA)×P(nA))。従って、

f:id:ParkSeungJoon:20210819144603j:plain

が導かれます。この式には、計算に必要な要素が全て含まれることがわかります。

※(1-特異度)の部分について説明すれば、特異度とは非感染者がたしかに陰性になる確率P(nB|n𝐴)のことですが、式の分母のP(𝐵|nA)は非感染者が陽性になる確率なので、P(nB|nA)+P(𝐵|nA)=1より、P(𝐵|n𝐴)=1− P(nB|n𝐴)=1-特異度、となることから、これが得られます。

 この式に先の数値例より有病率=0.01、感度=0.7、特異度=0.9を代入しましょう。ただし有病率は、本当の値はよくわからないので、仮定としての「事前確率」とします。

f:id:ParkSeungJoon:20210819144816j:plain

従って、表3の数値例を表計算した結果とおなじになったことが分かります。

■ 再検査すると?

 さて、1回目の検査の結果として陽性的中率が6.6%となりました。ここで2回目の検査を行うとどうなるでしょうか? 陽性となったことで、有病率の事前確率がもとの1%から6.6%(0.066)まで上がったと考えられますので、これを代入すると以下のようになります。

f:id:ParkSeungJoon:20210819145018j:plain

さらにもう一回、有病率の事前確率を33.1%に更新して検査をすると、

f:id:ParkSeungJoon:20210819144849j:plain

つまり77.6%まで陽性的中率が上がることが分かります。これをベイズ更新といいます。

■ 有病率が下がると?

 先に見たように、有病率=0.01、感度=0.7、特異度=0.9のとき、陽性的中率は6.6%でした。有病率がさらに低下し、0.001(0.1%)になったらどうなるでしょうか?

f:id:ParkSeungJoon:20210819145145j:plain

 陽性的中率は0.7%まで低下します。つまり99.3%はニセ陽性になるわけです。このような理由から検査抑制論者は、有病率(事前確率)が低い時にはむやみに検査を増やすべきではないと主張します。もっともらしい主張ですが、それは本当でしょうか?

■ 特異度が100%ならば?
 実はPCR検査は、検体が正しく採取されているならば、技術的には感度100%、特異度100%です(詳しくは[5])。少しでもウイルスの遺伝子があれば大量複製して発見できて陽性となり、ゼロならばいくら複製してもゼロなので陰性となります。ただし臨床では感度は、感染者の検体が良いタイミングで確実な方法でとれない場合も考慮すると95%前後とされます。特異度は非感染者の検体が汚染されるなど、めったにない状況を考慮しても、あとで確認するように実績値としてほぼ100%です。では、特異度が1なら先の計算はどうなるでしょうか? 分母にある(1-特異度)=(1-1)=0になりますから、この項が消えて、

f:id:ParkSeungJoon:20210819145047j:plain

です。

 つまり特異度が100%なら、感度や有病率に関わらず陽性的中率は常に100%になります。ニセ陽性はいなくなるのです。これがPCR検査の信頼性であり、日本以外の諸外国がPCR検査を徹底的に行っている理由です。

■ 実際に特異度は100%なのか?

 しかし、どんな検査も特異度100%はありえない、と信じている「専門家」は少なくありません。では、PCR検査の実際の特異度を確認してみましょう。数値例には、最初に出てきた東京都とオリンピックの実績値(2021/7/1~8/16)を使います。
東京オリンピックでは選手や関係者に対して、無症状でも徹底した検査と隔離が行われました。総計73万0979件のうち、陽性件数204件、陽性率約0.03%(正確には0.0279%)でした(同じ人に何度も検査がなされたので、人数ではなく件数と呼びます)。有病率(事前確率)はこの陽性率を参考に0.03%(つまり73万0979×0.0003≒219件が検査時点で感染、残りの73万0760件が非感染)としましょう。この情報に、感度と特異度の想定値を入れれば、2x2表を再現することができます。まず、感度70%、特異度90%ならどうでしょう。

f:id:ParkSeungJoon:20210819145252j:plain

 この場合、陽性になるのは感染の70%にあたる154件と、非感染の10%にあたる7万3076件の、合わせて7万3229件、ニセ陽性率は99.8%となるはずです。実際の陽性数204件とは全く違います。これは、感度70%、特異度90%という設定が間違っているということです。
 では感度95%、特異度100%で計算してみましょう。

f:id:ParkSeungJoon:20210819145340j:plain

 陽性数は208件となり、実際の陽性数204件とほぼ同じになります。そしてニセ陽性はゼロになります。ちなみに特異度を99%や99.9%に高めても、あり得ないほどたくさんの陽性とニセ陽性が出ます(99%の場合は陽性7516件のうち97.2%がニセ陽性、99.9%の場合でも陽性939件のうち77.8%がニセ陽性となります。興味があれば同様の手続きで確認してみてください)。したがって、特異度は100%だと考えるのが妥当です。PCR検査はこれほど精度が高い検査なので、世界で広く用いられているのです。

 念のため、特異度100%がまだ信じられない人のために、実際の感染はゼロで、陽性は全てニセ陽性という無理な仮定をして特異度を計算してみましょう。表7を描くことによって、特異度は73万0775÷73万0979=99.97%です。PCR検査の実際の特異度がこれより低いことはありえません。

f:id:ParkSeungJoon:20210819145411j:plain

練習問題:
 東京都は2021年7月1日から8月16日の間に、検査数総計54万2781件、陽性者数11万1699件、陽性率20.6%でした。東京都民には、徹底的に無症状の人や濃厚接触者以外にも大量に検査するというようなことは行われていませんので、検査の対象になった人は、ほぼ感染していそうな人たち(事前確率が高そうな人たち)でした。陽性率を参考に事前確率を0.2と設定して、感度70%、特異度99%の場合と、感度95%、特異度100%の場合に分けて表を書き、それぞれの陽性者数と陽性的中率を求めましょう(この場合も、特異度100%が妥当であることが確認できます。ただし、事前確率が高いので、特異度が低い場合でも陽性的中率が高く、ニセ陽性がそれほど出ないことも分かります)。

※練習問題の解答はこの記事の最後にあります。

参考:
[1] ・東京都「新型コロナウイルス感染症検査実施件数」「新型コロナウイルス感染症確定日別による陽性者数の推移」
https://catalog.data.metro.tokyo.lg.jp/dataset/t000010d0000000086
https://catalog.data.metro.tokyo.lg.jp/dataset/t000010d0000000087
・TOKYO 2020 COVID-19 Positive Case List, Tests and Total Confirmed Positives
https://olympics.com/tokyo-2020/en/notices/covid-19-positive-case-list
[2] 例えば、本間真二郎(2020)「新型コロナ「検査の陽性者」=「感染者」ではない…!PCR検査の本当の意味」『現代ビジネス』2020.09.03 (https://gendai.ismedia.jp/articles/-/75285
[3] 国立感染症研究所ほか(2021)『新型コロナウイルス感染症(COVID-19)病原体検査の指針 第3.1版』 p.5 (https://www.mhlw.go.jp/content/000768499.pdf
[4] 山中たつはる「ベイズの定理を悪用し、コロナウイルスPCR検査の有用性を否定する医師達」ブログ臨床獣医師の立場から(https://tatsuharug.com/abuse-bayes)。このページに名前が挙げられている医師には、[特異度90%] 東京大学公共政策大学院・鎌江伊三夫特任教授、東北大学大学院医学系研究科発達成育医学講座胎児医学分野研究室長・室月淳氏、[特異度99%] 九州大学教授・馬場園明氏、東北医科薬科大学病院感染症内科・福家良太氏、感染症専門医・岩田健太郎氏、診断病理医・峰 宗太郎氏、医療法人社団悠翔会・佐々木淳氏、[特異度99.9%]感染症専門医・忽那賢志氏、新型コロナウイルス感染症対策分科会会長・尾身茂氏、東邦大学医学部・東邦大学医療センター大森病院教授・中田雅彦氏がいます。次の電子書籍も参照: 山中たつはる(2021)『コロナ禍で見えてきた おかしな専門家と知識人』リーダーズノート出版
[5] 牧田寛(2021)『誰が日本のコロナ禍を悪化させたのか?』扶桑社、p.223、p.224

<他の参考事例>
・2020年7月の日本のJリーグの検査(7/25発表)、3300人を検査して1人が陽性
→事前確率0.03%とし、陽性者をニセ陽性と仮定しても、特異度99.99%以上。
・2020年はじめ、中国の武漢で約137億円かけて989万9828人にPCR検査を実施、 無症状感染者300人を確認、陽性率は0.00303%) ([4]の電子書籍を参照)
→事前確率0.03%とし、陽性者を全員ニセ陽性と仮定しても、特異度99.997%以上。
ニュージーランドで1日2000~3000件の検査を続け、24日間連続で陽性者がゼロ。
→特異度100% ([4]の電子書籍を参照)

f:id:ParkSeungJoon:20210819145444j:plain

0 件のコメント:

コメントを投稿