どちらを使っても大丈夫です。 次は実際に例題を通して条件付き確率についての理解を深めていきましょう。 この赤い玉に「X」と書かれている確率はいくらでしょうか。 1 は通常の確率を求める問題です。 1 、 2 ともに「X」と書かれた赤玉を取り出す確率ですが、 2 は取り出した玉が 赤色であるという条件のもとでの確率なので 1 とは確率が異なりますね。 これが「 条件付き確率」です。 条件付き確率は苦手な人が多いですが、基本を押さえれば難しくないのでいろいろな問題を解いて慣れていってくださいね。 最後に、少し発展的な内容である「ベイズの定理」について説明していきます。 しかし ベイズの定理では時間軸が逆になります。 つまり、「 ある事象が起こった原因を確率的に求める」ことが目的になります。 例えばある犯罪が起きたとして、「このような手口の犯罪が発生したが、このようなケースが起こる原因は〇〇〇の可能性が高い」といった感じです。 実際にベイズの定理を使う例題を見てみましょう。 この不良品が X 工場で生産された確率はいくらか。 これは 結果から原因を求めようとしている、つまり 一般的な確率とは時間軸が逆の確率を求めることになります。 実際に求めてみましょう。 ただし、条件付き確率が ある条件下で起こる事象(結果)を確率的に求めるのに対し、ベイズの定理では ある事象(結果)が起こった原因を確率的に求めることができます。 そのため、ベイズの定理を利用した ベイズ統計学では、過去の経験や新しく蓄積されたデータから、 ある事象が起こる確率を 更新する(精度を高めていく)ことができるのです。 ベイズの定理は少し発展的な内容であり、大学受験においては必要ありません。 ですが、条件付き確率をしっかり理解した上で、豆知識として知っておいて損はないですよ!.
次のある喫茶店が、店のニガイコーヒーに合うお菓子アマイーを作った。 1ヶ月間の売上げを見たところ、次の様な結果が出た。 1ヶ月間の、 お客様全員の数 300名 アマイーを注文したお客様の数 40名 ニガイコーヒーを注文したお客様の数 100名 ニガイコーヒーを注文して、 アマイーを注文したお客様の数 20名 これを、ベン図で書くと、この様になります。 さて、このデータをもとに、次に来たお客様について考えてみましょう。 ニガイコーヒーとアマイーの両方を注文する確率は、一体、どれくらいでしょうか? これは、さっきのサイコロと同じで、同時確率を求めれば、いいですよね。 ニガイコーヒーを注文する• アマイーを注文する この2つの事象が同時に成り立つ時の確率です。 答えは、簡単ですね。 さて、ここからが、おもしろくなります(笑) B と A の同時確率 この同時確率は、次の2つを使って表現することができます。 全体の中で、ニガイコーヒーを注文したお客様の確率• ニガイコーヒーを注文したお客様で、アマイーを注文したお客様の確率• まず、 1番からです。 お客様全員は300名で、その内、ニガイーコーヒーを注文したお客様は100名です。 従って、確率は• 続いて、 2番です。 ニガイコーヒーを注文したお客様が100名、その中でアマイーも注文したお客様は20名です。 従って、確率は この 1番と 2番を使って、同時確率(ニガイコーヒーとアマイーの両方を注文する確率)を求めると・・・ ここで、先ほどの、ベイズの定理を、もう一度見てみてください。 この同時確率の式が、そのままベイズの定理の「分子」の部分であることが分かると思います。 さて、それでは、いよいよベイズの定理の証明にいきましょう。 ベイズの定理の証明 証明には、B と A の同時確率は、A と B の同時確率 から導きますが、これらは共に答えは同じです。 念の為、さっきの、ニガイコーヒー(B)と、アマイー(A)の例で見てみましょう。 A と B の同時確率• 全体の中で、アマイーを注文したお客様の確率• アマイーを注文したお客様で、ニガイコーヒーを注文したお客様の確率• まず、 1番からです。 お客様全員は、300名で、その内、アマイーを注文したお客様は40名です。 従って、確率は• 続いて、 2番です。 アマイーを注文したお客様は40名で、その中でニガイコーヒーを注文したお客様は20名です。 従って、確率は この 1番と、 2番を使って、同時確率(ニガイコーヒーとアマイーの両方を注文する確率)を求めると・・・ もう、お分かりですよね。 あとがき ベイズ確率って、最近のトレンドの様に使われているので、少なくとも20世紀後半に誕生したのかと思っていました。 このベイズさんって、1702年生まれなんで驚きました。 実際に、ベイズ確率が広まったのは、その後、ラプラスによって18世紀後半から19世紀にかけてのようですね。 時代が、こう目まぐるしく変化し、次から次へと新製品が出てきたり、新しいシステムが出来たりすると、故障率や、何か経営戦略的な数値を出すのも、従来の頻度に頼る確率・統計では対応できないですよね。 このベイズの定理を元とした、ベイズ推定やベイズ統計などが、本当に今はメジャーですよね。 ベイズの定理については、他にも投稿があるので、よろしければそちらもご覧下さい。
次の「コロナは全員検査しろ」という人は、これを読んでいただきたい。 そしてご自身の「勘違い」に向き合っていただきたい。 「勘違い」を自分で修正することは、いつでもできますし、それができる人は賞賛されます。 ベイズ推定を、数式でなく直感的にでも理解していないと「誰でも全員PCRしろ」という(現況では)誤謬から逃れられません。 ベイズ推定を直感的に把握できる、ものすごくわかりやすいページがありますからご紹介します。 直感的な把握のためには前半分くらい、数式の手前まで読めばいいです。 先のページの図を参考に下図を描き、要素をコロナに置き換えました。 下図の縦割りの左側(先のページでの「買った人」)がコロナ感染症だった人、黄色い部分(「店員に声をかけた人」)がコロナPCR陽性の人です。 現実のコロナでは、先のページの図の横軸の比率(0. 8)はわかっていません。 図の縦軸左の比率は、コロナの場合は今の所(0. 3:コロナPCR検査の感度)くらいと言われています。 (右側は今回言及しませんが(0. 9 くらいと言われています。 ) 現状で「全員PCR検査しろ」という人は、上の図の左下の「コロナPCR偽陰性」の感染者が検査を受けて陰性と出たことで「自分はシロ」と思い込み、市中へ出かけて感染を広げてしまうことを深慮していません。 また、右下の「コロナPCR陰性」(真の陰性=コロナでない:この図でも一番面積が大きい)に対して全例検査をする膨大な無駄の、医療資源の圧迫と崩壊に対する影響を想像できていないのです。 (イタリアはこれをやって医療資源が枯渇し・かつ押し寄せた来院者間での感染クラスターが起きて国内蔓延状態になった可能性を指摘されています。 ) 「全例検査しろ」が正当化されるには三つの方向の条件があります: ・それが感染症発生のごく初期(または局地的で限定されたクラスターも?)で、その範囲でクラスター構成員の全員を発見し・追跡し・そのクラスターの範囲のまま撲滅または抑え込める見込みがある場合。 この場合のPCR検査は「クロを確定する」=陽性者を発見し、治療・完全隔離に回すためにやるのであって「シロを見つける」=陰性者を解放するためにやるのではありません。 もちろん陽性者とは切り離して。 (国内全体ではその状態ではない) ・その感染症にかかると100%とか高確率で死ぬ・伝搬者を見つけ出さないとみんなバタバタ倒れていく、というように、結果が深刻なので十分にコストと手間をかけても感染者を特定する価値がある場合(コロナの重症化は20%程度、死亡者は年齢や条件により0. 少し乱暴な言い方だが、8割は風邪で治る。 ) ・妊娠検査スティックのように、検査の信頼性が超高くて、超低コストで、医療機関に頼らず自分でできる場合(現在のPCRは全くこれには当てはまらない) です。 これら「限局して対応可能か」「見つけないとみんな死ぬか」「検査の信頼性とコストが妥当か」のコンビネーションで、特定の検査手法を誰に対して採用するかが決まります。 コロナPCR検査では、現在ではそれを「有症状の患者・疫学的に検査価値が高い患者(クラスター構成員など)」に限定しているのです。 (おおむね上図の青枠のあたりのことを意味しています。 ) 「でも全例検査したら市中の陽性者が発見できるじゃないか」と思いますか? それについて、次のセクションで「実効性」を検討しましょう。 それやってて意味あるの?:実効性 もう一つ「全員PCR」という人が把握すべきことがあります。 それは「実効」です。 下図はで、厚労省のデータを基にしており、もとは各県のデータに由来しています。 県から厚労が集めたデータについての「何か隠し事がある」系の陰謀論は、ここでは相手にしないことにします。 示している図は、全国のPCRの実施件数です。 3月4日あたりで一気に数が増えたのは【訂正】厚労省が濃厚接触者の検査も公表数値に加えたため、見かけ上増えた(旧:保険適応になった)からだと思われます。 「PCRをどんどんやろう」という人には「おお件数は増えてるな。 でもまだ足りない」と見えるのでしょうか。 保険適応になった現在でも、検査には一定の縛りがかかっており、簡単にいうとなんらかの症状があるか、濃厚接触など検査に疫学的意義があるかのどちらかです。 つまり、医療的に意味があるかどうかに関して、一定のフィルタがかかっている「よりそれらしい・必要そうな」ケースです。 先のベイズ推定で言うと「事前確率が上がっている」状態です。 このグラフで我々が注目しなくてはならないのは「件数が増えてきた」ではなく、検査した結果にどれだけ意味があったのか=「実効」です。 それは「陽性者数」でわかります。 上図の「陽性者数」の割合を見てください。 このグラフでは「オレンジ色」です。 グラフ中に「オレンジ色」が見えますか?ほとんど緑と黄色しか見えませんね。 (矢印を付け加えておきます。 オレンジ=見えるオレンジ+黄色かもしれないが、議論の内容は同じ。 )つまり陽性者は非常に少ない、ということです。 数的に見るとPCR施行例の95%前後が陰性のようです。 つまり、結果側から見ると、この検査は95%程度は陰性になるような集団に対して行われている、ということです。 この対象は医療フィルタ(医者の目・有症状・濃厚接触歴など)を通ってきた集団です。 そうでなく「全例PCR」と言っている人が望んでいるように「誰でも希望すれば検査」というような状態で検査すれば、(医療フィルタがなく「事前確率が下がっている」ので)陽性率はさらに下がるだろうと推測されます。 (注意:対象は「一般市民」であり「クラスター発生中のエリア」は除外します。 あなたも含めて。 つまり検査であなたが得ている安心は「嘘の安心」です。 「全員PCR」は「嘘の安心」を作り出す以外に、一体何を調べているのでしょうか? 孫さんの賢明な判断 冷静に考え、勘違いを修正すれば、このことが理解できると思います。 昨日、ソフトバンクの孫さんがツイッターで「PCRキットを配る」と発言し、周囲の強い反対・諫言があり、すぐに取り下げました。 すぐに勘違いを修正できた、幸運で賢明なケースに見えます。 (ここで「孫ハゲ」ヘイトを言い募るのはやめましょう。 無駄事です。 ) 「全員PCR」と発言している方々にも、そういう振る舞いを期待したいです。 じゃあどうすればいいの? じゃあPCRなしでどうしたらいいの? の答えは広く行き渡っています。 そもそもPCRでは3割見落とすから「誰がシロか」には役に立たないのです(「誰がクロか」には役立ちます)。 PCR検査しても周りも自分もシロかクロかわからないのだから、自分がシロの場合とクロの場合を考えましょう: ・自分がシロだと思うなら、クロになる・感染しそうな場所に行くのをやめよう:閉鎖空間・換気が悪い・触れるくらいの相互接近で会話が頻繁に起きる場所。 主催者の都合はともかくとして、自分で考えて決めよう(ここはまさしく自己責任)。 場の感染危険性(電車内など)について、合理性のある推理を探し、自分で考えて行動しよう。 感染危険性の低い場所ならマスクも不要。 ・自分がシロでありたいなら、基本的な感染防御を実践する:つまり手指衛生=手を洗う ・自分がぷちクロっぽい、つまり感染症っぽかったら、自分がクラスターを作り出さないように、軽いうちは職場・遊びなどに外出せずに自宅安静・寝ていよう・栄養を十分に摂ろう。 コロナの8割は軽症・寝ていれば治るらしい。 ぷちクロで病院に行けば、病院の資源の無駄使いに加担するし、逆にコロナをもらって帰ってくるかもしれません。 ・自分がかなりクロっぽい・重症化しそうだ・2割に入るかも、と感じたら「感染者・接触者センター」に相談する:あなた自身の常識判断・直感が大事です(ここも自己責任) これらのストラテジーは、コロナPCRの有無とは関係なく行えることです。 ベイズ推定やMCMCを仕事で使っていますが同意できません。 と言っても、医療資源に過剰な負荷をかけてはいけない、検査を増やしても陽性者がすごく増えるわけではない、という点は同意です。 しかし検査は「クロ」を確定するために必要です。 sheemerさんは、偽陰性の人が市中で感染を広げるリスクを言ってますが、それより検査で陽性となる人が検査をせずに感染を広げるリスクの方が大きいです。 また陽性でも疾患が深刻でないと主張されているようですが、深刻なのはその人が深刻な病態になるかではなく、感染者が隔離されていなければ、社会的に感染を広げることが問題なのです。 sheemerさんは感染者が指数曲線に従って増加することをきちんと理解されているでしょうか。 これは感染者数の統計をとればすぐにわかることです。 日本は感染者の増加は世界でも特に少ないですが、それでも10日間に10倍の勢いで感染者が増加しており、その増加速度は1ヶ月間変わっていません。 このままの状態を1月維持すると、許容できない犠牲者が生じます。 増加速度を下げるには不効率でも検査数を戦略的に増やす必要があります。
次の