『通常の学級に在籍する特別な教育的支援を必要とする児童生徒に関する調査』発表の検討

www.mext.go.jp

【PDF】通常の学級に在籍する特別な教育的支援を必要とする児童生徒に関する調査結果について (令和4年12月13日) (PDF:836KB)]

PDFの内容を検討します。簡潔に行きます。

調査目的は、10年前に同様の調査がおこなわれたが、当時とは様々の情況が異なっていると考えられるため、改めて調査を実施し現状を把握するもの。

調査法の記述は割としっかりしている。目標母集団(標的集団)は全国の公立の小学校・中学校・高等学校の通常の学級に在籍する児童生徒で、層化3段抽出、回収割合は8割以上と高い。学級担任に記入してもらうという仕組みが、回収割合を高めていると思われる。

回答者は、上述の通り学級担任。特別支援コーディネーターまたは教頭副教頭が確認し、校長が諒解すれば回答。担任が児童生徒について答えるのだから当然、バイアスがかかり得る。と言って、バイアスがかかるからこういう調査には意味が無い、とはならない。標準化されたテストを児童におこなわせるなどすると、コストが甚大になり、割合を推定する目的には大掛かりすぎる、という場合もあるから。要するに目的次第。

質問内容は、ADHD高機能自閉症に関するテストを参考にして作成。この種のテストは本来、トータルとして妥当性や信頼性が評価され標準化されて、実施にあたってテストを受ける情況を厳密に設定しておこなうべきものであるから、それをアレンジした時点で測られるものが違ってくる事に注意。だから調査主体は、

本調査における「Ⅰ.児童生徒の困難の状況」については、学級担任等による回答に基づくもので、特別支援教育コーディネーター、又は教頭(副校長)による調査票の記入内容の確認を経て、校長の了解の下、提出された回答に基づくもので、発達障害の専門家チームによる判断や、医師による診断によるものではない。

↑留意事項としてこのように補足している。内容が違うので縦断的比較も出来ないとも書いてあり、けっこう注意深いと言える。

調査結果が標本割合であり、それに基づいて母集団割合を推定している事も明記している。ただし信頼区間の説明(95%の確率で悉皆調査の場合の集計結果を含む範囲。)は間違っている。読む側が信頼区間を知っているのは稀だろうから、もう少し詳しく説明したほうが望ましいが、かといって簡単に書けるような概念では無い。

結果の記載は、各質問項目ごとに、割合の信頼区間が書かれている。わざわざ検定などせずに信頼区間を載せているので良い。

有識者会議による考察として、

「今回の調査結果から考えられること」 有識者会議座長 宮﨑 英憲

↑座長の宮ザキ(ザキはたつさき)氏による考察が記載されている。

前回の調査から割合が高くなっている所に触れているが、前述のように、調査情況が異なる事に注意するようにも書かれている。

。対象地域や一部質問項目等が異なるため単純比較はできないものの、

↑調査研究の文脈では、単純比較はできないもののとして続けるのは不用意と言える。単純比較出来ないから比較方法を工夫して、なるべくバイアス等を排除するのが研究の眼目であるのだから。

繰り返しにはなるが、本調査は、発達障害のある児童生徒数の割合や知的発達に遅れがある児童生徒数の割合を推定する調査ではなく、学習面や行動面で著しい困難を示すとされた児童生徒数の割合を推定している調査である。

↑本調査におけるアウトカムは、担任報告アウトカムとでも言えるものであるから、それの割合をもって、厳密に定義された概念にあてはまる例の割合を示すものでは無いと書いている所は、丁寧であると言える。あくまで担任が質問に対して回答した割合だが、それはそれで重要な資料。

割合が高くなっている事の理由として、

、通常の学級の担任を含む教師や保護者の特別支援教育に関する理解が進み、今まで見過ごされてきた困難のある子供たちにより目を向けるようになったことが一つの理由として考えられる。

↑このようなものが挙げられているが、これは比較的冷静な見かたと言える。つまり、実際の割合が変わらなくとも、評価する側の尺度が変化した事で見かけの割合が上がったのではないか、という指摘で、心理学的や社会学的の概念を測る際には注意しておくべき観点。

この次に、議論になっている記述がある。

そのほか、子供たちの生活習慣や取り巻く環境の変化により、普段から1日1時間以上テレビゲームをする児童生徒数の割合が増加傾向にあることや新聞を読んでいる児童生徒数の割合が減少傾向にあることなど言葉や文字に触れる機会が減少していること、インターネットやスマートフォンが身近になったことなど対面での会話が減少傾向にあることや体験活動の減少などの影響も可能性として考えられる。

↑ここは、明らかに不用意。アウトカムの割合が増えた事の原因として、特定の習慣等に割く時間の増減を示唆しているが、これは、

  • 既にそれが知見として共有されているか、
  • それを支持する実証科学的証拠をその場で提示出来る

事が出来なければ、説得力を持たない。これは、有識者会議としての立場からの意見なので、根拠が提示されておらずそう思っているものでしか無い。研究の一貫として統計的因果推論をおこなってもいない。そもそも、同時にそれらの時間を測っているのでも無い。更に言えば、ほんとうに割合が増えているかも断言出来ない。原因と目されるものとして特定のメディア、デバイス、習慣等を挙げているのだから、なぜそれを敢えて採り上げるのかを指摘されるのは当然と言える。調査主体としては、そのような問いに答えられなければならない。

次に、基準の境界付近についての検討が書かれている。もしそういう付近にあると評価された児童生徒が支援を必要とする状態であるのなら、実際に支援するのを考えるのは重要。もちろん、だからこそ、ほんとうにそうなのか、をきちんと検討する必要があるのだが。その後にも、前回調査との単純比較はできないもののと書きつつ検討しているが、先にも言ったように、単純比較出来ないのであれば、

  • 比較を工夫する
  • 比較などしない

のが重要であって、単純に言えないと前置きすれば良いというものでは無い。調査自体では特に検討されていない事について、有識者会議として踏み込み過ぎていると言える。

全体的な感想としては、

  • 調査の目的や実施方法、結果の記載のしかたは比較的丁寧で、資料を注意深く活用すれば社会に資するかも知れない
  • 調査でおこなわれているのは割合の推定くらいであるにもかかわらず、有識者会議という立場から実証的証拠に基づかない検討をおこなっている所が不用意

というもの。調査自体は、目的やコスト等を考慮しておこなわれるものであって、10年前におこなった調査を踏襲した同内容の調査をおこなうのは意義あるものと考えられる。ただし、標準化を受けたテストをおこなっておらず、他者による報告がアウトカムになっているという点は、研究の限界点として念頭に置く必要がある。調査では割合の区間推定がおこなわれており、そこから何らかの要因による因果効果を見出すべく統計的因果推論はおこなわれていない。従って、後半にあるような有識者会議(座長)による考察は、不用意なものとして批判的検討は免れないと言える。

───

余談

甲状腺がん検診方面で過剰診断(overdiagnosis)が話題になって久しいが、発達障害等の方面でも過剰診断(overdiagnosis)が議論になる事がある。前者はどちらかと言うと余剰発見(overdetection)が問題となり、後者ではどちらかと言うと過剰定義(overdefinition)が問題になる。ADHD評価スケールやASSQを参考にして質問項目が作成され、それに担任が回答した担任報告アウトカムが収集され結果が発表される事について、より厳しく批判的検討が加えられるのは当然と言える。どのように定義しどのように分類するか、というのは、心理的にも社会的にも医学的にも、様々な観点から重要な事柄であるのだから。

www.bmj.com

過剰診断の説明

いくつかのパターン

用語のみ書く

がん検診では、過剰診断という害が起こる可能性があります。

意味内容のみ書く

がん検診では、症状を起こしたり、それによって死ぬ事の無いものまで見つけてしまう可能性があります。

意味内容と用語を両方書く

がん検診では、症状を起こしたり、それによって死ぬ事の無いものまで見つけてしまう可能性があります。これを過剰診断と言います。

書きたく無い

過剰診断の議論をよく知っている人は、いかにややこしい用語であるかを認識しています。誤陽性や誤診と混同される事であったり、正確な意味の共有そっちのけで、その語を使って罵り合っているのを見たり、などです。

その前提があれば、過剰診断なる語そのものを避ける方針にしたい事もあるでしょう。よく解ります。あるいは、そういう現象が起きていないという信念があって、その現象が起きていると思わせたくないから使いたく無い、のような場合もありましょう。後者には解りやすい下心があります。

説明しない事と、文字列を表記しない事は違う

動機は様々でも、過剰診断なる語を書きたくない、という志向は解ります。色のついた言葉ですからね。

で、結果として、その語を記さない、つまり過剰診断という文字列を書かないという選択をするとします。

けれどそれは、過剰診断について説明しない事、言及しない事とは違います。

いま言っている説明というのは、語が持つ意味合いと、それによる影響等を知らしめる事ですからね。その観点から言えば、過剰診断を説明するとは、症状や死亡の原因にならない疾病を発見するという現象および、それが身体的・心理的・経済的等に与えるインパクトを教える事なのであって、過剰診断なる語そのものを印象づける事ではありません。極端に言えば、意味合いをちゃんと知ってもらえるのなら、語形など何でも良いのです。

色のついた過剰診断の語を使うくらいなら、それを表記せずに、意味のみ説明したほうが、理解が得られる可能性もあります。シールをぺたぺた貼り付けるがごとく、過剰診断過剰診断と敢えて書く必要は、別にありません。もちろんこれは、結果どうなるか、であって、どういうつもりか(どんな下心があるか)とはまた別です。

我々は過剰診断を説明している、と宣言した人の文書なりに、過剰診断なる文字列の表記が無いとしても、その人は過剰診断を説明していない、とすぐにはなりません。症状や死亡の原因にならない疾病を見つける場合がある、と書いてあれば、それはまさに、過剰診断概念の説明なのですから。

過剰診断と書いてあるか、そう言っているか。それ自体は問題ではありません。強く関心を持つ語形や文字列に拘泥すると、そんな当然の事も解らなくなるのかも知れません。

私の場合は、過剰診断の代わりに違う用語を使う方向を選びました。敢えて見聞きし慣れない語を使う事で、意味と同時に考えさせるという手法です。

たとえば、私が、過剰診断と書かずに余剰発見の表現のみ用いた説明文を書くとします。その後に別所にて、私は過剰診断を当該文章で説明した、と主張するとしましょう。その場合、私は過剰診断について説明していない、と言えるでしょうか。

どこまで詳しく

語形を記す事と意味を説明する事は違う、のを踏まえた上で、その現象がどういうインパクトを持つかの説明の細かさや分量をどうするかは、別の議論としてあるでしょう。症状の出ないものまで見つけちゃいますよ、と言っても、ふーん、そう、となるだけかも知れません。確かに用語の説明はおこなっているけれども、それだけでは、病悩期間延伸によるQOL低下や、周りの人含めた心理的経済的負担などは、すぐには思い至らないかも知れません。その意味では、説明不足との批判を受ける可能性はあります。

じゃあ、程度をどう説明するか。QOLが下がると言っても、定量的評価はどうしますか? そもそも検診の有効性評価が乏しいので、QOLYの比較による証拠もほとんど見つかりません。乳がん検診や前立腺がん検診では無いのです。なら、病気に罹っている事による不安や負担を受ける、と定性的な話だけしますか? でもそれだと、リスクを定量的に示すという目的に合致しません。害の程度も判らんのに害があると声高に吹聴するのか、と言われるでしょう。1人が受ける害の可能性と、それが集団でどのくらい生ずるのか、も観点が異なります。

アップした直後の追記:上の説明は、余剰発見以外の害の評価も混じってますね。余剰発見の量的評価と、検診するしないでのQOLの比較は別の話でした。余剰発見によるQOL低下は、それ自体生ずる必要の無かった害です。

韓国の事例でも出しますか? 確かに余剰発見の規模は大きいと推計されています。けれど、それは成人の例です。成人で9割以上が余剰発見との推計があるとして、それをどう小児に一般化しますか。成人は相対的に余命が短いから比較的推計がしやすいという事情があります。それを、より余命の長い小児の話にどう結びつけますか。比較的に推計しやすいと言っても、推計自体がそもそもめちゃくちゃ難しいのです。余剰発見の割合をどう推計しているか知っていますか? そこを説明出来なければ、検診における余剰発見の害の程度をどう知らしめましょうか。

腫瘍が縮小しているとの話を出しますか。しかるにそれは、短期間の観察データを成長モデルに当てはめ、それをシミュレーションした結果をもって主張されるものです。それを、ラテントがんになるまで成長が停滞する現象の生じている強い証拠と看做せるのでしょうか。

いま言えるのは、成人では検診をすると高い割合で余剰発見が起きると推計されている事と、小児で余剰発見の割合がごく低いと考えると成人の例と整合しにくい、という事くらいです(成人での症状発現例を小児時の罹患で説明していかないといけない)。そこから先は無理です。今後も困難でしょう。検診して比較出来ませんからね。有効性が乏しかろうと評価されている検診でRCTなど、もってのほかです。

マイクロシミュレーションをおこないますか? おこなったとして、それで得られた結果を強い証拠として採用して良いでしょうか。まず、それなりのデータ無しにシミュレーションは出来ません。乳がんなどではRCTのデータも使われます。それをどこから持ってきましょうか。※私は、総当たり的に実行したマイクロシミュレーションの結果を補助的あるいは間接的な証拠として検討するのは、極めて重要だと考えます

じゃあ、過剰診断の説明をきちんとする、とはどこまでを言うのか。最低限すべきなのは、その意味合いを教える事でしょう。それはけっこう形式的なものだから、やるのは難しくありません。症状の原因にならない病気を見つける事とか、検診しなければ発見されないような病気を診断する事、と言えば良い。それをすれば、少なくとも説明していないとは言えない。字面に拘る必要が無いのは書いてきた通りです。問題はその先。過剰診断によってどこまでの影響を及ぼし得るか、あるいは及ぼしているのか。それは、いま得られている証拠によって支持されるもので無ければなりません。もしEBM的な観点を維持してものを言いたいなら、です。無視するのも一つの立場でしょうが、科学的と評されるかは別です。

私の現状の認識は、小児への甲状腺がん検診によって生ずる過剰診断の害の量的評価は困難であり、当て推量によって害を喧伝すべきでは無い、というものです。ですが、私は甲状腺がん検診に反対の立場です。それは、過剰診断の程度が大きいからでは無く、検診によって有効性が得られる知見が全く無いから(成人においては、有効性が得られないであろう強い間接的証拠がある)です。用語を使うと、正味の便益(net benefit)の証拠が無いから、です。

他の反対者よりは消極的に見えるかも知れませんし、実際そうなのでしょうが、私がやろうとしているのは証拠に従って考える事ですから、結果的にそうなるのは全く構いません。付け加えると、過剰診断の害にばかり意識が行くと、過剰診断以外の害についての言及が疎かになる、というのもあります。