単一時点(妊娠初期の受診時)での助産師面接+処方記録が中心。面接は「その時点までの使用経験」を聴取する形式で、その後のOTC使用や断続的使用を取りこぼしやすい設計。継続的な再聴取・日誌・薬剤スキャン、あるいはバイオマーカー(臍帯血・胎便・尿)などの客観指標が使われていない。これでは非差別的誤分類→効果推定の希釈が強く起こる条件がそろう
実際の曝露率は7.49%と極端に低い(2,480,797例中185,909)。著者は「“1回でも”使った人(ever use)と“実質的ユーザー(複数日使用)”を区別せよ」と反論するが、曝露の少なさ自体が測定体制の感度不足を示すサインでもある。スウェーデン同時期の別コホートでは母親申告や尿中濃度で使用率が大幅に高い報告がある(例:SELMA、母体報告+尿で曝露評価)。
きょうだい内比較は家族共有の交絡を消せる反面、曝露測定誤差にきわめて弱い。Monte Carlo シミュレーションでは、曝露信頼性が下がり、同胞間で曝露が似ているほど、真の関連があっても「無関連」に見えやすいことが示されている。スウェーデン研究のようにOTC・タイミング・用量の不確かさが大きい状況は、“無関係”という結論を偽陰性にしやすい設計だと言える。
曝露は「有る/無し」や処方ベースの平均日量など粗い指標で、トリメスター別・発熱時の頓用・高用量連用など、神経発達に効きやすい“臨界期×用量”のシグナルを潰す。用量–反応が見えないのは、測定側の解像度不足の可能性を排除できない。
臍帯血・胎便などの客観曝露指標を用いた研究では、ADHD/ASDとの正の関連や用量反応が繰り返し観察されている(Boston Birth Cohort 等)。客観指標が陽性、自己申告+処方の粗測定が陰性という“ミスマッチ”は、後者の曝露測定誤差をまず疑うのが王道。
著者はレターで「“1回でも”使用と“複数日使用”を分けるべき」「NINFEA では1回でも:31%/5日以上:5.5%」と主張。しかし、だからこそ“5日以上の確度ある使用”を把握できる設計(反復聴取・電子記録の統合・バイオマーカー)が必要で、単一時点聴取+処方記録では高用量・臨界期曝露の抽出力が不足している点は覆らない。
「測定誤差を想定したシミュレーションでも無関連は説明困難」との主張は、どの程度の誤分類を仮定したかに依存。7.5%という低曝露率とOTC断続使用の取りこぼし構造を考えると、現実の誤分類はシミュレーション想定を超える可能性がある。**外部妥当化(他研究の曝露率・バイオマーカー)**を踏まえた再検証が必要。
スウェーデン研究は規模と統計手法の洗練という点では重要だが、曝露測定の解像度不足、同胞比較の測定誤差脆弱性、時代トレンド混入、一般化可能性の乏しさという構造的限界が重なり、小~中程度の真の有害効果を“見逃す方向”にバイアスしている可能性が高い。
よって、「因果なし」の決定打として持ち出すのは不適切。少なくとも客観曝露(臍帯血・胎便・反復尿)を備え、臨界期×用量を追える設計で再評価するまでは、“安全宣言”に使えるエビデンスとは言い難い。
Ahlqvist VH, et al. JAMA 2024:スウェーデン全国コホート本論文(同胞比較では無関連)。
Ahlqvist VH, et al. JAMA 返信レター:曝露率と“ユーザー定義”の主張(NINFEA例:5日以上5.5%)。
Gustavson K, et al. 2024:同胞比較×測定誤差のバイアスを示すシミュレーション研究。
SELMA ほかスウェーデン系コホート:母体報告+尿での曝露評価(ever useの高さ、言語発達との関連)。
Icahn School of Medicine at Mount Sinai