Simpson's Paradox (シンプソンのパラドックス)は統計学の分野で古くから知られているパラドックスです。単純な例で仕組みを説明できるものですが、現実のデータを調べる中で複雑な相関を分析する場合にこれを避けるのはそれほど簡単ではなさそうです。
実際、最近の記事でも問題となった実例が取り上げられています: When Combined Data Reveal the Flaw of Averages
対策となる提案がまとめられている論文として以下のものがありました:
参考