べき則が現れる世界を紐解く!新しい統計手法「超一般化中心極限定理」とは?

みなさんは、日常生活のどのような瞬間で「確率」というものを意識しますか?

バラバラに行動している私たちの活動が作り出す社会現象や、突然起こる地震や火山の噴火などの自然現象。これらの現象は一見するとランダムに起こっているように感じますよね。しかし、こうした現象には一定の法則性があり、確率を使ってそれらの出来事を数量化することができるのです!

経済学では、都市の大きさの分布や所得や資産の分布、更に株価や為替の変動といった金融市場の価格変動分布などが「べき則」で表現されることがあります。べき則とは何かについては後ほど説明しますが、地震の規模と発生頻度の確率統計分布、インターネットで送受信されるデータの情報量等の世界中の様々なビッグデータに、このべき則は現れます。

べき則が異なる現象に普遍的に現れる理由は未解決のままでした。さらに現代のビッグデータでは、個々に異なる「べき則分布の和」が、ある基本形のべき則(レビの安定分布)になるという現象が見られます。これは従来の中心極限定理や一般化中心極限定理では説明しきれないものでした。

そんななか、2018年4月2日、京都大学において「超一般化中心極限定理」と呼べる新しい統計法則の発見が発表されました。これは、さまざまな現象にあらわれるべき則の普遍性を説明するのに役立つであろう、とても興味深い発見です。

出典[1]

研究成果は日本物理学会の国際学術誌「Journal of the Physical Society of Japan」の速報版にオンライン公開されています。
Super Generalized Central Limit Theorem -Limit Distributions for Sums of Non-identical Random Variables with Power Laws - 著者:Masaru Shintani and Ken Umeno
https://journals.jps.jp/doi/10.7566/JPSJ.87.043003

 

では、その「超一般化中心極限定理」とは一体どのような定理なのでしょうか?

まずは基本である中心極限定理の説明から始めます。統計学の基本法則の一つである中心極限定理は、確率変数の平均の挙動に関する確率法則を指します。

確率変数がたがいに独立で、平均μ、分散σ2の同じ分布に従うとき、この確率変数の分布は、nが大きければ正規分布で近似できる

Xがある特定の数値xをとる確率が定まっているとき、Xを確率変数といいます。たとえば、サイコロを複数回投げるシチュエーションを考えると、1回投げる毎に、出る目は1から6のいずれかの整数値になります。このとき「確率変数X」という表現を使えば、「サイコロの目が1になる確率」は「X=1である確率」と言い換えることがができます。


一般化中心極限定理とは、この中心極限定理をさらにべき則に一般化したものです。

 <中心極限定理では、独立で同一の確率分布にしたがう確率変数の和(※)は、変数の数が多くなるにしたがい正規分布に収束します。

対して一般化中心極限定理では、べき則に従う個々の確率変数(独立で同一の確率分布にしたがう確率変数で、その確率変数は|x|−α−1 ( ただし、0 < α < 2)のべき乗で減衰する分布に従う)の和は正規分布には収束せず特性指数αレヴィの安定分布に収束します

※「独立な確率変数の和の分布を考える」というのは、たとえば、「サイコロを複数個投げて、出た目の和がどんな分布に従うかを考える」ようなことです。

独立で同一の確率分布とは、それぞれの確率変数が他の確率変数と同じ確率分布を持ち、かつ、それぞれ互いに独立している状況を指します。

べき則

確率分布が、正規分布(ガウス分布)の様に、変動幅に対して指数関数的にゼロに減衰するのではなく、 変動幅に対してべき的にゆっくりゼロに減衰すること。確率密度関数を数式で表現すると、以下のようになります。ここでαが、べき指数となります
出典[1]

レヴィ分布:変動幅に対してべき的にゆっくりゼロに減衰する

正規分布:変動幅に対して指数関数的にゼロに減衰

今回の発見では、確率分布がべき則に従う確率変数の和の極限に関する定理において、それぞれの確率分布が同一のべき則に限られていたのが拡張され、個々に異なるべき則の和も同様にレビ分布に収束することが示されました。

「超一般化中心極限定理」は、より一般化された状況でも成立する極限定理として、統計学的な意義があります。

自然災害のようなまれにしか起こらない極端な現象のリスク解析においても、ビッグデータをどう分析し評価するかという課題に対し、「超一般化中心極限定理」は、べき則に従うさまざまなビッグデータの特徴を正確に記述する基本統計則として普及していくと考えられます。

また、金融市場の株価変動や為替変動、地震の間隔といった実データに基づくデータ解析に適用することで、まだモデル化されていない様々な現象の統計モデル化が進むことが期待されます。

 

日々発生する膨大なデータの中で頻繁に現れる「べき則」。

多くの人は普段はあまり目にする機会がない統計手法ですが、データ解析があらゆるリサーチの主要な手法となりつつある今、私たちの生活やこれからの未来に大きく影響を与えていく研究と言えるでしょう。今後の発展に期待がかかります。

[1]なぜ世界は「べき則」であらわされるのか―ビッグデータの新しい統計法則の発見www.kyoto-u.ac.jp/ja/research/research_results/2017/documents/180402_1/01.pdf

 

関連キーワード
  • べき則が現れる世界を紐解く!新しい統計手法「超一般化中心極限定理」とは?
おすすめの記事