研究成果

なぜ世界は「べき則」であらわされるのか -ビッグデータの新しい統計法則の発見-


2018年04月02日


     梅野健 情報学研究科教授、新谷健 同修士課程学生(現・フォルシア株式会社社員)は、株価や為替変動といった金融市場の価格変動分布、地震が起こる間隔などの確率統計分布、そしてインターネットのトラフィック等の世界中の様々なビッグデータに現れる「べき則」の普遍性を説明する、新しい統計法則を発見しました。この統計法則は、統計学の基本法則である中心極限定理を一般化した一般化中心極限定理を更に拡張したもので、「超一般化中心極限定理」と呼ぶことのできる画期的なものです。データ上に普遍的に現れる本法則によって、世界の様々な現象の統計モデルが構築できると期待されます。

     本研究成果は、2018年4月2日午前10時に日本物理学会の国際学術誌「Journal of the Physical Society of Japan」の速報版にオンライン公開されました。

    研究者からのコメント

    左から、梅野教授、新谷修士課程学生

     かつての偉大な研究者の発見である中心極限定理や一般化中心極限定理に触れた時、とても美しく素晴らしい内容だと思いましたが、一方で、現実のデータに適応するには少々数学的な制約が厳しいと感じたのがこの研究の始まりでした。ビッグデータの時代と言われる昨今、べき則に従うデータは数多く観測されており、この研究が、そういった世の中に遍在するべき則を分析するための一助になればと思っています。

    概要

     世界はべき則で溢れています。金融市場の株価変動や為替変動といった価格変動分布、地震が起こる間隔などの確率統計分布、そしてインターネットのトラフィックなど世界中の様々なビッグデータが、べき則であらわされることがデータ解析によりわかってきました。ただ、なぜ、べき則が、異なる現象に普遍的に現れるのかといった基本的問題が、未解決なまま残されていました。最近では金融取引の自動化が進み、株価や為替変動の高頻度化に伴ってデータ量がますます多くなり、データ上にべき則が現れるというこの傾向が、よりはっきりとしてきました。従来、統計学で用いられるデータ解析では、データの数N を無限にとった時に現れる基本的な統計則として、中心極限定理や 一般化中心極限定理が用いられてきました。しかし、現代のビッグデータでは、個々に異なるべき則分布の和においても、ある基本形のべき則(レビの安定分布)になるという現象が見られます。これは従来の極限定理では捉えきれないものですが、そうした現象が現れる理由は解明されていませんでした。

     本研究では、現実のデータを反映した、従来の統計則である極限定理では捉えることができない、異なるべき分布を個々に持つ独立な確率変数の和という統計モデルを定式化しました。その上で、データの数Nを無限にする極限において、レビの安定分布に収束するという極限定理を導出しました。

     この極限定理は、統計学の基本法則である中心極限定理をべき則に一般化した一般化中心極限定理を、さらに異なるべき則の和の極限に拡張したもので、「超一般化中心極限定理」と呼ぶことができます。より一般化された状況でも成立する極限定理としての統計学的な意義があるとともに、現実世界の至るところに現れるべき則の普遍性を示すビッグデータの特徴を正確に記述する基本統計則としての意義も持つと考えられます。

    詳しい研究内容について

    書誌情報

    【DOI】https://doi.org/10.7566/JPSJ.87.043003

    Masaru Shintani and Ken Umeno (2018). Super Generalized Central Limit Theorem — Limit Distributions for Sums of Non-identical Random Variables with Power Laws —. Journal of the Physical Society of Japan, 87(4), 043003.
     


    なぜ世界は「べき則」であらわされるのか -ビッグデータの新しい統計法則の発見-
    現在の画像 JPEG image — 91 KB

    No