方向や時間帯のデータの解析

2009.2.14最終修正

 東西南北といった方向や1日の中の時間帯を扱うときには、長さや面積、体積、重さ、個数、回数、二項比率といったデータとはちがった、特別なことが必要になることがある。たとえば、1日の中の時間帯を扱うときには、24時間であらわした時刻をそのまま使うわけにはいかない、0時10分と0時30分のあいだのちがいと、0時10分と23時50分のあいだのちがいは、等しいと考えられるが、24時間であらわした時刻をそのまま使うと、0時10分と23時50分の間のちがいの方がはるかに大きいとしてしまうようなことが起こりかねない。東西南北の方向でも、同じである。

 方向や時間帯のデータはいわば環状になっているので、これを無理やり1次元の直線状のものとするとおかしなことが生じるわけである。

 方向や時間帯のデータのような環状になっているデータは、circularとかdirectionalとか呼ばれ、専用の方法が発達している。circularあるいはdirectionalなデータはいわば2次元である。3次元つまり立体的な方向の場合にはsphericalと呼ばれる。


相関

 方向や時間帯のデータが登場する相関には大きく分けて2つの種類がある。ひとつは2変数の両方とも方向や時間帯のデータの場合であり、circular-circularと呼ばれる。もうひとつは、片方が方向や時間帯のデータでもう片方が通常の変数の場合であり、circular-linearと呼ばれる。通常の変数同士の相関は、この呼び方だとlinear-linearとなる。


平均値

ばらつきの指標

Watsonの検定

通常のデータならMann-WhitneyのU検定に対応していると言われる検定

circularなデータの分布(確率分布)


方向や時間帯のデータの解析を扱っている本

Statistical Analysis of Circular Data

Nicholas I. Fisher
paperback Cambridge University Press (1996) ISBN-13: 978-0521568906
hardcover Cambridge University Press (1993) ISBN-13: 978-0521350181

Directional Statistics (Hardcover)
Kanti V. Mardia & Peter E. Jupp
Wiley (1999)
 ISBN-13: 978-0471953333

Statistical Analysis of Spherical Data
 N. I. Fisher , T. Lewis, B. J. J. Embleton
 Cambridge University Press  (1993)
 ISBN-13 978-0521456999

Topics in Circular Statistics
 S. Rao Jammalamadaka & A. Sengupta
 World Scientific Publishing Company (2001)
ISBN-13 978-9810237783

sphericalなデータの解析を扱っている本

Statistical Analysis of Spherical Data
N. I. Fisher), T. Lewis, & B. J. J. Embleton
 Cambridge University Press ( 1993)
 ISBN-13: 978-0521456999

Categorical and Directional Data, Volume 2, Spatial Data Analysis by Example
G. J. G. Upton, and B. Fingleton

Wiley (1989)
ISBN-13: 978-0471920861

このvolumeには6-10章が入っており、第9章がcircular、第10章がsphericalなデータの解析を扱っている。


ソフトウェア

Rのパッケージ