survey weight (サーベイウェイト)
標本調査において、ある個体がその調査に含まれる確率(包含確率)の逆数に比例した量で、調査のバイアスを補正する際に役立つ。直感的には、その標本が母集団のいくつの個体を代表しているかを表す。 ⇨ 詳しい解説
サブサンプリング
リサンプリング法の一つ。データの一部を用いた計算を繰り返すことにより、様々な統計量の標本分布の近似する方法。
時空間データ
時系列データ・空間データの両方の性質をもつデータのこと。
時系列データ
時間の経過とともに観測されるデータのこと。
状態空間モデル
マルコフ連鎖に従う観測できない潜在変数と、その潜在変数に依存して観測される観測値2つの変数からなる統計モデル。特に時系列データの分析で用いられることが多い。
情報量規準
統計モデルの良さを測定する規準のこと。AIC、BIC、DIC等が有名である。複数の統計モデルが与えられている時、情報量規準の値が一番小さいものを最も良いモデルとして採用することが考えられる。 ⇨ 詳しい解説
深層学習
機械学習の手法の一つで、特にディープニューラルネットワークを利用したデータ分析手法のこと。
推定量
観測値(データ)から、統計モデルのパラメーターを定める関数の総称。
漸近理論
サンプルサイズを無限に大きくしていった時の分布や推定量の振る舞いに関する理論のこと。中心極限定理や大数の法則等を主に用いて解析をする。
線形混合モデル
固定効果と変量効果の両方の効果の入った線形モデル。特に変量効果は、パネルデータ(経時データ)や地域データなど、データに何らかのクラスター構造が入っている場合、クラスターごとの効果として入れることができる。⇨ 詳しい解説
相関係数
二つの確率変数の線形関係の強さ・弱さを測る尺度の一つ。分子に二つの確率変数の共分散、分母にそれぞれの標準偏差で定義され、-1以上1以下の値を取る。
操作変数
説明変数とは相関するが,誤差項とは無相関な変数のこと。 ⇨ 詳しい解説