一般化線形モデル

反復測定データのモデリング:(5)一般化線形混合モデル

はじめに 前回は、正規分布に従うと想定できないような反復測定データの分析を行うための有力な方法である一般化推定方程式(GEE)を紹介しました。この方法は一般化線形モデル(GLM)と同様のモデリングを行うのですが、目的変数に特定の確率分布を想定せずにパ…

反復測定データのモデリング:(4)一般化推定方程式

はじめに 当ブログではこれまで反復測定データの解析方法のいくつかを紹介してきたが、今のところ目的変数の確率分布に正規分布を想定するものにとどまっていた。 当然、現実の場面ではそうではないデータに対峙することも多く、例えば二値や整数値で記録さ…

一般化線形モデルの一般論

はじめに これまで、単回帰分析や重回帰分析といった「目的変数が正規分布に従う」と想定する線形モデルについて説明してきた。 しかしながら、関心のあるデータはいつも正規分布だけで表現できるわけではない。ある病気になるリスクを高くしたり低くしたり…

交互作用を表現する線形モデルをRで実施する

はじめに 前回の記事で交互作用の概念について説明したが、その続きとして、シミュレーションデータを使ってRでの実行例を見ていきたいと思う。 mstour.hatenablog.comなお今回は2値のカテゴリー変数どうしの交互作用だけを扱うことにする。 問題設定は次の…

線形モデルにおける交互作用

はじめに 前回の「ダミー変数」についての記事の最後に、連続型とカテゴリー型の説明変数が混在した線形モデルが登場した。 mstour.hatenablog.com このようなモデルを模式的に図解すると、縦軸に目的変数の値(点数)、横軸に連続型変数(学習時間)の値が置…

線形モデルにおけるダミー変数

はじめに 前回紹介した「重回帰分析」は、統計モデルによって表現したい変数*1が正規分布に従うものと仮定した上で*2、その平均(期待値)を複数の要因(説明変数)によって説明する方法である。 mstour.hatenablog.com 前回見たように、重回帰分析モデルは…

重回帰分析

はじめに 以前、1個の説明変数を使って関心ある変数を表現する単回帰モデルについて、基本的な概念と推定方法を説明した。 単回帰分析(1)大雑把な説明 - 統計学入門一歩先へ 単回帰分析(2)モデルの定式化と最小二乗法 - 統計学入門一歩先へ 単回帰分析(3)最…

単回帰分析(3)最尤法による推定

はじめに 前回は、単回帰分析モデルをデータに適合させるために、最適なパラメータを最小二乗法を用いて推定する方法を紹介した。今回は、最尤法(Maximum likelihood method)を用いた推定の話をしたいと思う。 前回少し述べたように、単回帰モデルの数式の中…

単回帰分析(2)モデルの定式化と最小二乗法

はじめに 前回は単回帰分析の大まかなイメージを紹介した。今回は数学的にもう少し整理したいと思う。 最初に言葉でざっくりとまとめると、説明変数で目的変数を表現する単回帰分析とは、 目的変数は正規分布に従うと仮定し、 その期待値を推定する という方…

単回帰分析(1)大雑把な説明

はじめに いわゆる「回帰分析」「回帰モデル」と呼ばれる統計方法のうち、最もシンプルな形式で多くの人に知られていると思われる「単回帰分析(Simple regression)」の話をしていこうと思う。 単回帰分析は、平面上のデータ点が散らばっているところへちょう…

統計学と機械学習に共通する方法:(1)ロジスティック回帰

はじめに 統計学と機械学習、どちらも現代のデータ分析方法としてなくてはならないものだ。そこには共通して使われている手法もたくさんある。一方で、微妙な定義の違い、考え方の違いもあるように感じる。 今回は「ロジスティック回帰」を統計学と機械学習…

最尤推定量の検定

はじめに 線形回帰分析をはじめとする一般化線形モデルにおいて、説明変数が関心ある結果(統計モデルにおける、で表される側。以降では「目的変数」とする)に統計的に有意な影響を与えているかを判断する目安として、いくつかの検定方式がある。今回は比較…

Poisson回帰

はじめに 回帰分析というと、表現したい事象の確率分布(誤差の分布、という言い方をする場合もある)として正規分布を考えるいわゆる線形回帰がよく用いられるが、その他の様々な確率分布にも対応できるように拡張された一般化線形モデルもよく知られている…