正規線形モデル

線形回帰の説明変数は何個まで入れられるのか

はじめに 線形回帰(重回帰)やロジスティック回帰、Cox比例ハザードモデルなどを使う上で突きあたる実用上の問題の一つに、「説明変数の数を何個まで入れていいのか?」というものがあります。 結果に影響しそうな因子は色々と考えつくことが多いため、でき…

線形混合モデルにおけるKenward-Roger法:(1)概要

【2021/5/10 追記】 Kenward-Roger法による分散推定量の数式について、より正確な記載に改めました。 はじめに データどうしの相関を考慮したモデルである混合モデルは、反復測定データの解析などで有効であることが広く知られています。 特に、目的変数の分…

反復測定データのモデリング:(3)ランダム係数モデルについて少し詳しく

はじめに 前回(反復測定データのモデリング:(2)混合モデル)は「混合モデル」の概要と、モデルの切片(目的変数に関する各個人の平均的な水準を表す)だけにランダム効果を設定する「ランダム効果モデル」についてを主に述べた。 今回は、前回説明を先送り…

反復測定データのモデリング:(2)混合モデル

はじめに 前回は反復測定データの特徴である、同じ個人や集団から得られたデータの相関を考慮したモデリングを行うための一つの方法として、Covariance pattern modelを紹介した。Covariance pattern modelは、全ての目的変数をまとめて多変量正規分布に従う…

反復測定データのモデリング:(1)Covariance pattern model

はじめに 重回帰分析や一般化線形モデルといった線形モデルでは通常、異なる目的変数どうしは独立であることを仮定している。例えば、B高校の2年生の期末テストの得点を目的変数としたい場合を考えてみると、各学生の得点どうしは独立である*1と仮定してもだ…

交互作用を表現する線形モデルをRで実施する

はじめに 前回の記事で交互作用の概念について説明したが、その続きとして、シミュレーションデータを使ってRでの実行例を見ていきたいと思う。 mstour.hatenablog.comなお今回は2値のカテゴリー変数どうしの交互作用だけを扱うことにする。 問題設定は次の…

線形モデルにおける交互作用

はじめに 前回の「ダミー変数」についての記事の最後に、連続型とカテゴリー型の説明変数が混在した線形モデルが登場した。 mstour.hatenablog.com このようなモデルを模式的に図解すると、縦軸に目的変数の値(点数)、横軸に連続型変数(学習時間)の値が置…

線形モデルにおけるダミー変数

はじめに 前回紹介した「重回帰分析」は、統計モデルによって表現したい変数*1が正規分布に従うものと仮定した上で*2、その平均(期待値)を複数の要因(説明変数)によって説明する方法である。 mstour.hatenablog.com 前回見たように、重回帰分析モデルは…

重回帰分析

はじめに 以前、1個の説明変数を使って関心ある変数を表現する単回帰モデルについて、基本的な概念と推定方法を説明した。 単回帰分析(1)大雑把な説明 - 統計学入門一歩先へ 単回帰分析(2)モデルの定式化と最小二乗法 - 統計学入門一歩先へ 単回帰分析(3)最…

単回帰分析(3)最尤法による推定

はじめに 前回は、単回帰分析モデルをデータに適合させるために、最適なパラメータを最小二乗法を用いて推定する方法を紹介した。今回は、最尤法(Maximum likelihood method)を用いた推定の話をしたいと思う。 前回少し述べたように、単回帰モデルの数式の中…

単回帰分析(2)モデルの定式化と最小二乗法

はじめに 前回は単回帰分析の大まかなイメージを紹介した。今回は数学的にもう少し整理したいと思う。 最初に言葉でざっくりとまとめると、説明変数で目的変数を表現する単回帰分析とは、 目的変数は正規分布に従うと仮定し、 その期待値を推定する という方…

単回帰分析(1)大雑把な説明

はじめに いわゆる「回帰分析」「回帰モデル」と呼ばれる統計方法のうち、最もシンプルな形式で多くの人に知られていると思われる「単回帰分析(Simple regression)」の話をしていこうと思う。 単回帰分析は、平面上のデータ点が散らばっているところへちょう…

一元配置乱塊法

はじめに 以前、1要因実験データの解析方法である一元配置分散分析を紹介したが、説明を単純にするために局所管理(ブロック化)を行わない完全無作為化実験の場合を考えた。 mstour.hatenablog.com 今回は、ブロック化を考慮した実験である乱塊法(Randomize…

一元配置分散分析

分散分析(Analysis of variance; ANOVA)はさまざまな統計手法の中でもよく知られた方法であるが、最初のうちはなかなかとっつきづらい分野であるように思う。今回は最もシンプルな状況である一元配置(関心のある因子が1つだけの場合のこと)の分散分析の方…

共分散分析と前後差のt検定

はじめに 医学や心理学などでは、ある介入行為の効果を評価するために、ランダム化比較試験によって介入群と対照群とのアウトカム(血圧などの何らかの測定値だったり、質問票の得点など)を比較することがよく行われる。しかし、ランダム化を行ったとしても…