しばらくお休みします

といっても、もう長いこと書いていないのですが・・・ 新しい記事を書く時間の余裕・エネルギーの余裕がなくなってしまったので、当分の間お休みします。ありがたいことに、複数の方からこのブログの記事の内容を参考にしたとおっしゃっていただいて、本当に…

傾向スコアを用いたOverlap weighting

はじめに 傾向スコアを用いた解析の代表的な方法の一つとして、個人ごとの傾向スコアの推定値*1による重み付け解析があります。重み付け解析としては、傾向スコア推定値の逆数で重み付けを行う「逆確率重み付け法(Inverse probability of treatment weightin…

傾向スコア法による重み付け解析を行うためのRパッケージいくつか

はじめに 前回の記事では、傾向スコア(Propensity score)による逆確率重み付け法(Inverse probability of treatment weighting; IPTW)をRで行うためにIPWパッケージを用いました。実は、傾向スコア法による解析を行うためのRのパッケージはたくさんあり、僕…

傾向スコア法はサンプルサイズが小さくても大丈夫なのか:IPTWの例

【最終更新 2022/5/13】 シミュレーションでのバイアス評価で、推定したい真値を周辺オッズ比とし、モンテカルロ法で算出するようにしました。 条件を変えたシミュレーションをfurrrパッケージで行うようにコード例を修正しました。 その他、細かな表現を改…

線形回帰の説明変数は何個まで入れられるのか

はじめに 線形回帰(重回帰)やロジスティック回帰、Cox比例ハザードモデルなどを使う上で突きあたる実用上の問題の一つに、「説明変数の数を何個まで入れていいのか?」というものがあります。 結果に影響しそうな因子は色々と考えつくことが多いため、でき…

カッパ係数とその難点

はじめに 心理的な特性の評価や、疾患の重症度の判定など、僕たちの身の回りには何らかの評価を行うためのさまざまな検査方法があります。 例えば学校や企業の採用試験などで適正検査というものを受けさせられた経験もあるかと思います。 これらの検査は決し…

ギブス・サンプリングの実装練習:(1-3)分散成分の事前分布を半コーシー分布にする

はじめに これまで2回にわたってランダム効果モデルのギブス・サンプリングを説明してきました。またランダム効果の分散について、事前分布として逆ガンマ分布や一様分布を設定した場合のベイズ推定結果をシミュレーションにより確認しました。ところが、分…

ギブス・サンプリングの実装練習:(1-2)分散成分の事前分布を一様分布にする

はじめに 今回は、以前の記事「ギブス・サンプリングの実装練習:(1)ランダム効果モデル」の続編です。 mstour.hatenablog.comこの記事で紹介したギブス・サンプリングでは、ランダム効果の分散の事後分布の推定がどうもうまくいっていないようでした。 理由…

ギブス・サンプリングの実装練習:(1)ランダム効果モデル

2021/11/14 赤字部分を追記 はじめに このブログではあまりベイズ統計の話題は書いてこなかったのですが、やはりこれからの時代それではいかんということで、こんなことをやってみることにします。ベイズモデルにおいてパラメータの事後分布を推定する際には…

欠測データ分析シミュレーションのための実戦練習:(2)反復測定データの欠測(最終時点のみ)

はじめに 今回は、以前の記事でご紹介したシミュレーションプログラム作成練習の続きをやっていきたいと思います。 mstour.hatenablog.com題材は、第1回と同様こちらの論文で実施されたシミュレーション研究です。 www.ncbi.nlm.nih.gov前回は1つのアウトカ…

多重比較の前に分散分析をやらないといけないの?

はじめに また今回もちょっとした覚え書き程度の内容ですが・・・時々ご相談を受けたりするテーマなので、少し整理しておきたいと思います。連続データに関して、ある要因の水準が異なる複数グループ間の比較を行うようなとき*1、第一種の過誤確率*2をコント…

欠測データ分析シミュレーションのための実戦練習:(1)1変数の欠測

はじめに 過去2回、Rのmiceパッケージを用いた欠測データの作成方法を紹介してきました。 (過去の記事は以下です。) mstour.hatenablog.com mstour.hatenablog.com今回はもう少し踏み込んで、欠測データ分析に関する実際のシミュレーション研究の再現をし…

ゼロ値を多く含むデータの統計モデル:連続データの場合

はじめに 以前、ゼロの多い離散データの統計モデルの話を書きましたが、今回はその続きとして、連続型データの場合のモデルを紹介していきたいと思います。 mstour.hatenablog.com離散データの場合には飲酒回数を例として考えました。ゼロの多い連続データの…

miceパッケージampute関数による欠測データの作成:(2)実行例

はじめに 今回は、以前の記事で概要を紹介したampute関数を用いて実際に欠測データを作成してみたいと思います。 amputeの概要については、よろしければ以前の記事もご覧ください。 mstour.hatenablog.com 使用するデータセット まずは今回使用するパッケー…

ゼロ値を多く含むデータの統計モデル:離散データの場合

はじめに 今回は少し趣向を変えて、現在僕が関心を持っている(そこまでメジャーではないと思われる方面の)統計モデリングの話題を書いていこうと思います。 ほとんど覚え書きのような内容なので、まあ、こんなんもあるのか、という程度にみてもらえればと…

miceパッケージampute関数による欠測データの作成:(1)原理

はじめに 前回、混合モデルの説明に使用した欠測データの作成のため、Rのパッケージの一つ、miceパッケージ(参考資料1)に実装されている関数の「ampute」(参考資料2)を使用しました。今回は、ampute関数の原理と使い方をもう少し詳しく見ていきたいと思…

線形混合モデルにおけるKenward-Roger法:(2)Rによる計算例

最終更新:2023/9/10 「実施」セクションの「N=40の欠測なしデータの推定結果」とあるのは「欠測ありデータの推定結果」の間違いでした。修正しました。 はじめに 前回の記事では、線形混合モデルの固定効果に関する推論で使用されるKenward-Roger法の概要を…

線形混合モデルにおけるKenward-Roger法:(1)概要

【2021/5/10 追記】 Kenward-Roger法による分散推定量の数式について、より正確な記載に改めました。 はじめに データどうしの相関を考慮したモデルである混合モデルは、反復測定データの解析などで有効であることが広く知られています。 特に、目的変数の分…

有意水準と検出力について考えてみよう

はじめに 前回の記事では、ランダム化比較試験について架空の事例をもとに考えていきました。その中で、両側5%の有意水準(Significance level)で検定を行った場合、「本当はグループ間に差がないのに間違って差があると判定する確率は5%になる」という話をし…

シミュレーションで理解するランダム化比較試験:(2)処置の効果を正しく推定するために

はじめに 前回は、異なる処置をランダムに割り当てれば、処置のグループ間で対象者の属性が偏らずにバランスするというお話をしました。 mstour.hatenablog.com 具体的には、内容の異なるクーポンAとクーポンBのどちらがより売り上げの増加につながるかを検…

シミュレーションで理解するランダム化比較試験:(1)ランダム化の効果を確認する

はじめに 異なる処置の間に効果の違いがあるかどうかを評価するための方法として、「ランダム化(Randomization)」と呼ばれる方法が広く知られています。ランダム化は、処置の効果を歪める*1さまざまな要因の影響を取り除くことができ、処置と結果との因果関…

反復測定データのモデリング:(5)一般化線形混合モデル

はじめに 前回は、正規分布に従うと想定できないような反復測定データの分析を行うための有力な方法である一般化推定方程式(GEE)を紹介しました。この方法は一般化線形モデル(GLM)と同様のモデリングを行うのですが、目的変数に特定の確率分布を想定せずにパ…

反復測定データのモデリング:(4)一般化推定方程式

はじめに 当ブログではこれまで反復測定データの解析方法のいくつかを紹介してきたが、今のところ目的変数の確率分布に正規分布を想定するものにとどまっていた。 当然、現実の場面ではそうではないデータに対峙することも多く、例えば二値や整数値で記録さ…

欠測データ解析としての混合モデル

はじめに 反復測定データの解析方法として、これまでCovariance pattern modelと混合モデルを紹介してきた。いずれも、目的変数の確率分布として多変量正規分布を考え、モデルのパラメータを最尤法(Maximum likelihood method)によって推定する。最尤法を用…

反復測定データのモデリング:(3)ランダム係数モデルについて少し詳しく

はじめに 前回(反復測定データのモデリング:(2)混合モデル)は「混合モデル」の概要と、モデルの切片(目的変数に関する各個人の平均的な水準を表す)だけにランダム効果を設定する「ランダム効果モデル」についてを主に述べた。 今回は、前回説明を先送り…

反復測定データのモデリング:(2)混合モデル

はじめに 前回は反復測定データの特徴である、同じ個人や集団から得られたデータの相関を考慮したモデリングを行うための一つの方法として、Covariance pattern modelを紹介した。Covariance pattern modelは、全ての目的変数をまとめて多変量正規分布に従う…

反復測定データのモデリング:(1)Covariance pattern model

はじめに 重回帰分析や一般化線形モデルといった線形モデルでは通常、異なる目的変数どうしは独立であることを仮定している。例えば、B高校の2年生の期末テストの得点を目的変数としたい場合を考えてみると、各学生の得点どうしは独立である*1と仮定してもだ…

一般化線形モデルの一般論

はじめに これまで、単回帰分析や重回帰分析といった「目的変数が正規分布に従う」と想定する線形モデルについて説明してきた。 しかしながら、関心のあるデータはいつも正規分布だけで表現できるわけではない。ある病気になるリスクを高くしたり低くしたり…

交互作用を表現する線形モデルをRで実施する

はじめに 前回の記事で交互作用の概念について説明したが、その続きとして、シミュレーションデータを使ってRでの実行例を見ていきたいと思う。 mstour.hatenablog.comなお今回は2値のカテゴリー変数どうしの交互作用だけを扱うことにする。 問題設定は次の…

線形モデルにおける交互作用

はじめに 前回の「ダミー変数」についての記事の最後に、連続型とカテゴリー型の説明変数が混在した線形モデルが登場した。 mstour.hatenablog.com このようなモデルを模式的に図解すると、縦軸に目的変数の値(点数)、横軸に連続型変数(学習時間)の値が置…