カテゴリカルデータ

カッパ係数とその難点

はじめに 心理的な特性の評価や、疾患の重症度の判定など、僕たちの身の回りには何らかの評価を行うためのさまざまな検査方法があります。 例えば学校や企業の採用試験などで適正検査というものを受けさせられた経験もあるかと思います。 これらの検査は決し…

ゼロ値を多く含むデータの統計モデル:離散データの場合

はじめに 今回は少し趣向を変えて、現在僕が関心を持っている(そこまでメジャーではないと思われる方面の)統計モデリングの話題を書いていこうと思います。 ほとんど覚え書きのような内容なので、まあ、こんなんもあるのか、という程度にみてもらえればと…

反復測定データのモデリング:(5)一般化線形混合モデル

はじめに 前回は、正規分布に従うと想定できないような反復測定データの分析を行うための有力な方法である一般化推定方程式(GEE)を紹介しました。この方法は一般化線形モデル(GLM)と同様のモデリングを行うのですが、目的変数に特定の確率分布を想定せずにパ…

反復測定データのモデリング:(4)一般化推定方程式

はじめに 当ブログではこれまで反復測定データの解析方法のいくつかを紹介してきたが、今のところ目的変数の確率分布に正規分布を想定するものにとどまっていた。 当然、現実の場面ではそうではないデータに対峙することも多く、例えば二値や整数値で記録さ…

Mantel-Haenszel検定をRで実施する

はじめに 今回は、以前紹介したMantel-Haenszel検定(MH検定)をRで実施する方法を整理していく。 mstour.hatenablog.com前も書いたようにCochran-Mantel-Haenszel(CMH検定)と呼ばれることが多いが、Cochranの検定とMantel-Haenszelの検定とは周辺和の固定…

2値データの解析:(5)リスクの指標

治療の成功や疾患の発現など、関心のあるイベントが起こる確率を「リスク」と表現することがある。試験治療を行うグループと標準治療を行うグループとの間で治療の成功確率を比較するなど、2つのグループ間でのリスクの違いを調べるような場合、結果の要約方…

2値データの解析:(4)Mantel-Haenszel検定

はじめに 以前、Mantel-Haenszel検定についてたまたま関連する論文を読んでいたので記事を書いた。 mstour.hatenablog.com 当時ははっきり言って取り留めなくつらつらと書いただけなので、改めてきちんと説明していこうと思う。 なおこの記事でも触れたよう…

統計学と機械学習に共通する方法:(1)ロジスティック回帰

はじめに 統計学と機械学習、どちらも現代のデータ分析方法としてなくてはならないものだ。そこには共通して使われている手法もたくさんある。一方で、微妙な定義の違い、考え方の違いもあるように感じる。 今回は「ロジスティック回帰」を統計学と機械学習…

カイ二乗検定、Fisherの正確検定をRで実施する

はじめに 今回は、以前紹介した(Pearsonの)カイ二乗検定とFisherの正確検定をRで実施してみることにする。 mstour.hatenablog.com mstour.hatenablog.com 実施例として、分割表の検定について検討したPrescott(2019)[1]に掲載の例(原論文はHeschl et al.(…

ケースコントロール研究とオッズ比

はじめに 今回は「観察研究」(研究を実施する側が、実験条件をコントロールする行為、例えば治療法をランダムに割り当てるなどを行わない研究方法。ある集団の追跡調査を行ったり、過去の病歴を調べたり)における代表的な研究方法の1つである「ケースコン…

感度・特異度の計算や比較をRで実施する

はじめに 今回は、以前書いた感度・特異度に関する記事のRでの実施例を紹介する。 mstour.hatenablog.com 例題として、Alonzo et al.(2002)[1]で引用されている前立腺がんの早期発見に用いる診断法を比較した研究結果(Smith et al.(1997)[2])RACIAL DIFFEREN…

2値データの解析:(3)割合の信頼区間(1標本)

はじめに 今回は、関心ある事象の発生する割合(例えば疾患の発生割合とか、例えば内閣支持率とか)の信頼区間について話してみたい。1標本割合の信頼区間でよく使われる(よく使われるのは僕の身近なところでの話かもしれないが)、Clopper-Pearsonの信頼区…

Poisson回帰

はじめに 回帰分析というと、表現したい事象の確率分布(誤差の分布、という言い方をする場合もある)として正規分布を考えるいわゆる線形回帰がよく用いられるが、その他の様々な確率分布にも対応できるように拡張された一般化線形モデルもよく知られている…

2値データの解析:(2)Fisherの正確検定

はじめに 前回は、対応関係のない分割表の基本的な解析方法であるカイ二乗検定を紹介した。今回は、同様な形式のデータに対して用いられるもう一つの方法、Fisherの正確検定について述べる。 Fisherの正確検定(以下、Fisher検定とする)とは、カイ二乗検定…

Cochran-Mantel-Haenszel検定とはいったい何なのか

2020/8/3 追記・細かな修正あり。 「Cochran-Mantel-Haenszel検定」(以下、CMH検定)とよばれる一連の方法について、いまいちよくわかっていない。 何がよくわからないかというと、僕は「Cochranの検定」と「Mantel-Haenszelの検定」は同じように層別化した…

2値データの解析:(1)カイ2乗検定

今回から、何回かに分けたシリーズを作ってみたいと思います。 このシリーズでは2値データの解析と題して、基本的に用いられる統計手法の紹介をしていきます。 第1回目は一般に「カイ2乗検定」とよばれることの多い統計的検定の話をします。カイ2乗統計量と…