2022年12月3日土曜日

Rで効果量を算出する式を導入する(Hedges’g)

  最近では、研究結果を示すために、p値のみならず効果量も明記すべきという考えが浸透してきています。











 p値の存在は、両者の差が等しいかどうかを客観的にジャッジするためにあるもので、その効果の大きさを示すものではないようです。











 100万円かかるダイエット方法を導入した結果、実施前後で差が等しいという仮説を棄却したとします。しかしながら、たった500gしか痩せる効果が得られなかった場合はどうでしょうか。その価値基準は、人によってさまざまだと思いますが、その方法を実施する意義があるのかを客観的に判定する場合、効果量を示す数値は重要な存在となってきます。











 今回、多重比較等で用いる効果量「Hedges’g」の計算式をRで作成してみました。











 Hedges’gの計算式は、下記の通り、Becker(2000)の論文を参考にして導入しています。





 これらを実際のRに当てはめてみました。

#χ平均値 nサンプル数 sd標準偏差 実際の数値を挿入
χ1<-

χ2<-

n1<-

n2<-

sd1<-

sd2<-

#Hedges’g計算式
(χ1-χ2)/(sqrt((((χ1-1)*sd1**2)+((χ2-1)*sd2**2))/(χ1-1+χ2-1)))



 

 以上になります。



 もし上記計算結果で絶対値にする必要があれば、全体にabs()を加えると算出できると思います。










 わざわざこれを考えるに至った理由は、私愛用の清水先生のHADには効果量を算出機能が備わっていますが、どうも不安定?で数値がp値と矛盾しているときが頻繁に起きてしまっていたからです(私の使い方の問題がありそうですが)。












 実際にspssとこの式で得られた効果量は同じ数値となっていました。












 次回から、Hedges’gの効果量を算出する際は、こちらを利用していきたいと思います。



Rで箱ひげ図をプロットする

  Rで箱ひげ図の作成を試みたいと思います。




 



 少しずつ慣れてきた感じはありますが、ネット情報でそのまま導入しても、素人の私にはできないことが多いです。基本を理解していないんだと思います。








 今回は、Qiitaさんのところから参考にしています。






まずは、データを読み込みます(データはでたらめに作成したもの)。

#箱ひげ図 データは縦に並べ、もう一列にSpeciesとして設定する

dat <- read.csv("Book2.csv")

→こんな感じのデータです。














#ggplot2を立ち上げる

install.packages("ggplot2")

library(ggplot2)












g <- ggplot(Book2)+

  geom_boxplot(aes(x=Species, y=test))+

  geom_jitter(aes(x=Species,y=test,color=Species),width=0.3)

plot(g)





 上記のような箱ひげ図がプロットされました。








 もしカラーをはずしたい場合は、color=Speciesをそのまま削除します。












 もし、灰色カラー(背景)をはずしたい場合は、



theme_classic()+






を加えるようです。すると下記のような図がプロットされます。












 その他にたくさんのおしゃれな図があるようなので、トライしてみたいと思います。






2022年11月29日火曜日

Rで2要因のグラフをプロットする方法

  2要因のデータからエクセルにて標準偏差や標準誤差を加えた折れ線グラフを作成したとき、どうも2要因のデータ同士が重なって見えずらくなる現象が起きてしまっていました。










 エクセルの手法で改善できるかもしれませんが、Rで簡単にプロットできることがわかりました。










 下記の表のようなデータ(でたらめに作られたもの)を使うとします。










 このデータファイル名をinfecとし、csvファイルに保存します。

















 実際のRで作成してみます。











dat <- read.csv("infec.csv") #データ読み込み








#プロットと平均値や標準偏差を求めるためこの2つを読み込む 
 なければinstall.packagesで対応

library(ggplot2)
library(dplyr)
library(cowplot)
library( Hmisc )










pd = position_dodge( width = 0.15 )

ggplot( infec, aes( x = prepos, y = infection, color = intervention, group = intervention ) ) +

  stat_summary( fun.y = "mean", geom = "line" )+

  stat_summary( fun.y = "mean", geom = "line", size = 1.0, position = pd ) +

  stat_summary( fun.data = mean_cl_normal, geom = "errorbar",

                alpha = 0.9, size = 1.0, width = 0.2, position = pd ) + 

  stat_summary( fun.y = "mean", geom = "point", size = 3.5, position = pd )+

  scale_y_continuous( limits = c( 20, 70 ), breaks =seq(20,70,5), expand = c( 0, 0 ) ) +

  theme_cowplot( 15 ) +

  scale_colour_manual( values = c( "#5B84B1FF", "#FC766AFF" ) ) +

  xlab( "Differences in infection status by town" ) +

  ylab( "Infection" )+ 

  scale_x_discrete(limit=c('before', 'after'))






 グラフの出来上がりです。





 このように、2要因のデータ間で隙間があるので、標準偏差が描かれてもはっきり違いが判ります。











 現時点で、素人の私にとってこれが限界ですが、もう少しグラフの調整ができるように引き続き調べていきたいと思います。


2022年11月22日火曜日

Rを使ってROC曲線を求める方法

 



 ROC曲線を求めるとき、普段使用しているHADには備わっていないため、spssを使用していました。












 spssが嫌いなわけではありませんが、高額なこと、使える場所が限られてしまうことから、やや抵抗感がありました。














 そこで今回、Rを使ったROC曲線を求める方法を探していたところ、統計ERさんのブログでとてもわかりやすく説明されているのを発見しました。















 ただし、この通りに進めてみましたが、dat機能でvariablesが上手く分けられませんでした。もちろん、私の知識の問題がありますが、別の方法で解決できましたので、紹介させて頂きます。現在使用しているRは、「version 4.2.2」です。











 「Book1」のcvsファイルをデータとして使用しています。このデータは、BellCurveさんからダウンロートできます。BellCurveさんのファイル名は「ROC-curve-sample-data」です。







このデータのHeadingには、

検査項目:testA 

疾患の有無:disease (疾患無しを0、疾患有りを1)

と適当に英語で記載しました。









 現在のRversion 4.2.2機能では、日本語で記載すると上手く読み込めなくなる?ためです。






まず、パッケージをインストールします。

install.packages("Epi") 


library(Epi)


dat = read.csv("Book1.csv", na.strings="") →ここが統計ERさんと異なるところ

統計ERさんの場合→dat <- read.table("ROC-curve-sample-data.txt")


str(dat)



ROC(test=dat$testA, stat=dat$disease, plot="ROC")  #testAが検査の点数で、diseaseが真の分類



ROC(test=dat$testA, stat=dat$disease, plot="sp")



 すると、下記のような図がプロットされます。














 BellCurveさんと同じ結果が得られてますね。



















 このEpi パッケージの ROC() 関数の魅力は、AUC面積の算出はもちろんのこと、カットオフ値まで同時に判定してくれるところです。
































 spssの場合、Youden Indexなどを求めないと、明確なカットオフ値を得ることができません。そして統計、Rの素人である私にも使いやすい。
















 
 その他Rで用いる便利な方法があるか、今後も探していきたいと思います。


※Rのパッケージを論文に引用する必要がある場合、




今回のEpiを用いたとき、




citation("Epi")関数を使います。すると、下記の通り表示されます。

To cite Epi in publications use:

  Bendix Carstensen, Martyn Plummer, Esa Laara, Michael Hills (2022). Epi: A Package for Statistical Analysis in Epidemiology. R
  package version 2.47. URL https://CRAN.R-project.org/package=Epi

If you use Lexis objects/diagrams, please also cite:

  Martyn Plummer, Bendix Carstensen (2011). Lexis: An R Class for Epidemiological Studies with Long-Term Follow-Up. Journal of
  Statistical Software, 38(5), 1-12. URL https://www.jstatsoft.org/v38/i05/.

For use of Lexis objects in multi-state models, please also cite:

  Bendix Carstensen, Martyn Plummer (2011). Using Lexis Objects for Multi-State Models in R. Journal of Statistical Software,
  38(6), 1-18. URL https://www.jstatsoft.org/v38/i06/.

To see these entries in BibTeX format, use 'print(<citation>, bibtex=TRUE)', 'toBibtex(.)', or set
'options(citation.bibtex.max=999)'.


2022年3月24日木曜日

作業療法士という職種について(学校選びについて)

  個人的な見解ですが、教員と臨床を担っている立場として、作業療法士の数は圧倒的に少ないと思っています。






 





 就職の時期になると、作業療法学生1人に対して6~10施設から就職への依頼がくることもあります。













 作業療法士は、医療・介護領域においても、中心的役割を担う職種です。












 

 つまり、作業療法士は他の職種のことも理解しつつ、リーダー的存在としてチームをひっぱっていくことになります。













 身体機能にかかわる理学療法士以上に、応用的な動作へのアプローチが求められます。食事にかかわる言語聴覚士以上に、嚥下や姿勢、精神面へのアプローチが求められます。
















 それだけ作業療法士は必要とされる職業なんですね













 また作業療法士は、看護師や介護士さんのように夜勤がありません。














 残業も少なく、休日もしっかり確保されています。ゆとりのある生活スタイルを保つという意味では、作業療法士は非常に安定した職業といえるでしょう。













 作業療法士をめざす学校には大きく専門学校、大学に分けられます。














 学校を選ぶ基準はさまざまですが、私がおすすめする見方として以下の3点を挙げます(個人的な意見です)。

1:国家試験合格率

2:教員人数

3:付属病院の有無












1:国家試験合格率

 国家試験合格率は、学生や教員の関係性、そして学校そのものの環境の良さがもろにあらわれると考えることができます。













 一見、偏差値が高い学校でも、なぜか国家試験の合格率は低いことが頻繁にあります。












 つまり、学生や教員が国家試験に対してあまり取り組んでいない可能性があると考えることができます。

















 この点において、学校選びの基準として国家試験合格率は重要な見方になるでしょう。














2:教員人数

 当たり前のことですが、教員人数が多いほど、一人当たりの授業数やその他業務に割り当てられる量は減ってきます。














 つまり、教員人数が多いほど、個別で学生にかかわれる時間をもつことができると考えることができます。













 教員は常に精神的に安定した状態のなかで、学生への教育を提供できる環境下にいるということになります。













 学校を選ぶ際は、教員人数を注目することに価値があるといえます。ただし、注意が必要です。教員の数といっても、その教員が作業療法士であるかどうかが重要になってきます。














 作業療法士でない教員は、それに属する学科に深くかかわれないことが多いです。作業療法に関する指導ができない分、実習のサポートも薄くなってしまう可能性があると思います。
















3:付属病院の有無

 付属病院があるということは、卒業に必須な実習を身内で受けることができます。













 これは、教員そのものが学生に直接指導することができることに加え、教員と臨床スタッフのやりとりも密に行えることができます。














 担当する教員がいつでも早急に学生をサポートできる点でいえば、付属病院を有する学校を選ぶことは非常に有意義になるでしょう。












 この3つを担保している学校といえば、杏林大学保健学部作業療法学科になります。














 その他付属病院を有している学校には北里大学医療衛生学作業療法学専攻昭和大学保健医療学部作業療法学科もあります。















 近隣の大学もHPで確認しつつ、慎重に学校を選ぶことをおすすめします。













 今回の重要な視点として、大学教員の研究業績は省きましたが、研究業績の高さは教員そのもののレベルを反映すると考えることもできます。教員紹介のところで、研究業績を開示しているので、興味があればぜのぞいてみると良いかと思います。













 作業療法士は心身ともに負担のない職業で、年を重ねても健康な状態でお仕事ができる職業の一つだと思います。













 さまざまな職業と見比べてみて、もし興味があれば、ぜひ作業療法士を目指してみてはいかがでしょうか。