2017-01-18

相関分析・重回帰分析・クロス集計の結果を、英語でレポートするためのテンプレート

相関分析・重回帰分析・クロス集計の結果を、英語でレポートしよう!



英語で卒論書いていたのですが、統計のレポートの際に、英語のボキャブラリーに慣れておらず、いろいろ調べながらやって時間が無駄にかかりました。テンプレがなかなか見つからなかったので、まとめておきます。

今回は

【①英語で論文を書く】予定があり、
【②統計解析のレポート】が必要になる
【③統計初心者】

を対象に、さまざまな統計結果を英語で表現するために使えそうな資料をまとめておきます。注意ですが、僕も学部レベルの知識しかないので、本当にこれで大丈夫かはお約束できません。あらかじめご了承ください。

主にこれらの英語でのレポート方法をまとめます。

- 相関分析(Pearson's Correlation Analysis)

- 重回帰分析 (Multiple-linear Regression)

- クロス集計とカイ二乗検定 (Contingency Table and Chi-squared test)

目次


  • 相関分析 Pearson's Correlation Analysis
    • レポート方法
    • 相関係数の程度の表現方法
    • 相関係数のテーブルの出力方法
  • 線形重回帰分析 Multiple liner regression Analysis
    • 線形重回帰分析のレポート方法
    • 線形重回帰分析のテーブルの表現方法
  • クロス集計とカイ二乗検定 Contingency Table and Chi-squared test
    • カイ二乗検定のレポート方法
    • クロス集計のテーブルの出力方法



相関分析 Pearson's Correlation Analysis

相関分析を英語でレポートする方法

もうすでに相関係数rと、p値が出てると仮定しますね。
相関を見たい変数Aと変数Bがあったときに、表現するテンプレです。

Based on the results of the study, 変数A is [程度] related to 変数B (r = 相関係数, p <  [p値]) 
となります。より詳しい説明は下のスライドをご覧ください。


相関係数の程度の表現方法


相関係数のrを表現するときに、相関の強さを表す言葉が日本語にもあります。rの値が以下の数字であれば、程度は形容詞[副詞]の形で表現します。
0.00-0.19 = very weak[ly] 「非常に弱く」
0.20-0.39 weak[ly] 「弱く」
0.40-0.59 moderate[ly] 「中程度に」
0.60-0.79 strong[ly] 「強く」
0.80-1.0 very strong[ly] 「非常に強く」
http://www.statstutor.ac.uk/resources/uploaded/pearsons.pdf

例えば身長と体重の相関係数を表現したいとします。
さきほどの表現方法と組み合わせて表現してみてください。
相関係数は0.68、p値は0.01未満だとします。表現方法は、
Height is strongly related to weight (r = .98, p < .01 ) 
となります。
ほかにも

- There was a positive correlation between the two variables, r = .35, p = < .001.

- There was a positive correlation between height (M = 55.39 SD = 16.33) and weight (M = 145.22 SD = 15.54) , r = .35, p = < .001, n = 100.

- There was a positive correlation between the two variables, r = .35, p = < .001, with a R2 = .124
こんな感じの表現方法があるみたいですね。

http://www.psychwiki.com/wiki/How_do_I_write_a_Results_section_for_Correlation%3F

相関係数の結果の出力方法

APAスタイルですが、相関分析のテーブルでの表現方法がこちらです。
詳しくは下記のリンクを見てください。


線形重回帰分析 Multiple liner regression Analysis


スライドを見てもらえればわかると思いますが、これが完成版。


重回帰分析の読み取りにおいて必要な単語がこちらです。
従属変数:dependent variables
独立変数: independent variables

重回帰分析を英語でレポートする方法

で、重回帰分析のレポートのテンプレがこちら
【従属変数と独立変数の説明】
A multiple linear regression was calculated to predict [従属変数] based on [独立変数1] and [独立変数2]. 
従属変数を、これらの独立変数で重回帰分析してみますよ~という宣言です。

【モデルの説明】
A significant regression equation was found (F( [回帰の自由度],[残差の自由度] ) = [F値], p < [モデルのp値]), with an R2 of .[R2値]. 
モデルの適合度について説明しています。
【回帰式の説明】
Participants' predicted [従属変数] is equal to [定数] + [コード化された独立変数1の非標準化係数]([コード化された独立変数1]) + [コード化された独立変数2の非標準化係数]([コード化された独立変数2]), where [独立変数1] is coded or measured as [変数の尺度] , and [][独立変数2] is coded or coded as [変数の値]. (省略)
回帰式について説明します。どれが強く影響を与えているのかがわかります。
【重回帰分析の結果】
Both [独立変数1] and [独立変数2] were significant predictors of [従属変数] 
結論として、どの独立変数が従属変数を予測するかを説明します。

重回帰分析のテーブルの表現方法

詳しくはこの下のリンクにまとめてありますので、よんでみてください。



クロス集計とカイ二乗検定 Contingency Table and Chi-squared test


クロス集計を英語でレポートする方法



Reporting Chi Square Test of Independence in APA from Ken Plummer

これがテンプレートです。用語の説明は省略します。

A chi-square test of independence was calculated comparing the frequency of heart disease in men and women. A significant interaction was found (χ2 (1) = 23.80. p < 0.5). Men were more likely to get heart desease (68%) than women (40%)

 (χ2 (1) = 23.80. p < 0.5)だけ説明すると、(カイ二乗が文字が出てこないのですが、本当は二乗です)、

(χ2([自由度]) = [カイ二乗値], p < [p値]

となります。

テーブルでの表現方法


こちらのURLを見ると詳細が載っていますので、参考にしてみてください。


注目の投稿

 PythonのTweepyを利用して、Twitter APIを利用している。 その中で、ハマったポイントをメモしておく。 まず、Searchに関して。 Twitter検索は、クライアントアプリ側では、全期間の検索が可能になっている。 一方で、APIを利用する際は、過去1週間しか...