最小二乗法による回帰直線は、測定で得られた数値の組から、想定する(作成する)関数が測定値に対して好ましい・よい近似となるように、残差の二乗和を最小とするような係数を作成します。
前の記事で、通常の回帰直線 の求め方について説明しましたので、この記事では補足として原点を通る回帰直線がどのように作られているのか整理します。
原点を通る回帰直線式 ax の求め方
まず、当然ですが原点を通るということは、y
軸の高さを持ちません。これは b
の値を持たないということです。( )なので、原点を通る回帰直線式は について考えればよいということです。
n
個のデータ を、 の式に当てはめて、理論値 が得られたとします。これを と定義します。
式が単純になったので の回帰直線式よりも簡単です。(1) 式を展開してみます。
が最小になる a を求めるためには、(2) 式を a で微分して、 になる a を求めます。(導関数を参考にする)
よって、(3) から、a の値を求めることができます。
原点を通る回帰直線の相関係数 について
原点をとおる回帰直線は、相関係数 は通常適用することができません。Prism のレポートにその理由が説明してあります。
Prism does not report r2 when you force the line through the origin (or any other point), because the calculations would be ambiguous. There are two ways to compute r2 when the regression line is constrained. As you saw in the previous section, r2 is computed by comparing the sum-of-squares from the regression line with the sum-of-squares from a model defined by the null hypothesis. With constrained regression, there are two possible null hypotheses. One is a horizontal line through the mean of all Y values. But this line doesn't follow the constraint -- it does not go through the origin. The other null hypothesis would be a horizontal line through the origin, far from most of the data.
Because r2 is ambiguous in constrained linear regression, Prism doesn't report it. 1
ただし、平均と同じで対称性を持つ場合は、重心を持つため相関係数を持てそうです。三平方の定理なんかは x と y の対称性がわかりやすい。三角形の重心を求める式も平均ですね。対称性を持つことが大切。
原点からの変動を測った式として の代替として次の式が紹介されています 2 が、通常は相関係数を考えません。
どうしても相関係数が気になる場合は、回帰直線が重心を通過するかどうかを証明する計算を添えておくとよいと思います。
計算結果が0のとき、重心 を通過する。計算結果が0ではないとき、 の信頼性は低下するといった感じ。
参考
- 七誌の開発日記 - はてなブログで数式を書く
- 七誌の開発日記 - Markdown+Mathからはてなブログへ
- KATEX - Misc Supported Functions
- MathJax - Supported TeX/LaTeX commands
C言語による数値計算入門―解法・アルゴリズム・プログラム (UNIX & Information Science)
- 作者:皆本 晃弥
- 発売日: 2005/12/01
- メディア: 単行本
- 作者:E. クライツィグ
- 発売日: 2003/12/01
- メディア: 単行本
-
Why Prism doesn’t report r2 in constrained linear regression↩
-
焦点をもつ回帰直線群の推定とその周辺 応用統計学会 vol.36, No.1 (2007), 31-50 中村永友 土屋高宏↩