名古屋・豊橋発,弁護士籠橋の中小企業法務

名古屋,豊橋,東海三県中小企業法務を行っています。

№2117 統計学ってどこまで使えるんだろう?

№2117 統計学ってどこまで使えるんだろう?

「数値化仕事術」(PHP)では統計学をどのように仕事に生かすかをわかりやすく論じている。数学を知らないオヤジにもわかりやすく紹介しようとしている。

単回帰分析
 今は回帰分析に関する部分を読んでる。
 単回帰分析というのはデータの分布から,こんな直線関係がありますという分析をする初歩的なものだ。点,点,点と散布しているデータに対して,こんな直線式が成り立つでしょうという推定をする。

 たとえば「古くなるに連れてマンションの価格が下がる」という関係を式にする。これは築年数とマンション価格のデータを入れて,推定する直線をひくというものだ。どこで線を引くかというのは統計学的に決まった数式があって,難しくて地道な計算もエクセルが簡単にはじき出してくれる。

よくわからんぞ、決定係数
 直線式がどれくらい実体を反映しているかという指標がR二乗と言われる決定係数だ。単回帰分析の場合,決定係数が1に近づくにつれて,正確に実体を反映しているということになるらしい。

 決定係数(R二乗)これは,回帰直線式と実測値の差(残差変動)から求められる数値らしい。ためしにマンションと築年数で分析してみたら決定係数は0.58と出た。統計学的にはまずます意味ある単回帰分析ということなのだろう。


ますますこんがらがる、重回帰分析
 これは単回帰分析の場合だが,これが複数の説明変数(他の要因,たとえば駅からの距離とか,マンションの専有面積とかいった価格を決める要因)を持ち出すと要素がたくさん出てきて話が複雑になる。

 P値という言葉があって,特定の説明変数がどれだけ意味ある変数かを探り当てる数値があるようだ。つまり,P値が低いと,ずれが少なくなる,つまり信用性が高まるということになる。P値は実態とかけ離れている程度を示す確率を意味するらしいが,意味がさっぱり分からない。

私には意味があるのかね?
 ともかく,単回帰分析にしろ,重回帰分析にしろ,その持つ意味がよく分からないところが多くて,こんな分からない数値をシロウトである私があつかったところで,どれほど意味があるのだろうかと思ってしまう。

名古屋E&J法律事務所へのお問い合わせはこちら