このサイト(全・西・あ計画)のTOP PAGEに戻る 西尾線のHOMEに戻る
これが、西尾線。のHOME
 このページ 

西尾線の特徴
主成分分析の計算方法と情報量の検定
 いきなりですが、主成分分析の計算が終了しました。 まぁ、Excelのソフトを使ったのであっという間でした。 ちなみに変数(路線の性質を示す指標値)は2つとして設定しました。 これは2次元上に結果をプロットするのが一番分かりやすいからで、 以下の説明も2変数を考慮しています。 また、平均駅間などの各指標は標準化(平均0,分散1)して用いました。

前のページに戻る

 一応、どのような計算がなされたかを説明しておきます。 まず、求めるべき「各路線の性質を示すひとつめの指標」(指標①)は次式のように計算されます。

(西尾線の性質を示す指標値①)=a×(西尾線の平均駅間)+b×(西尾線の複線化率)+・・・
(三河線の性質を示す指標値①)=a×(三河線の平均駅間)+b×(三河線の複線化率)+・・・

 こんな感じで、各路線の性質が計算されます。ということは、上式のa,b,・・・が求められれば良いわけです。 そこでどのような方針で求めるかということですが、つまるところ、各指標が持っている"情報"をできるだけ多く取り入たいんです。 情報を最大限取り入れるためには、性質を示す指標の分散を最大にします。今回の場合、分散は次式の通りです。

(性質を示す指標の分散)= {(西尾線の性質を示す指標値①)-(各路線・性質を示す指標値①の平均)}
+{(三河線の性質を示す指標値①)-(各路線・性質を示す指標値①の平均)}
+・・・

で、この式を最大にするa,b,・・・を求める訳ですが、 このままではa,b,・・・が大きくなればなるほど分散も大きくなってしまうため、 もうひとつ条件をつけます。次式の通りです。

+b+・・・=1

で、各路線の性質を示す指標が計算できるわけです。

 ということで、各路線の性質を示す新しい指標がひとつできました。 そして、この指標がどの程度情報を含んでいるかを示す"寄与率"は46.9%でした。 つまり、平均駅間などの指標が持っている情報の46.9%を示す新しい指標が出来たことになります。(第1主成分といいます)
 ・・・50%もいえないというのは少ないですね。というわけで、第1主成分に全く現れなかった情報を示す新しい指標(第2主成分)を算出します。 これは、先ほど求めた方法の中で出てきた"分散"を最小にすることによって算出します。
 こうして出来た2つめの新しい指標の寄与率は23.4%でした。 1つめと合わせると70.3%の情報を示すことが出来る訳です。 このあたりで手を打つことにします。これ以上増えると、グラフに表しづらくなるからです。

 そして、各路線の性質を示す新しい2つの指標が算出できました。
 次は、その指標が何を示しているかを考えなくてはいけません。 これが、難しいんですね。出来るだけ客観的に納得できる解釈をしなくてはなりません。 「え?そうか?」と言われないような・・・。

前のページに戻る

これが、西尾線。のHOME