![]() | → |
![]() | → |
| → | このページ |
---|
いきなりですが、主成分分析の計算が終了しました。 まぁ、Excelのソフトを使ったのであっという間でした。 ちなみに変数(路線の性質を示す指標値)は2つとして設定しました。 これは2次元上に結果をプロットするのが一番分かりやすいからで、 以下の説明も2変数を考慮しています。 また、平均駅間などの各指標は標準化(平均0,分散1)して用いました。 |
前のページに戻る |
---|
一応、どのような計算がなされたかを説明しておきます。
まず、求めるべき「各路線の性質を示すひとつめの指標」(指標①)は次式のように計算されます。
(西尾線の性質を示す指標値①)=a×(西尾線の平均駅間)+b×(西尾線の複線化率)+・・・ こんな感じで、各路線の性質が計算されます。ということは、上式のa,b,・・・が求められれば良いわけです。 そこでどのような方針で求めるかということですが、つまるところ、各指標が持っている"情報"をできるだけ多く取り入たいんです。 情報を最大限取り入れるためには、性質を示す指標の分散を最大にします。今回の場合、分散は次式の通りです。
で、この式を最大にするa,b,・・・を求める訳ですが、 このままではa,b,・・・が大きくなればなるほど分散も大きくなってしまうため、 もうひとつ条件をつけます。次式の通りです。 a2+b2+・・・=1 で、各路線の性質を示す指標が計算できるわけです。 |
ということで、各路線の性質を示す新しい指標がひとつできました。
そして、この指標がどの程度情報を含んでいるかを示す"寄与率"は46.9%でした。
つまり、平均駅間などの指標が持っている情報の46.9%を示す新しい指標が出来たことになります。(第1主成分といいます) ・・・50%もいえないというのは少ないですね。というわけで、第1主成分に全く現れなかった情報を示す新しい指標(第2主成分)を算出します。 これは、先ほど求めた方法の中で出てきた"分散"を最小にすることによって算出します。 こうして出来た2つめの新しい指標の寄与率は23.4%でした。 1つめと合わせると70.3%の情報を示すことが出来る訳です。 このあたりで手を打つことにします。これ以上増えると、グラフに表しづらくなるからです。 |
そして、各路線の性質を示す新しい2つの指標が算出できました。 次は、その指標が何を示しているかを考えなくてはいけません。 これが、難しいんですね。出来るだけ客観的に納得できる解釈をしなくてはなりません。 「え?そうか?」と言われないような・・・。 |
前のページに戻る |
---|
これが、西尾線。のHOME |
---|