多変量解析 - 第1講
(Press ?
for help, n
and p
for next and previous slide)
村田 昇
body | brain | |
---|---|---|
Mountain beaver | 1.35 | 8.1 |
Cow | 465.00 | 423.0 |
Grey wolf | 36.33 | 119.5 |
Goat | 27.66 | 115.0 |
Guinea pig | 1.04 | 5.5 |
Dipliodocus | 11700.00 | 50.0 |
Asian elephant | 2547.00 | 4603.0 |
Donkey | 187.10 | 419.0 |
Horse | 521.00 | 655.0 |
Potar monkey | 10.00 | 115.0 |
Cat | 3.30 | 25.6 |
Giraffe | 529.00 | 680.0 |
Gorilla | 207.00 | 406.0 |
Human | 62.00 | 1320.0 |
Figure 1: 体重と脳の重さの関係
Figure 2: 体重と脳の重さの関係 (対数変換)
Figure 3: 回帰式とその信頼区間
VINT | LPRICE2 | WRAIN | DEGREES | HRAIN | TIME_SV |
---|---|---|---|---|---|
1952 | -0.99868 | 600 | 17.1167 | 160 | 31 |
1953 | -0.45440 | 690 | 16.7333 | 80 | 30 |
1954 | NA | 430 | 15.3833 | 180 | 29 |
1955 | -0.80796 | 502 | 17.1500 | 130 | 28 |
1956 | NA | 440 | 15.6500 | 140 | 27 |
1957 | -1.50926 | 420 | 16.1333 | 110 | 26 |
1958 | -1.71655 | 582 | 16.4167 | 187 | 25 |
1959 | -0.41800 | 485 | 17.4833 | 187 | 24 |
1960 | -1.97491 | 763 | 16.4167 | 290 | 23 |
1961 | 0.00000 | 830 | 17.3333 | 38 | 22 |
1962 | -1.10572 | 697 | 16.3000 | 52 | 21 |
1963 | -1.78098 | 608 | 15.7167 | 155 | 20 |
1964 | -1.18435 | 402 | 17.2667 | 96 | 19 |
1965 | -2.24194 | 602 | 15.3667 | 267 | 18 |
Figure 4: 価格と気候の散布図
Characteristic | Beta | 95% CI1 | p-value |
---|---|---|---|
WRAIN | 0.0012 | 0.0002, 0.0022 | 0.024 |
DEGREES | 0.6164 | 0.4190, 0.8138 | <0.001 |
HRAIN | -0.0039 | -0.0055, -0.0022 | <0.001 |
TIME_SV | 0.0238 | 0.0090, 0.0387 | 0.003 |
R² = 0.828; Adjusted R² = 0.796; Statistic = 26.4; p-value = <0.001 | |||
1 CI = Confidence Interval |
Figure 5: 重回帰による予測値と実際の価格
老年人口割合 | 婚姻率 | 交通事故発生件数 | 住居費割合 | |
---|---|---|---|---|
北海道 | 26.0 | 4.86 | 274.2 | 5.9 |
青森県 | 27.0 | 4.33 | 386.7 | 5.4 |
岩手県 | 27.9 | 4.32 | 261.6 | 7.1 |
宮城県 | 22.9 | 5.30 | 447.7 | 5.0 |
秋田県 | 30.7 | 3.78 | 266.2 | 7.9 |
山形県 | 28.3 | 4.24 | 614.9 | 6.0 |
福島県 | 26.1 | 4.73 | 498.9 | 5.7 |
茨城県 | 23.8 | 4.92 | 500.6 | 6.8 |
… | … | … | … | … |
Figure 6: 県別の生活環境(人口動態)の散布図
Figure 7: 県別の生活環境(教育・労働)の散布図
Figure 8: 県別の生活環境(貯蓄・余暇)の散布図
Figure 9: 県別の生活環境の主成分分析
ID | V1 | V2 | V3 | V4 | V5 | V6 | V7 | V8 | V9 | class |
---|---|---|---|---|---|---|---|---|---|---|
1000025 | 5 | 1 | 1 | 1 | 2 | 1 | 3 | 1 | 1 | benign |
1002945 | 5 | 4 | 4 | 5 | 7 | 10 | 3 | 2 | 1 | benign |
1015425 | 3 | 1 | 1 | 1 | 2 | 2 | 3 | 1 | 1 | benign |
1016277 | 6 | 8 | 8 | 1 | 3 | 4 | 3 | 7 | 1 | benign |
1017023 | 4 | 1 | 1 | 3 | 2 | 1 | 3 | 1 | 1 | benign |
1017122 | 8 | 10 | 10 | 8 | 7 | 10 | 9 | 7 | 1 | malignant |
1018099 | 1 | 1 | 1 | 1 | 2 | 10 | 3 | 1 | 1 | benign |
1018561 | 2 | 1 | 2 | 1 | 2 | 1 | 3 | 1 | 1 | benign |
… | … | … | … | … | … | … | … | … | … | … |
Figure 10: 乳癌患者(良性・悪性)の生研検査の散布図
Figure 11: 生研検査の主成分分析
Figure 12: 生研検査による乳癌患者の判別分析
梅 | 鮭 | 昆布 | 鰹 | 明太 | 鱈子 | ツナ | 他 | |
---|---|---|---|---|---|---|---|---|
北海道 | 13.86 | 27.94 | 5.58 | 5.26 | 9.26 | 15.06 | 11.61 | 11.39 |
青森 | 14.93 | 30.79 | 7.01 | 2.43 | 10.36 | 11.58 | 11.58 | 11.28 |
岩手 | 17.91 | 23.13 | 5.22 | 3.35 | 17.91 | 10.07 | 10.44 | 11.94 |
宮城 | 15.16 | 29.5 | 10 | 1.66 | 14.83 | 8.83 | 12.83 | 7.16 |
秋田 | 10.63 | 31.38 | 5.31 | 3.19 | 14.89 | 13.29 | 10.63 | 10.63 |
山形 | 16.58 | 20.27 | 8.29 | 1.38 | 18.89 | 10.13 | 12.9 | 11.52 |
福島 | 12.37 | 21.99 | 8.93 | 3.43 | 16.49 | 9.62 | 19.24 | 7.9 |
茨城 | 15.42 | 26.49 | 7.98 | 2.54 | 18.33 | 11.79 | 11.79 | 5.62 |
… | … | … | … | … | … | … | … | … |
Figure 13: おむすびの具に関するアンケート分析 (県別の集計)
Figure 14: アンケート結果にもとづく県のクラスタ分析
Jan | Feb | Mar | Apr | May | Jun | Jul | Aug | Sep | … | |
---|---|---|---|---|---|---|---|---|---|---|
1949 | 112 | 118 | 132 | 129 | 121 | 135 | 148 | 148 | 136 | … |
1950 | 115 | 126 | 141 | 135 | 125 | 149 | 170 | 170 | 158 | … |
1951 | 145 | 150 | 178 | 163 | 172 | 178 | 199 | 199 | 184 | … |
1952 | 171 | 180 | 193 | 181 | 183 | 218 | 230 | 242 | 209 | … |
1953 | 196 | 196 | 236 | 235 | 229 | 243 | 264 | 272 | 237 | … |
1954 | 204 | 188 | 235 | 227 | 234 | 264 | 302 | 293 | 259 | … |
1955 | 242 | 233 | 267 | 269 | 270 | 315 | 364 | 347 | 312 | … |
… | … | … | … | … | … | … | … | … | … | … |
Figure 15: 航空機旅客量の変遷
Figure 16: 階差時系列の自己相関分析
Figure 17: 航空機旅客量の予測 (SARIMAモデルによる)