主成分分析
主成分分析(Principal Component Analysis:PCA)は多くの変数によって記述された量的データについて、 複数の変数間の相関(共分散)を少数個の合成変数(これを主成分という)に縮小し、 データの解釈を容易にするための分析手法である。
(1)データセットの作成
主成分分析を行うためのデータセットとしては、テキスト×語のクロス集計(出現頻度)を用意する。 これを作成するには、TTM(TinyTextMiner)と呼ばれるソフトウェアを用いると便利である。
> chiebukuro1<-read.csv("princomp.csv", header=T,row.name=1) > source("all.R",encoding="EUC-JP") > chiebukuro1.pc <-pca(chiebukuro1) > chiebukuro1.pc 主成分分析の結果 PC1 PC2 PC3 PC4 PC5 PC6 PC7 PC8 PC9 PC10 PC11 PC12 PC13 PC14 PC15 PC16 PC17 PC18 PC19 Contribution 質問 -0.651 0.146 0.150 0.003 0.107 -0.178 0.154 0.033 -0.067 0.129 -0.170 -0.026 -0.150 -0.043 0.128 -0.028 0.025 -0.119 0.015 0.642 回答 -0.633 0.047 0.128 -0.079 -0.047 -0.305 0.072 -0.190 0.007 0.104 0.120 -0.089 -0.073 -0.014 0.010 -0.052 0.029 0.119 -0.087 0.627 人 -0.548 -0.106 -0.302 0.037 0.079 0.163 0.154 0.188 0.114 0.064 -0.093 0.017 0.175 -0.089 0.018 0.095 0.022 -0.037 -0.080 0.579 自分 -0.435 -0.492 -0.186 -0.008 0.004 -0.245 -0.051 0.010 -0.092 0.060 0.012 -0.063 0.079 0.269 -0.053 0.041 -0.069 0.068 0.036 0.639 知識 -0.217 -0.528 0.002 -0.013 -0.170 0.059 -0.141 0.057 -0.212 0.026 0.091 0.018 -0.119 0.152 -0.072 0.032 -0.006 -0.011 0.070 0.484 意見 -0.328 -0.172 -0.131 0.126 0.343 0.112 -0.075 -0.213 0.118 -0.061 -0.055 -0.061 0.199 0.039 -0.083 0.073 -0.067 0.145 0.133 0.472 情報 -0.174 -0.332 0.084 -0.203 0.057 0.215 0.197 0.021 -0.016 -0.089 0.258 0.126 -0.146 -0.207 0.005 -0.028 -0.042 -0.186 0.135 0.488 便利 0.007 0.253 0.018 -0.292 0.081 0.062 0.395 -0.078 -0.034 -0.339 -0.177 0.065 -0.032 0.128 0.092 0.095 -0.127 0.283 -0.032 0.606 ない -0.360 0.280 0.102 -0.503 0.038 0.074 -0.006 0.077 0.129 -0.025 0.166 -0.125 0.098 0.117 0.045 -0.012 0.109 -0.035 0.121 0.598 多い -0.462 0.009 0.385 0.219 -0.079 0.093 -0.023 0.029 -0.003 -0.089 -0.161 -0.061 -0.059 0.099 0.055 -0.164 -0.033 -0.185 -0.074 0.547 気軽 -0.106 0.304 0.115 0.248 0.424 -0.080 -0.054 -0.087 0.020 -0.090 0.041 0.082 -0.349 0.006 -0.047 0.098 -0.060 -0.126 -0.038 0.547 疑問 -0.130 0.037 -0.342 0.272 -0.099 -0.045 0.212 -0.329 0.119 0.067 0.230 -0.033 -0.025 0.038 0.118 -0.208 -0.029 -0.150 0.127 0.546 暇つぶし 0.124 0.022 0.111 -0.085 -0.087 -0.064 -0.047 0.045 -0.053 -0.032 -0.156 -0.265 0.247 0.254 0.101 -0.287 -0.013 -0.247 0.015 0.429 非常 -0.296 0.202 -0.290 -0.008 -0.204 0.252 -0.007 -0.131 -0.292 -0.273 -0.202 0.171 -0.131 0.186 -0.079 0.061 0.031 0.082 0.015 0.634 利用 -0.265 0.213 -0.245 0.145 -0.198 0.117 -0.075 0.219 -0.268 0.115 -0.044 -0.068 -0.220 -0.296 -0.117 -0.017 0.036 0.022 0.084 0.554 楽しい -0.118 0.040 0.151 0.053 0.091 -0.175 -0.090 -0.204 -0.354 -0.150 -0.086 0.170 0.470 -0.186 -0.009 0.014 0.117 0.022 -0.148 0.606 いろいろ -0.103 -0.220 0.008 -0.144 0.269 0.303 -0.154 -0.266 0.126 -0.158 0.144 -0.049 0.064 -0.210 0.106 -0.144 0.312 0.091 -0.061 0.592 勉強 -0.235 -0.209 -0.003 -0.139 -0.072 -0.137 -0.076 0.059 -0.270 -0.055 -0.234 0.079 -0.023 -0.067 -0.242 -0.306 -0.303 0.068 -0.129 0.559 考え -0.131 -0.298 -0.022 -0.231 0.053 0.379 -0.166 -0.082 0.065 -0.008 0.063 0.084 -0.074 -0.088 0.255 0.104 -0.008 -0.130 -0.297 0.550 悩み -0.108 -0.018 -0.226 0.204 0.115 0.015 0.024 0.299 0.090 -0.078 0.366 -0.317 0.242 0.210 -0.093 0.098 -0.182 -0.030 -0.060 0.615 面白い -0.128 0.037 0.018 -0.009 0.040 0.263 -0.343 0.036 0.016 0.075 -0.214 -0.214 -0.090 -0.242 -0.057 -0.090 0.024 0.160 0.176 0.441 考え方 -0.080 -0.217 -0.127 -0.000 -0.105 -0.371 -0.191 0.226 0.351 -0.434 -0.115 0.077 -0.065 -0.066 -0.001 0.006 0.027 -0.045 0.016 0.648 相談 -0.147 0.210 -0.013 0.175 0.216 0.155 0.028 0.499 0.064 0.040 0.204 0.254 0.047 0.154 0.088 -0.122 -0.000 0.046 0.062 0.583 たくさん -0.157 0.095 -0.179 0.075 -0.152 0.230 0.056 -0.082 0.312 -0.071 -0.270 -0.017 0.207 -0.019 -0.012 0.327 -0.217 0.163 -0.170 0.585 時間 -0.076 -0.054 -0.040 -0.022 0.121 -0.037 0.192 0.208 0.070 0.069 0.037 0.371 -0.079 -0.201 0.327 -0.216 -0.408 0.104 -0.103 0.644 意味 -0.275 0.301 -0.064 -0.180 -0.232 0.019 -0.490 0.081 0.055 -0.042 0.235 0.133 0.097 0.026 -0.034 0.114 -0.147 0.071 0.147 0.654 必要 -0.099 0.079 0.085 -0.494 0.056 0.100 0.326 0.072 -0.006 -0.234 0.056 -0.165 0.037 0.020 -0.263 -0.180 -0.033 -0.185 0.078 0.622 お礼 -0.170 0.276 -0.315 -0.018 -0.350 0.094 -0.004 -0.253 0.154 0.094 0.119 0.146 -0.073 0.048 -0.164 -0.222 0.127 -0.075 0.081 0.581 不安 -0.143 -0.049 -0.051 0.118 0.211 -0.085 0.174 -0.248 -0.081 0.029 -0.121 0.165 0.175 -0.082 0.061 0.247 -0.056 -0.286 0.552 0.724 内容 -0.216 -0.031 0.006 -0.121 0.056 -0.318 0.140 0.086 0.125 0.163 -0.037 -0.190 -0.234 0.058 0.141 0.189 0.381 0.370 -0.014 0.669 期待 -0.132 0.094 0.258 -0.008 -0.182 0.151 -0.157 0.048 0.159 0.135 -0.255 -0.292 0.022 -0.017 0.351 0.089 -0.182 -0.214 0.114 0.593 日常 0.012 0.060 -0.218 0.155 -0.124 -0.038 0.094 -0.034 -0.236 -0.486 0.105 -0.220 -0.031 0.059 0.346 -0.007 -0.006 -0.015 -0.056 0.582 難しい -0.053 0.119 -0.029 -0.013 0.139 -0.042 0.147 0.139 -0.050 0.038 0.026 -0.208 0.029 -0.309 -0.448 0.286 -0.042 -0.256 -0.253 0.638 自由 -0.011 -0.069 0.001 -0.039 -0.003 0.108 -0.074 -0.057 -0.094 -0.000 -0.017 0.151 -0.313 0.378 0.003 0.335 0.085 -0.347 -0.253 0.604 不愉快 -0.174 -0.050 0.537 0.332 -0.327 0.148 0.187 0.022 0.111 -0.097 0.036 0.042 0.120 -0.008 -0.043 0.082 0.021 0.092 -0.007 0.652 くだらない -0.046 0.030 -0.142 0.170 -0.106 0.003 0.059 0.065 -0.297 -0.169 0.190 -0.320 -0.038 -0.322 0.260 0.016 0.081 -0.031 -0.094 0.516 厳しい -0.137 0.099 0.120 0.319 0.449 0.153 -0.214 -0.072 0.061 -0.227 -0.034 -0.112 -0.135 0.179 -0.175 -0.277 0.011 0.089 -0.053 0.658 感心 -0.108 0.036 -0.158 0.092 -0.148 -0.102 0.104 -0.190 0.394 0.085 -0.074 0.048 0.071 -0.069 -0.068 -0.232 0.084 -0.176 -0.378 0.545 まじめ -0.117 0.076 -0.066 0.065 0.039 0.099 0.043 0.339 -0.164 0.068 -0.151 0.283 0.311 0.082 0.082 -0.068 0.507 -0.108 -0.071 0.678 皮肉 -0.097 -0.141 0.424 0.228 -0.322 0.149 0.212 -0.007 0.068 -0.141 0.260 0.098 -0.014 -0.036 -0.202 0.070 0.084 0.163 0.081 0.620 ユーモア 0.027 -0.067 -0.040 0.004 -0.066 -0.240 -0.142 0.181 0.301 -0.435 -0.142 0.127 -0.110 -0.192 -0.040 0.039 0.173 -0.195 0.188 0.593 笑い -0.202 0.266 0.208 -0.107 0.004 -0.281 -0.332 -0.167 -0.085 -0.051 0.339 0.166 0.149 -0.066 0.090 0.131 -0.113 -0.053 -0.163 0.630 Eigenvalue 2.557 1.630 1.563 1.438 1.408 1.340 1.321 1.274 1.263 1.197 1.168 1.149 1.128 1.086 1.079 1.066 1.050 1.033 1.023 Contribution 0.061 0.039 0.037 0.034 0.034 0.032 0.031 0.030 0.030 0.028 0.028 0.027 0.027 0.026 0.026 0.025 0.025 0.025 0.024 Cum.contrib. 0.061 0.100 0.137 0.171 0.205 0.237 0.268 0.298 0.328 0.357 0.385 0.412 0.439 0.465 0.490 0.516 0.541 0.565 0.590 > |
> plot(chiebukuro1.pc$factor.loadings[,1:2],type="n") > text(chiebukuro1.pc$factor.loadings,colnames(chiebukuro1)) |
クラスター分析
クラスター分析は、対象間の関連性を表すデータを分析する手法の1つで、 分析データのパターンが似ている個体を同じグループ(クラスター)にまとめる分析手法である。
> chiebukuro2<-chiebukuro1.pc$factor.loadings 50 件以上の警告がありました (警告を見るには warnings() を使って下さい) > chiebukuro2.d<-dist(chiebukuro2) > chiebukuro2.d 質問 回答 人 自分 知識 意見 情報 回答 1.073091 人 1.228657 1.296544 自分 1.289410 1.224702 1.276411 知識 1.385570 1.383880 1.357386 1.166915 意見 1.355432 1.322992 1.278015 1.262653 1.419809 情報 1.373373 1.387072 1.350185 1.368052 1.321486 1.381630 便利 1.388767 1.397390 1.432940 1.462324 1.470360 1.438585 1.425782 ない 1.255823 1.273838 1.355371 1.386823 1.433001 1.370268 1.374740 多い 1.195266 1.284742 1.281412 1.362266 1.356111 1.375119 1.372606 気軽 1.304586 1.389801 1.431879 1.453480 1.464688 1.393470 1.428015 疑問 1.398136 1.342317 1.355619 1.353550 1.422615 1.381785 1.424601 暇つぶし 1.447372 1.449660 1.451562 1.431597 1.433255 1.449460 1.447439 非常 1.322178 1.353842 1.308873 1.389597 1.383516 1.365648 1.420112 利用 1.315612 1.353043 1.337766 1.395101 1.396429 1.405010 1.407840 楽しい 1.363748 1.367374 1.417672 1.385306 1.411239 1.393553 1.425780 いろいろ 1.403096 1.394130 1.386034 1.404090 1.371915 1.311154 1.356093 勉強 1.342703 1.317807 1.363962 1.311637 1.358736 1.378739 1.385458 考え 1.435550 1.386686 1.318709 1.371192 1.345429 1.391862 1.326078 悩み 1.418862 1.397851 1.307446 1.342220 1.420638 1.389528 1.411939 面白い 1.379499 1.400466 1.343806 1.430093 1.376414 1.398995 1.424639 考え方 1.408857 1.410317 1.385451 1.313989 1.385317 1.409071 1.405395 相談 1.342371 1.418389 1.336249 1.441894 1.413680 1.394767 1.421104 たくさん 1.408591 1.410124 1.287556 1.396727 1.428314 1.363258 1.421445 時間 1.359491 1.400903 1.346093 1.395758 1.429086 1.408518 1.368987 意味 1.393364 1.331455 1.358383 1.396727 1.413654 1.393795 1.437745 必要 1.393632 1.377966 1.370283 1.421780 1.425381 1.434612 1.328704 お礼 1.385651 1.353387 1.366220 1.425215 1.432175 1.429380 1.428976 不安 1.332726 1.387384 1.333010 1.382071 1.411242 1.335334 1.378477 内容 1.320064 1.273957 1.319102 1.351628 1.411242 1.407825 1.404842 期待 1.320064 1.387384 1.439445 1.426518 1.411242 1.407825 1.430722 日常 1.429991 1.440753 1.413587 1.411858 1.411242 1.431173 1.430722 難しい 1.370010 1.400917 1.360400 1.426518 1.434296 1.407825 1.430722 自由 1.406306 1.427598 1.426575 1.397044 1.387804 1.407825 1.404842 不愉快 1.352764 1.340870 1.413654 1.425215 1.390635 1.408505 1.405842 くだらない 1.406306 1.387384 1.387249 1.426518 1.411242 1.407825 1.404842 厳しい 1.390923 1.384499 1.417833 1.416998 1.430090 1.305075 1.427261 感心 1.381664 1.344997 1.346081 1.416565 1.427633 1.400524 1.425240 まじめ 1.372512 1.430483 1.320442 1.382465 1.426514 1.424597 1.424320 皮肉 1.423954 1.346844 1.423154 1.423719 1.354716 1.420212 1.345258 ユーモア 1.423954 1.423620 1.423154 1.423719 1.421321 1.420212 1.420051 笑い 1.355839 1.265419 1.423154 1.423719 1.421321 1.420212 1.420051 便利 ない 多い 気軽 疑問 暇つぶし 非常 回答 人 自分 知識 意見 情報 便利 ない 1.345314 多い 1.428361 1.361024 気軽 1.400823 1.406008 1.378122 疑問 1.435051 1.445307 1.401886 1.389577 暇つぶし 1.420690 1.406712 1.396373 1.446274 1.443332 非常 1.326716 1.397553 1.357675 1.414849 1.390329 1.440654 利用 1.447910 1.403952 1.373900 1.390190 1.376169 1.438379 1.296508 楽しい 1.415972 1.401795 1.400792 1.410072 1.441355 1.402119 1.389720 いろいろ 1.414214 1.368703 1.410944 1.426408 1.391528 1.439218 1.422021 勉強 1.429758 1.411412 1.351490 1.442506 1.440563 1.422021 1.369132 考え 1.429758 1.383086 1.396317 1.426408 1.440563 1.422021 1.386986 悩み 1.442635 1.395315 1.423356 1.424121 1.372681 1.420002 1.420002 面白い 1.442327 1.376054 1.390326 1.404825 1.438166 1.418308 1.399426 考え方 1.438827 1.434079 1.402605 1.418889 1.435180 1.415058 1.434108 相談 1.404525 1.355835 1.402605 1.345163 1.417279 1.434108 1.415058 たくさん 1.367103 1.386332 1.402026 1.400154 1.379102 1.435088 1.353364 時間 1.384109 1.419264 1.419135 1.419390 1.397522 1.436228 1.436228 意味 1.440036 1.265367 1.367700 1.419120 1.436212 1.435088 1.310593 必要 1.320003 1.248749 1.402270 1.434148 1.432775 1.395870 1.395870 お礼 1.430418 1.333869 1.427584 1.429034 1.289232 1.427305 1.279198 不安 1.403918 1.428832 1.402734 1.370678 1.369344 1.428854 1.397111 内容 1.403918 1.350963 1.402734 1.401054 1.429644 1.428854 1.428854 期待 1.432334 1.350963 1.320267 1.430787 1.429644 1.397111 1.428854 日常 1.374916 1.428832 1.429166 1.401054 1.338175 1.397111 1.331356 難しい 1.403918 1.403356 1.429166 1.370678 1.429644 1.428854 1.428854 自由 1.432334 1.403356 1.402734 1.401054 1.429644 1.428854 1.364629 不愉快 1.430418 1.427285 1.225898 1.429034 1.428012 1.427305 1.427305 くだらない 1.432334 1.428832 1.402734 1.430787 1.399819 1.428854 1.397111 厳しい 1.428536 1.425765 1.286626 1.269589 1.426408 1.425783 1.385481 感心 1.426319 1.423976 1.395887 1.425284 1.359862 1.423990 1.423990 まじめ 1.425309 1.381252 1.379871 1.424360 1.423659 1.423174 1.370877 皮肉 1.420624 1.419381 1.343133 1.420074 1.419669 1.419389 1.419389 ユーモア 1.420624 1.419381 1.419500 1.420074 1.419669 1.419389 1.419389 笑い 1.420624 1.345837 1.343133 1.333905 1.419669 1.419389 1.419389 利用 楽しい いろいろ 勉強 考え 悩み 面白い 回答 人 自分 知識 意見 情報 便利 ない 多い 気軽 疑問 暇つぶし 非常 利用 楽しい 1.424192 いろいろ 1.437799 1.381780 勉強 1.366732 1.362340 1.430872 考え 1.437799 1.438523 1.291606 1.376857 悩み 1.400821 1.436553 1.429518 1.429518 1.429518 面白い 1.358524 1.416088 1.370789 1.400376 1.400376 1.428121 考え方 1.432978 1.433554 1.397854 1.367607 1.427459 1.396808 1.426250 相談 1.354094 1.433554 1.427459 1.427459 1.427459 1.335696 1.426250 たくさん 1.372226 1.412815 1.428113 1.428113 1.397037 1.395939 1.393181 時間 1.413611 1.412738 1.428875 1.396085 1.396085 1.427683 1.427536 意味 1.329521 1.412815 1.428113 1.397037 1.397037 1.395939 1.358685 必要 1.430824 1.431334 1.398197 1.369895 1.425936 1.424983 1.424865 お礼 1.338478 1.426939 1.422923 1.422923 1.422923 1.422213 1.422126 不安 1.428020 1.358661 1.423955 1.423955 1.423955 1.423162 1.423064 内容 1.395853 1.428445 1.423955 1.423955 1.423955 1.423162 1.423064 期待 1.395853 1.428445 1.423955 1.423955 1.374557 1.423162 1.369539 日常 1.395853 1.393990 1.423955 1.423955 1.423955 1.373827 1.423064 難しい 1.362926 1.393990 1.423955 1.423955 1.423955 1.373827 1.423064 自由 1.428020 1.428445 1.423955 1.423955 1.374557 1.423162 1.423064 不愉快 1.426559 1.364673 1.422923 1.422923 1.422923 1.422213 1.422126 くだらない 1.329184 1.393990 1.423955 1.423955 1.423955 1.373827 1.423064 厳しい 1.425123 1.381705 1.359127 1.421909 1.421909 1.358588 1.353157 感心 1.423433 1.423717 1.420715 1.420715 1.420715 1.420185 1.420120 まじめ 1.369674 1.366128 1.420172 1.420172 1.420172 1.419686 1.419626 皮肉 1.419093 1.419244 1.417653 1.417653 1.417653 1.417373 1.417338 ユーモア 1.419093 1.419244 1.417653 1.417653 1.417653 1.417373 1.417338 笑い 1.419093 1.319151 1.417653 1.417653 1.417653 1.417373 1.417338 考え方 相談 たくさん 時間 意味 必要 お礼 回答 人 自分 知識 意見 情報 便利 ない 多い 気軽 疑問 暇つぶし 非常 利用 楽しい いろいろ 勉強 考え 悩み 面白い 考え方 相談 1.424744 たくさん 1.390875 1.425264 時間 1.389579 1.352314 1.426446 意味 1.355614 1.355614 1.389707 1.426446 必要 1.423532 1.423532 1.423993 1.424529 1.423993 お礼 1.421135 1.421135 1.370240 1.421876 1.317011 1.420338 不安 1.421956 1.421956 1.422339 1.422785 1.422339 1.421064 1.419301 内容 1.367285 1.421956 1.422339 1.422785 1.422339 1.421064 1.419301 期待 1.421956 1.421956 1.364916 1.422785 1.364916 1.421064 1.419301 日常 1.367285 1.421956 1.422339 1.422785 1.422339 1.421064 1.419301 難しい 1.421956 1.421956 1.422339 1.422785 1.422339 1.369892 1.419301 自由 1.421956 1.421956 1.422339 1.422785 1.422339 1.421064 1.419301 不愉快 1.421135 1.372350 1.370240 1.421876 1.421477 1.420338 1.418761 くだらない 1.421956 1.421956 1.422339 1.422785 1.422339 1.421064 1.419301 厳しい 1.420329 1.350829 1.420631 1.420984 1.420631 1.419624 1.418231 感心 1.360876 1.419380 1.358176 1.419933 1.419636 1.418784 1.330175 まじめ 1.418948 1.328542 1.419182 1.419455 1.419182 1.418402 1.417323 皮肉 1.416946 1.416946 1.417081 1.417239 1.417081 1.416631 1.416008 ユーモア 1.256163 1.416946 1.417081 1.417239 1.417081 1.416631 1.416008 笑い 1.416946 1.416946 1.417081 1.417239 1.247804 1.416631 1.416008 不安 内容 期待 日常 難しい 自由 不愉快 回答 人 自分 知識 意見 情報 便利 ない 多い 気軽 疑問 暇つぶし 非常 利用 楽しい いろいろ 勉強 考え 悩み 面白い 考え方 相談 たくさん 時間 意味 必要 お礼 不安 内容 1.419905 期待 1.419905 1.419905 日常 1.419905 1.419905 1.419905 難しい 1.419905 1.419905 1.419905 1.419905 自由 1.419905 1.419905 1.419905 1.419905 1.419905 不愉快 1.419301 1.419301 1.337605 1.419301 1.419301 1.419301 くだらない 1.419905 1.419905 1.419905 1.328199 1.419905 1.419905 1.419301 厳しい 1.418708 1.418708 1.418708 1.418708 1.418708 1.418708 1.418231 感心 1.418010 1.418010 1.418010 1.418010 1.418010 1.418010 1.417607 まじめ 1.417693 1.417693 1.417693 1.417693 1.417693 1.417693 1.417323 皮肉 1.416221 1.416221 1.416221 1.416221 1.416221 1.416221 1.170586 ユーモア 1.416221 1.416221 1.416221 1.416221 1.416221 1.416221 1.416008 笑い 1.416221 1.416221 1.416221 1.416221 1.416221 1.416221 1.416008 くだらない 厳しい 感心 まじめ 皮肉 ユーモア 回答 人 自分 知識 意見 情報 便利 ない 多い 気軽 疑問 暇つぶし 非常 利用 楽しい いろいろ 勉強 考え 悩み 面白い 考え方 相談 たくさん 時間 意味 必要 お礼 不安 内容 期待 日常 難しい 自由 不愉快 くだらない 厳しい 1.418708 感心 1.418010 1.417211 まじめ 1.417693 1.416961 1.416534 皮肉 1.416221 1.415799 1.415552 1.415440 ユーモア 1.416221 1.415799 1.415552 1.415440 1.414921 笑い 1.416221 1.415799 1.415552 1.415440 1.414921 1.414921 > chiebukuro2.hc<-hclust(chiebukuro2.d,"ward") > (chiebukuro2.hc<-hclust(chiebukuro2.d,"ward")) Call: hclust(d = chiebukuro2.d, method = "ward") Cluster method : ward Distance : euclidean Number of objects: 42 > plot(chiebukuro2.hc) > plot(chiebukuro2.hc,hang=-1) |
多次元尺度構成法
多次元尺度構成法(Multi-Dimensional Scaling:MDS)も、クラスター分析と同じく、 対象間の関連性を表すデータを分析する手法。 距離的データを用いて、データに潜む空間構造を描き出す。
> (chiebukuro2.cmd<-cmdscale(chiebukuro2.d)) [,1] [,2] 質問 0.509525827 -0.3032272426 回答 0.540199526 -0.2110361492 人 0.308319043 0.0552368705 自分 0.443476937 0.3975347299 知識 0.211087510 0.4917804558 意見 0.188599701 0.1413663405 情報 0.069834527 0.3269972135 便利 -0.267461938 -0.1822630417 ない 0.131122220 -0.3316297733 多い 0.303139769 -0.1087341078 気軽 -0.149478307 -0.2741481378 疑問 -0.095380691 0.0179540018 暇つぶし -0.292233787 0.0551359232 非常 -0.030290090 -0.1690447725 利用 0.007326799 -0.1990228770 楽しい -0.052578891 -0.0320728216 いろいろ -0.054764617 0.2522017980 勉強 0.192900115 0.1617330454 考え 0.002043645 0.3174377472 悩み -0.130431027 0.0817035408 面白い -0.046085406 -0.0206206030 考え方 -0.132879430 0.2820134733 相談 -0.124865628 -0.1715202095 たくさん -0.112231369 -0.0432577540 時間 -0.067904334 0.0812613785 意味 0.024208122 -0.3102774552 必要 -0.098795192 -0.0560899883 お礼 -0.102499402 -0.2316910088 不安 0.017273135 0.0513067605 内容 0.185764306 -0.0270334025 期待 -0.014018488 -0.1060878822 日常 -0.365166915 0.0717895932 難しい -0.147840120 -0.0764183457 自由 -0.141904181 0.1164982088 不愉快 0.031628524 0.0207120256 くだらない -0.192625594 0.0422077074 厳しい -0.109825256 -0.0669263350 感心 -0.077310466 -0.0007989093 まじめ -0.076277083 -0.0465673964 皮肉 -0.051229911 0.1454426162 ユーモア -0.269775301 0.1593793123 笑い 0.037403717 -0.3012245289 > plot(chiebukuro2.cmd,type="n") > text(chiebukuro2.cmd,rownames(chiebukuro2.cmd)) #3次元空間における座標値を求めるなら、引数kを加える > chiebukuro2.cmd<-cmdscale(chiebukuro2.d,k=3) |
対応分析
対応分析は、質的変数に関するクロス集計表をもとにして、 行の要素と列の要素の相関係数が最大になるように数量化して、次元縮約を行う方法。
> chiebukuro3<-read.csv("corresp.csv",header=T,row.names=1) > library(MASS) > chiebukuro3.ca<-corresp(chiebukuro3,nf=4) > chiebukuro3.eig<-chiebukuro3.ca$cor^2 > round(chiebukuro3.eig,3) [1] 0.038 0.018 0.013 0.000 > chiebukuro3.proportion<-round(100*chiebukuro3.eig/sum(chiebukuro3.eig),2) > chiebukuro3.proportion [1] 54.76 25.70 19.54 0.00 > chiebukuro3_1.ca<-corresp(chiebukuro3,nf=2) > chiebukuro3_1.ca$cscore [,1] [,2] X1 -1.0624761 0.7677465 X2 -1.3125559 -1.1580316 X3 0.9367963 0.4648805 X4 0.6049090 -2.0419396 > chiebukuro3_1.ca$rscore [,1] [,2] 場 -0.66333687 -0.21897111 質問 0.07188114 0.53595358 回答 -0.22928282 0.09302460 自分 -0.67793734 0.36756314 人 1.07709936 0.32686712 場所 0.09439027 -0.78852526 知識 -1.65771780 1.45759285 知恵袋 0.82280780 0.28957452 便利 0.07356372 -1.42259062 意見 1.45969401 -0.97203693 情報 -1.07702632 1.25419954 気軽 0.05503589 -0.74334397 多い -0.35156044 0.42842278 疑問 -0.67303303 -1.19987188 ない -0.88279201 -0.60198505 暇つぶし -0.82212767 0.14963971 非常 -0.61645046 -0.77556345 楽しい 1.04095271 1.11145771 利用 0.12368180 1.27671443 良い -0.62812108 -0.05975259 答え 0.32024741 1.16722551 いい 0.22624346 -1.46803438 解決 -0.74060083 -2.92149420 他 1.41885719 -0.01279833 他人 -1.12943335 0.96239828 参考 1.05542773 0.52101304 嬉しい 2.60692808 -1.01018162 それ 0.45844026 0.81904371 色々 1.11342385 -1.82414150 役 0.96414801 -0.51483976 知恵 -0.93050745 -2.12713992 いろいろ 1.01781292 0.08842139 勉強 1.01781292 0.08842139 考え -0.39415124 -1.01549213 私 2.23120985 1.18155996 今 3.65553748 1.13204152 悩み 0.55536932 0.49922027 何 -0.03640403 -0.49782676 場合 0.62056168 3.46350068 面白い -0.27945818 -0.69746992 前 2.70300136 -2.54131521 気 -0.40825399 -2.14529668 誰 0.48740610 0.67776642 時間 -0.63325731 1.17345146 掲示板 -2.79614909 1.18174709 たくさん -0.44917414 -0.20567766 コミュニケーション -0.92952859 1.29384965 意味 -2.99865200 -1.11627929 ありがたい 2.78723017 2.74405790 余暇 -6.75991205 -8.70624280 > biplot(chiebukuro3_1.ca) |
Back to R