主成分分析
主成分分析(Principal Component Analysis:PCA)は多くの変数によって記述された量的データについて、 複数の変数間の相関(共分散)を少数個の合成変数(これを主成分という)に縮小し、 データの解釈を容易にするための分析手法である。
(1)データセットの作成
主成分分析を行うためのデータセットとしては、テキスト×語のクロス集計(出現頻度)を用意する。 これを作成するには、TTM(TinyTextMiner)と呼ばれるソフトウェアを用いると便利である。
> chiebukuro1<-read.csv("princomp.csv", header=T,row.name=1)
> source("all.R",encoding="EUC-JP")
> chiebukuro1.pc <-pca(chiebukuro1)
> chiebukuro1.pc
主成分分析の結果
PC1 PC2 PC3 PC4 PC5 PC6 PC7 PC8 PC9 PC10 PC11 PC12 PC13 PC14 PC15 PC16 PC17 PC18 PC19 Contribution
質問 -0.651 0.146 0.150 0.003 0.107 -0.178 0.154 0.033 -0.067 0.129 -0.170 -0.026 -0.150 -0.043 0.128 -0.028 0.025 -0.119 0.015 0.642
回答 -0.633 0.047 0.128 -0.079 -0.047 -0.305 0.072 -0.190 0.007 0.104 0.120 -0.089 -0.073 -0.014 0.010 -0.052 0.029 0.119 -0.087 0.627
人 -0.548 -0.106 -0.302 0.037 0.079 0.163 0.154 0.188 0.114 0.064 -0.093 0.017 0.175 -0.089 0.018 0.095 0.022 -0.037 -0.080 0.579
自分 -0.435 -0.492 -0.186 -0.008 0.004 -0.245 -0.051 0.010 -0.092 0.060 0.012 -0.063 0.079 0.269 -0.053 0.041 -0.069 0.068 0.036 0.639
知識 -0.217 -0.528 0.002 -0.013 -0.170 0.059 -0.141 0.057 -0.212 0.026 0.091 0.018 -0.119 0.152 -0.072 0.032 -0.006 -0.011 0.070 0.484
意見 -0.328 -0.172 -0.131 0.126 0.343 0.112 -0.075 -0.213 0.118 -0.061 -0.055 -0.061 0.199 0.039 -0.083 0.073 -0.067 0.145 0.133 0.472
情報 -0.174 -0.332 0.084 -0.203 0.057 0.215 0.197 0.021 -0.016 -0.089 0.258 0.126 -0.146 -0.207 0.005 -0.028 -0.042 -0.186 0.135 0.488
便利 0.007 0.253 0.018 -0.292 0.081 0.062 0.395 -0.078 -0.034 -0.339 -0.177 0.065 -0.032 0.128 0.092 0.095 -0.127 0.283 -0.032 0.606
ない -0.360 0.280 0.102 -0.503 0.038 0.074 -0.006 0.077 0.129 -0.025 0.166 -0.125 0.098 0.117 0.045 -0.012 0.109 -0.035 0.121 0.598
多い -0.462 0.009 0.385 0.219 -0.079 0.093 -0.023 0.029 -0.003 -0.089 -0.161 -0.061 -0.059 0.099 0.055 -0.164 -0.033 -0.185 -0.074 0.547
気軽 -0.106 0.304 0.115 0.248 0.424 -0.080 -0.054 -0.087 0.020 -0.090 0.041 0.082 -0.349 0.006 -0.047 0.098 -0.060 -0.126 -0.038 0.547
疑問 -0.130 0.037 -0.342 0.272 -0.099 -0.045 0.212 -0.329 0.119 0.067 0.230 -0.033 -0.025 0.038 0.118 -0.208 -0.029 -0.150 0.127 0.546
暇つぶし 0.124 0.022 0.111 -0.085 -0.087 -0.064 -0.047 0.045 -0.053 -0.032 -0.156 -0.265 0.247 0.254 0.101 -0.287 -0.013 -0.247 0.015 0.429
非常 -0.296 0.202 -0.290 -0.008 -0.204 0.252 -0.007 -0.131 -0.292 -0.273 -0.202 0.171 -0.131 0.186 -0.079 0.061 0.031 0.082 0.015 0.634
利用 -0.265 0.213 -0.245 0.145 -0.198 0.117 -0.075 0.219 -0.268 0.115 -0.044 -0.068 -0.220 -0.296 -0.117 -0.017 0.036 0.022 0.084 0.554
楽しい -0.118 0.040 0.151 0.053 0.091 -0.175 -0.090 -0.204 -0.354 -0.150 -0.086 0.170 0.470 -0.186 -0.009 0.014 0.117 0.022 -0.148 0.606
いろいろ -0.103 -0.220 0.008 -0.144 0.269 0.303 -0.154 -0.266 0.126 -0.158 0.144 -0.049 0.064 -0.210 0.106 -0.144 0.312 0.091 -0.061 0.592
勉強 -0.235 -0.209 -0.003 -0.139 -0.072 -0.137 -0.076 0.059 -0.270 -0.055 -0.234 0.079 -0.023 -0.067 -0.242 -0.306 -0.303 0.068 -0.129 0.559
考え -0.131 -0.298 -0.022 -0.231 0.053 0.379 -0.166 -0.082 0.065 -0.008 0.063 0.084 -0.074 -0.088 0.255 0.104 -0.008 -0.130 -0.297 0.550
悩み -0.108 -0.018 -0.226 0.204 0.115 0.015 0.024 0.299 0.090 -0.078 0.366 -0.317 0.242 0.210 -0.093 0.098 -0.182 -0.030 -0.060 0.615
面白い -0.128 0.037 0.018 -0.009 0.040 0.263 -0.343 0.036 0.016 0.075 -0.214 -0.214 -0.090 -0.242 -0.057 -0.090 0.024 0.160 0.176 0.441
考え方 -0.080 -0.217 -0.127 -0.000 -0.105 -0.371 -0.191 0.226 0.351 -0.434 -0.115 0.077 -0.065 -0.066 -0.001 0.006 0.027 -0.045 0.016 0.648
相談 -0.147 0.210 -0.013 0.175 0.216 0.155 0.028 0.499 0.064 0.040 0.204 0.254 0.047 0.154 0.088 -0.122 -0.000 0.046 0.062 0.583
たくさん -0.157 0.095 -0.179 0.075 -0.152 0.230 0.056 -0.082 0.312 -0.071 -0.270 -0.017 0.207 -0.019 -0.012 0.327 -0.217 0.163 -0.170 0.585
時間 -0.076 -0.054 -0.040 -0.022 0.121 -0.037 0.192 0.208 0.070 0.069 0.037 0.371 -0.079 -0.201 0.327 -0.216 -0.408 0.104 -0.103 0.644
意味 -0.275 0.301 -0.064 -0.180 -0.232 0.019 -0.490 0.081 0.055 -0.042 0.235 0.133 0.097 0.026 -0.034 0.114 -0.147 0.071 0.147 0.654
必要 -0.099 0.079 0.085 -0.494 0.056 0.100 0.326 0.072 -0.006 -0.234 0.056 -0.165 0.037 0.020 -0.263 -0.180 -0.033 -0.185 0.078 0.622
お礼 -0.170 0.276 -0.315 -0.018 -0.350 0.094 -0.004 -0.253 0.154 0.094 0.119 0.146 -0.073 0.048 -0.164 -0.222 0.127 -0.075 0.081 0.581
不安 -0.143 -0.049 -0.051 0.118 0.211 -0.085 0.174 -0.248 -0.081 0.029 -0.121 0.165 0.175 -0.082 0.061 0.247 -0.056 -0.286 0.552 0.724
内容 -0.216 -0.031 0.006 -0.121 0.056 -0.318 0.140 0.086 0.125 0.163 -0.037 -0.190 -0.234 0.058 0.141 0.189 0.381 0.370 -0.014 0.669
期待 -0.132 0.094 0.258 -0.008 -0.182 0.151 -0.157 0.048 0.159 0.135 -0.255 -0.292 0.022 -0.017 0.351 0.089 -0.182 -0.214 0.114 0.593
日常 0.012 0.060 -0.218 0.155 -0.124 -0.038 0.094 -0.034 -0.236 -0.486 0.105 -0.220 -0.031 0.059 0.346 -0.007 -0.006 -0.015 -0.056 0.582
難しい -0.053 0.119 -0.029 -0.013 0.139 -0.042 0.147 0.139 -0.050 0.038 0.026 -0.208 0.029 -0.309 -0.448 0.286 -0.042 -0.256 -0.253 0.638
自由 -0.011 -0.069 0.001 -0.039 -0.003 0.108 -0.074 -0.057 -0.094 -0.000 -0.017 0.151 -0.313 0.378 0.003 0.335 0.085 -0.347 -0.253 0.604
不愉快 -0.174 -0.050 0.537 0.332 -0.327 0.148 0.187 0.022 0.111 -0.097 0.036 0.042 0.120 -0.008 -0.043 0.082 0.021 0.092 -0.007 0.652
くだらない -0.046 0.030 -0.142 0.170 -0.106 0.003 0.059 0.065 -0.297 -0.169 0.190 -0.320 -0.038 -0.322 0.260 0.016 0.081 -0.031 -0.094 0.516
厳しい -0.137 0.099 0.120 0.319 0.449 0.153 -0.214 -0.072 0.061 -0.227 -0.034 -0.112 -0.135 0.179 -0.175 -0.277 0.011 0.089 -0.053 0.658
感心 -0.108 0.036 -0.158 0.092 -0.148 -0.102 0.104 -0.190 0.394 0.085 -0.074 0.048 0.071 -0.069 -0.068 -0.232 0.084 -0.176 -0.378 0.545
まじめ -0.117 0.076 -0.066 0.065 0.039 0.099 0.043 0.339 -0.164 0.068 -0.151 0.283 0.311 0.082 0.082 -0.068 0.507 -0.108 -0.071 0.678
皮肉 -0.097 -0.141 0.424 0.228 -0.322 0.149 0.212 -0.007 0.068 -0.141 0.260 0.098 -0.014 -0.036 -0.202 0.070 0.084 0.163 0.081 0.620
ユーモア 0.027 -0.067 -0.040 0.004 -0.066 -0.240 -0.142 0.181 0.301 -0.435 -0.142 0.127 -0.110 -0.192 -0.040 0.039 0.173 -0.195 0.188 0.593
笑い -0.202 0.266 0.208 -0.107 0.004 -0.281 -0.332 -0.167 -0.085 -0.051 0.339 0.166 0.149 -0.066 0.090 0.131 -0.113 -0.053 -0.163 0.630
Eigenvalue 2.557 1.630 1.563 1.438 1.408 1.340 1.321 1.274 1.263 1.197 1.168 1.149 1.128 1.086 1.079 1.066 1.050 1.033 1.023
Contribution 0.061 0.039 0.037 0.034 0.034 0.032 0.031 0.030 0.030 0.028 0.028 0.027 0.027 0.026 0.026 0.025 0.025 0.025 0.024
Cum.contrib. 0.061 0.100 0.137 0.171 0.205 0.237 0.268 0.298 0.328 0.357 0.385 0.412 0.439 0.465 0.490 0.516 0.541 0.565 0.590
>
|
> plot(chiebukuro1.pc$factor.loadings[,1:2],type="n") > text(chiebukuro1.pc$factor.loadings,colnames(chiebukuro1)) |
クラスター分析
クラスター分析は、対象間の関連性を表すデータを分析する手法の1つで、 分析データのパターンが似ている個体を同じグループ(クラスター)にまとめる分析手法である。
> chiebukuro2<-chiebukuro1.pc$factor.loadings
50 件以上の警告がありました (警告を見るには warnings() を使って下さい)
> chiebukuro2.d<-dist(chiebukuro2)
> chiebukuro2.d
質問 回答 人 自分 知識 意見 情報
回答 1.073091
人 1.228657 1.296544
自分 1.289410 1.224702 1.276411
知識 1.385570 1.383880 1.357386 1.166915
意見 1.355432 1.322992 1.278015 1.262653 1.419809
情報 1.373373 1.387072 1.350185 1.368052 1.321486 1.381630
便利 1.388767 1.397390 1.432940 1.462324 1.470360 1.438585 1.425782
ない 1.255823 1.273838 1.355371 1.386823 1.433001 1.370268 1.374740
多い 1.195266 1.284742 1.281412 1.362266 1.356111 1.375119 1.372606
気軽 1.304586 1.389801 1.431879 1.453480 1.464688 1.393470 1.428015
疑問 1.398136 1.342317 1.355619 1.353550 1.422615 1.381785 1.424601
暇つぶし 1.447372 1.449660 1.451562 1.431597 1.433255 1.449460 1.447439
非常 1.322178 1.353842 1.308873 1.389597 1.383516 1.365648 1.420112
利用 1.315612 1.353043 1.337766 1.395101 1.396429 1.405010 1.407840
楽しい 1.363748 1.367374 1.417672 1.385306 1.411239 1.393553 1.425780
いろいろ 1.403096 1.394130 1.386034 1.404090 1.371915 1.311154 1.356093
勉強 1.342703 1.317807 1.363962 1.311637 1.358736 1.378739 1.385458
考え 1.435550 1.386686 1.318709 1.371192 1.345429 1.391862 1.326078
悩み 1.418862 1.397851 1.307446 1.342220 1.420638 1.389528 1.411939
面白い 1.379499 1.400466 1.343806 1.430093 1.376414 1.398995 1.424639
考え方 1.408857 1.410317 1.385451 1.313989 1.385317 1.409071 1.405395
相談 1.342371 1.418389 1.336249 1.441894 1.413680 1.394767 1.421104
たくさん 1.408591 1.410124 1.287556 1.396727 1.428314 1.363258 1.421445
時間 1.359491 1.400903 1.346093 1.395758 1.429086 1.408518 1.368987
意味 1.393364 1.331455 1.358383 1.396727 1.413654 1.393795 1.437745
必要 1.393632 1.377966 1.370283 1.421780 1.425381 1.434612 1.328704
お礼 1.385651 1.353387 1.366220 1.425215 1.432175 1.429380 1.428976
不安 1.332726 1.387384 1.333010 1.382071 1.411242 1.335334 1.378477
内容 1.320064 1.273957 1.319102 1.351628 1.411242 1.407825 1.404842
期待 1.320064 1.387384 1.439445 1.426518 1.411242 1.407825 1.430722
日常 1.429991 1.440753 1.413587 1.411858 1.411242 1.431173 1.430722
難しい 1.370010 1.400917 1.360400 1.426518 1.434296 1.407825 1.430722
自由 1.406306 1.427598 1.426575 1.397044 1.387804 1.407825 1.404842
不愉快 1.352764 1.340870 1.413654 1.425215 1.390635 1.408505 1.405842
くだらない 1.406306 1.387384 1.387249 1.426518 1.411242 1.407825 1.404842
厳しい 1.390923 1.384499 1.417833 1.416998 1.430090 1.305075 1.427261
感心 1.381664 1.344997 1.346081 1.416565 1.427633 1.400524 1.425240
まじめ 1.372512 1.430483 1.320442 1.382465 1.426514 1.424597 1.424320
皮肉 1.423954 1.346844 1.423154 1.423719 1.354716 1.420212 1.345258
ユーモア 1.423954 1.423620 1.423154 1.423719 1.421321 1.420212 1.420051
笑い 1.355839 1.265419 1.423154 1.423719 1.421321 1.420212 1.420051
便利 ない 多い 気軽 疑問 暇つぶし 非常
回答
人
自分
知識
意見
情報
便利
ない 1.345314
多い 1.428361 1.361024
気軽 1.400823 1.406008 1.378122
疑問 1.435051 1.445307 1.401886 1.389577
暇つぶし 1.420690 1.406712 1.396373 1.446274 1.443332
非常 1.326716 1.397553 1.357675 1.414849 1.390329 1.440654
利用 1.447910 1.403952 1.373900 1.390190 1.376169 1.438379 1.296508
楽しい 1.415972 1.401795 1.400792 1.410072 1.441355 1.402119 1.389720
いろいろ 1.414214 1.368703 1.410944 1.426408 1.391528 1.439218 1.422021
勉強 1.429758 1.411412 1.351490 1.442506 1.440563 1.422021 1.369132
考え 1.429758 1.383086 1.396317 1.426408 1.440563 1.422021 1.386986
悩み 1.442635 1.395315 1.423356 1.424121 1.372681 1.420002 1.420002
面白い 1.442327 1.376054 1.390326 1.404825 1.438166 1.418308 1.399426
考え方 1.438827 1.434079 1.402605 1.418889 1.435180 1.415058 1.434108
相談 1.404525 1.355835 1.402605 1.345163 1.417279 1.434108 1.415058
たくさん 1.367103 1.386332 1.402026 1.400154 1.379102 1.435088 1.353364
時間 1.384109 1.419264 1.419135 1.419390 1.397522 1.436228 1.436228
意味 1.440036 1.265367 1.367700 1.419120 1.436212 1.435088 1.310593
必要 1.320003 1.248749 1.402270 1.434148 1.432775 1.395870 1.395870
お礼 1.430418 1.333869 1.427584 1.429034 1.289232 1.427305 1.279198
不安 1.403918 1.428832 1.402734 1.370678 1.369344 1.428854 1.397111
内容 1.403918 1.350963 1.402734 1.401054 1.429644 1.428854 1.428854
期待 1.432334 1.350963 1.320267 1.430787 1.429644 1.397111 1.428854
日常 1.374916 1.428832 1.429166 1.401054 1.338175 1.397111 1.331356
難しい 1.403918 1.403356 1.429166 1.370678 1.429644 1.428854 1.428854
自由 1.432334 1.403356 1.402734 1.401054 1.429644 1.428854 1.364629
不愉快 1.430418 1.427285 1.225898 1.429034 1.428012 1.427305 1.427305
くだらない 1.432334 1.428832 1.402734 1.430787 1.399819 1.428854 1.397111
厳しい 1.428536 1.425765 1.286626 1.269589 1.426408 1.425783 1.385481
感心 1.426319 1.423976 1.395887 1.425284 1.359862 1.423990 1.423990
まじめ 1.425309 1.381252 1.379871 1.424360 1.423659 1.423174 1.370877
皮肉 1.420624 1.419381 1.343133 1.420074 1.419669 1.419389 1.419389
ユーモア 1.420624 1.419381 1.419500 1.420074 1.419669 1.419389 1.419389
笑い 1.420624 1.345837 1.343133 1.333905 1.419669 1.419389 1.419389
利用 楽しい いろいろ 勉強 考え 悩み 面白い
回答
人
自分
知識
意見
情報
便利
ない
多い
気軽
疑問
暇つぶし
非常
利用
楽しい 1.424192
いろいろ 1.437799 1.381780
勉強 1.366732 1.362340 1.430872
考え 1.437799 1.438523 1.291606 1.376857
悩み 1.400821 1.436553 1.429518 1.429518 1.429518
面白い 1.358524 1.416088 1.370789 1.400376 1.400376 1.428121
考え方 1.432978 1.433554 1.397854 1.367607 1.427459 1.396808 1.426250
相談 1.354094 1.433554 1.427459 1.427459 1.427459 1.335696 1.426250
たくさん 1.372226 1.412815 1.428113 1.428113 1.397037 1.395939 1.393181
時間 1.413611 1.412738 1.428875 1.396085 1.396085 1.427683 1.427536
意味 1.329521 1.412815 1.428113 1.397037 1.397037 1.395939 1.358685
必要 1.430824 1.431334 1.398197 1.369895 1.425936 1.424983 1.424865
お礼 1.338478 1.426939 1.422923 1.422923 1.422923 1.422213 1.422126
不安 1.428020 1.358661 1.423955 1.423955 1.423955 1.423162 1.423064
内容 1.395853 1.428445 1.423955 1.423955 1.423955 1.423162 1.423064
期待 1.395853 1.428445 1.423955 1.423955 1.374557 1.423162 1.369539
日常 1.395853 1.393990 1.423955 1.423955 1.423955 1.373827 1.423064
難しい 1.362926 1.393990 1.423955 1.423955 1.423955 1.373827 1.423064
自由 1.428020 1.428445 1.423955 1.423955 1.374557 1.423162 1.423064
不愉快 1.426559 1.364673 1.422923 1.422923 1.422923 1.422213 1.422126
くだらない 1.329184 1.393990 1.423955 1.423955 1.423955 1.373827 1.423064
厳しい 1.425123 1.381705 1.359127 1.421909 1.421909 1.358588 1.353157
感心 1.423433 1.423717 1.420715 1.420715 1.420715 1.420185 1.420120
まじめ 1.369674 1.366128 1.420172 1.420172 1.420172 1.419686 1.419626
皮肉 1.419093 1.419244 1.417653 1.417653 1.417653 1.417373 1.417338
ユーモア 1.419093 1.419244 1.417653 1.417653 1.417653 1.417373 1.417338
笑い 1.419093 1.319151 1.417653 1.417653 1.417653 1.417373 1.417338
考え方 相談 たくさん 時間 意味 必要 お礼
回答
人
自分
知識
意見
情報
便利
ない
多い
気軽
疑問
暇つぶし
非常
利用
楽しい
いろいろ
勉強
考え
悩み
面白い
考え方
相談 1.424744
たくさん 1.390875 1.425264
時間 1.389579 1.352314 1.426446
意味 1.355614 1.355614 1.389707 1.426446
必要 1.423532 1.423532 1.423993 1.424529 1.423993
お礼 1.421135 1.421135 1.370240 1.421876 1.317011 1.420338
不安 1.421956 1.421956 1.422339 1.422785 1.422339 1.421064 1.419301
内容 1.367285 1.421956 1.422339 1.422785 1.422339 1.421064 1.419301
期待 1.421956 1.421956 1.364916 1.422785 1.364916 1.421064 1.419301
日常 1.367285 1.421956 1.422339 1.422785 1.422339 1.421064 1.419301
難しい 1.421956 1.421956 1.422339 1.422785 1.422339 1.369892 1.419301
自由 1.421956 1.421956 1.422339 1.422785 1.422339 1.421064 1.419301
不愉快 1.421135 1.372350 1.370240 1.421876 1.421477 1.420338 1.418761
くだらない 1.421956 1.421956 1.422339 1.422785 1.422339 1.421064 1.419301
厳しい 1.420329 1.350829 1.420631 1.420984 1.420631 1.419624 1.418231
感心 1.360876 1.419380 1.358176 1.419933 1.419636 1.418784 1.330175
まじめ 1.418948 1.328542 1.419182 1.419455 1.419182 1.418402 1.417323
皮肉 1.416946 1.416946 1.417081 1.417239 1.417081 1.416631 1.416008
ユーモア 1.256163 1.416946 1.417081 1.417239 1.417081 1.416631 1.416008
笑い 1.416946 1.416946 1.417081 1.417239 1.247804 1.416631 1.416008
不安 内容 期待 日常 難しい 自由 不愉快
回答
人
自分
知識
意見
情報
便利
ない
多い
気軽
疑問
暇つぶし
非常
利用
楽しい
いろいろ
勉強
考え
悩み
面白い
考え方
相談
たくさん
時間
意味
必要
お礼
不安
内容 1.419905
期待 1.419905 1.419905
日常 1.419905 1.419905 1.419905
難しい 1.419905 1.419905 1.419905 1.419905
自由 1.419905 1.419905 1.419905 1.419905 1.419905
不愉快 1.419301 1.419301 1.337605 1.419301 1.419301 1.419301
くだらない 1.419905 1.419905 1.419905 1.328199 1.419905 1.419905 1.419301
厳しい 1.418708 1.418708 1.418708 1.418708 1.418708 1.418708 1.418231
感心 1.418010 1.418010 1.418010 1.418010 1.418010 1.418010 1.417607
まじめ 1.417693 1.417693 1.417693 1.417693 1.417693 1.417693 1.417323
皮肉 1.416221 1.416221 1.416221 1.416221 1.416221 1.416221 1.170586
ユーモア 1.416221 1.416221 1.416221 1.416221 1.416221 1.416221 1.416008
笑い 1.416221 1.416221 1.416221 1.416221 1.416221 1.416221 1.416008
くだらない 厳しい 感心 まじめ 皮肉 ユーモア
回答
人
自分
知識
意見
情報
便利
ない
多い
気軽
疑問
暇つぶし
非常
利用
楽しい
いろいろ
勉強
考え
悩み
面白い
考え方
相談
たくさん
時間
意味
必要
お礼
不安
内容
期待
日常
難しい
自由
不愉快
くだらない
厳しい 1.418708
感心 1.418010 1.417211
まじめ 1.417693 1.416961 1.416534
皮肉 1.416221 1.415799 1.415552 1.415440
ユーモア 1.416221 1.415799 1.415552 1.415440 1.414921
笑い 1.416221 1.415799 1.415552 1.415440 1.414921 1.414921
> chiebukuro2.hc<-hclust(chiebukuro2.d,"ward")
> (chiebukuro2.hc<-hclust(chiebukuro2.d,"ward"))
Call:
hclust(d = chiebukuro2.d, method = "ward")
Cluster method : ward
Distance : euclidean
Number of objects: 42
> plot(chiebukuro2.hc)
> plot(chiebukuro2.hc,hang=-1)
|
多次元尺度構成法
多次元尺度構成法(Multi-Dimensional Scaling:MDS)も、クラスター分析と同じく、 対象間の関連性を表すデータを分析する手法。 距離的データを用いて、データに潜む空間構造を描き出す。
> (chiebukuro2.cmd<-cmdscale(chiebukuro2.d))
[,1] [,2]
質問 0.509525827 -0.3032272426
回答 0.540199526 -0.2110361492
人 0.308319043 0.0552368705
自分 0.443476937 0.3975347299
知識 0.211087510 0.4917804558
意見 0.188599701 0.1413663405
情報 0.069834527 0.3269972135
便利 -0.267461938 -0.1822630417
ない 0.131122220 -0.3316297733
多い 0.303139769 -0.1087341078
気軽 -0.149478307 -0.2741481378
疑問 -0.095380691 0.0179540018
暇つぶし -0.292233787 0.0551359232
非常 -0.030290090 -0.1690447725
利用 0.007326799 -0.1990228770
楽しい -0.052578891 -0.0320728216
いろいろ -0.054764617 0.2522017980
勉強 0.192900115 0.1617330454
考え 0.002043645 0.3174377472
悩み -0.130431027 0.0817035408
面白い -0.046085406 -0.0206206030
考え方 -0.132879430 0.2820134733
相談 -0.124865628 -0.1715202095
たくさん -0.112231369 -0.0432577540
時間 -0.067904334 0.0812613785
意味 0.024208122 -0.3102774552
必要 -0.098795192 -0.0560899883
お礼 -0.102499402 -0.2316910088
不安 0.017273135 0.0513067605
内容 0.185764306 -0.0270334025
期待 -0.014018488 -0.1060878822
日常 -0.365166915 0.0717895932
難しい -0.147840120 -0.0764183457
自由 -0.141904181 0.1164982088
不愉快 0.031628524 0.0207120256
くだらない -0.192625594 0.0422077074
厳しい -0.109825256 -0.0669263350
感心 -0.077310466 -0.0007989093
まじめ -0.076277083 -0.0465673964
皮肉 -0.051229911 0.1454426162
ユーモア -0.269775301 0.1593793123
笑い 0.037403717 -0.3012245289
> plot(chiebukuro2.cmd,type="n")
> text(chiebukuro2.cmd,rownames(chiebukuro2.cmd))
#3次元空間における座標値を求めるなら、引数kを加える
> chiebukuro2.cmd<-cmdscale(chiebukuro2.d,k=3)
|
対応分析
対応分析は、質的変数に関するクロス集計表をもとにして、 行の要素と列の要素の相関係数が最大になるように数量化して、次元縮約を行う方法。
> chiebukuro3<-read.csv("corresp.csv",header=T,row.names=1)
> library(MASS)
> chiebukuro3.ca<-corresp(chiebukuro3,nf=4)
> chiebukuro3.eig<-chiebukuro3.ca$cor^2
> round(chiebukuro3.eig,3)
[1] 0.038 0.018 0.013 0.000
> chiebukuro3.proportion<-round(100*chiebukuro3.eig/sum(chiebukuro3.eig),2)
> chiebukuro3.proportion
[1] 54.76 25.70 19.54 0.00
> chiebukuro3_1.ca<-corresp(chiebukuro3,nf=2)
> chiebukuro3_1.ca$cscore
[,1] [,2]
X1 -1.0624761 0.7677465
X2 -1.3125559 -1.1580316
X3 0.9367963 0.4648805
X4 0.6049090 -2.0419396
> chiebukuro3_1.ca$rscore
[,1] [,2]
場 -0.66333687 -0.21897111
質問 0.07188114 0.53595358
回答 -0.22928282 0.09302460
自分 -0.67793734 0.36756314
人 1.07709936 0.32686712
場所 0.09439027 -0.78852526
知識 -1.65771780 1.45759285
知恵袋 0.82280780 0.28957452
便利 0.07356372 -1.42259062
意見 1.45969401 -0.97203693
情報 -1.07702632 1.25419954
気軽 0.05503589 -0.74334397
多い -0.35156044 0.42842278
疑問 -0.67303303 -1.19987188
ない -0.88279201 -0.60198505
暇つぶし -0.82212767 0.14963971
非常 -0.61645046 -0.77556345
楽しい 1.04095271 1.11145771
利用 0.12368180 1.27671443
良い -0.62812108 -0.05975259
答え 0.32024741 1.16722551
いい 0.22624346 -1.46803438
解決 -0.74060083 -2.92149420
他 1.41885719 -0.01279833
他人 -1.12943335 0.96239828
参考 1.05542773 0.52101304
嬉しい 2.60692808 -1.01018162
それ 0.45844026 0.81904371
色々 1.11342385 -1.82414150
役 0.96414801 -0.51483976
知恵 -0.93050745 -2.12713992
いろいろ 1.01781292 0.08842139
勉強 1.01781292 0.08842139
考え -0.39415124 -1.01549213
私 2.23120985 1.18155996
今 3.65553748 1.13204152
悩み 0.55536932 0.49922027
何 -0.03640403 -0.49782676
場合 0.62056168 3.46350068
面白い -0.27945818 -0.69746992
前 2.70300136 -2.54131521
気 -0.40825399 -2.14529668
誰 0.48740610 0.67776642
時間 -0.63325731 1.17345146
掲示板 -2.79614909 1.18174709
たくさん -0.44917414 -0.20567766
コミュニケーション -0.92952859 1.29384965
意味 -2.99865200 -1.11627929
ありがたい 2.78723017 2.74405790
余暇 -6.75991205 -8.70624280
> biplot(chiebukuro3_1.ca)
|
Back to R






