クラスタの特徴を知る - radarchart

クラスタリングを行ったあと、各クラスタがどんな特徴を持っているのか知りたいときはレーダーチャートを書いたりする。 radarchart関数を使う

radarchart(df)でとりあえずのレーダーチャートはかける。ここで与えるデータフレームは

df
The data frame to be used to draw radarchart. If maxmin is TRUE, this must include maximum values as row 1 and minimum values as row 2 for each variables, and actual data should be given as row 3 and lower rows. The number of columns (variables) must be more than 2.
radarchart function | R Documentation

1行目がmax、2行目がmin、3行目からが実際に可視化するデータとなっていなければならない。

kmeansを実行したデータフレームに適用する例

state.km <- kmeans(scale(state.x77[,1:6]),3)
df <- as.data.frame(scale(state.km$centers))
dfmax <- apply(df, 2, max)
dfmin <- apply(df, 2, min)
df <- rbind(dfmax, dfmin, df)

f:id:kimoppy126:20180527131910p:plain

ただこれだと、データのmax、minがレーダーチャートのmax、minとなってしまうため少し見づらい。

df.maxに +1、df.min に-1してやると、見やすくなる。

dfmax <- apply(df, 2, max) + 1
dfmin <- apply(df, 2, min) - 1
df <- rbind(dfmax, dfmin, df)

f:id:kimoppy126:20180527131917p:plain

まめち。

改訂2版 データサイエンティスト養成読本 [プロになるためのデータ分析力が身につく! ] (Software Design plus)

改訂2版 データサイエンティスト養成読本 [プロになるためのデータ分析力が身につく! ] (Software Design plus)