Page 47 - LIBRO SEMANA PEDAGOGICA
P. 47

SEMANA
             PEDAGÓGICA



                        UNIVERSIDAD - REGIÓN
                                                                                                            REGIONALIZACIÓN



           Comparamos cuantos términos teníamos inicialmente y cuantos nos quedan.


               nov_tdm
               nov_new

           Y también revisamos el numero de renglones


               nov_tdm$nrow
               nov_new$nrow


           Vamos a tranformar la matriz de terminos a un objeto tipo matrix, para facilitar el análisis
           posterior.


               nov_new <- nov_new %>% as.matrix()



           MATRIZ DE DISTANCIA



               nov_new <- nov_new / rowSums(nov_new)


           Hecho esto, nuestra matriz ha sido estandarizada.
           Procedemos a obtener una matriz de distancia a partir de ella, con el método de distancias
           euclidianas y la asignamos al objeto nov_dist.



               nov_dist <- dist(nov_new, method = "euclidian")




           HCLUST

           Vamos a realizar el agrupamiento jerárquico usando la función hclust, de la base de R.


               nov_hclust <-  hclust(nov_dist, method = "ward.D")


           y graficamos.


               plot(nov_hclust, main = "Dendrograma - hclust", sub = "", xlab = "")



           Crearemos el mismo gráfico pidiendo diez grupos.
   42   43   44   45   46   47   48   49   50   51   52