Page 45 - LIBRO SEMANA PEDAGOGICA
P. 45

SEMANA
             PEDAGÓGICA



                        UNIVERSIDAD - REGIÓN
                                                                                                            REGIONALIZACIÓN



           FRECUENCIA DE PALABRAS

           En este paso, transformaremos el objeto nov_tdm en un objeto clase matrix.









           Ahora obtenemos la suma de los renglones ordenadas de mayor a menor para facilitar la
           graficación y obtenemos la nube de palabras

                  nov_mat <- nov_mat %>% rowSums() %>% sort(decreasing = TRUE)
                  nov_mat <- data.frame(palabra = names(nov_mat), frec = nov_mat)
                  wordcloud(
                    words = nov_mat$palabra,
                    freq = nov_mat$frec,
                    max.words = 80,
                    random.order = F,
                    colors=brewer.pal(name = "Dark2", n = 8)
                    )


           Obtenemos una lista de 20 palabras más frecuentes.


                  nov_mat[1:20, ]


           Obtenemos un gráfico con las palabras más frecuentes.



                  nov_mat[1:10, ] %>%
                    ggplot(aes(palabra, frec)) +
                    geom_bar(stat = "identity", color = "black", fill = "#87CEFA") +
                    geom_text(aes(hjust = 1.3, label = frec)) +
                    coord_flip() +
                    labs(title = "Palabras más frecuentes",  x = "Palabras", y = "Número de usos")
   40   41   42   43   44   45   46   47   48   49   50