Page 45 - LIBRO SEMANA PEDAGOGICA
P. 45
SEMANA
PEDAGÓGICA
UNIVERSIDAD - REGIÓN
REGIONALIZACIÓN
FRECUENCIA DE PALABRAS
En este paso, transformaremos el objeto nov_tdm en un objeto clase matrix.
Ahora obtenemos la suma de los renglones ordenadas de mayor a menor para facilitar la
graficación y obtenemos la nube de palabras
nov_mat <- nov_mat %>% rowSums() %>% sort(decreasing = TRUE)
nov_mat <- data.frame(palabra = names(nov_mat), frec = nov_mat)
wordcloud(
words = nov_mat$palabra,
freq = nov_mat$frec,
max.words = 80,
random.order = F,
colors=brewer.pal(name = "Dark2", n = 8)
)
Obtenemos una lista de 20 palabras más frecuentes.
nov_mat[1:20, ]
Obtenemos un gráfico con las palabras más frecuentes.
nov_mat[1:10, ] %>%
ggplot(aes(palabra, frec)) +
geom_bar(stat = "identity", color = "black", fill = "#87CEFA") +
geom_text(aes(hjust = 1.3, label = frec)) +
coord_flip() +
labs(title = "Palabras más frecuentes", x = "Palabras", y = "Número de usos")