Calcula la cantidad de palabras por cada elemento de un vector de texto,
utilizando tokenize_words
para la tokenización. Permite definir
cómo tratar valores NA
y si se deben descartar tokens vacíos.
Arguments
- text
Vector de caracteres con el/los texto(s) a analizar.
- na_as_zero
Lógico; si es
TRUE
, cuandotext
tieneNA
devuelve 0 en lugar deNA
en el conteo.- drop_empty
Lógico; si es
TRUE
, descarta tokens vacíos o con solo espacios al contar.- ...
Argumentos adicionales que se pasan a
tokenize_words
.
Details
Esta función es un contenedor liviano que delega la lógica de separación en
tokenize_words
y solo realiza el conteo. Si necesitás reglas
distintas de tokenización (p. ej., incluir o excluir guiones, números o tildes),
ajustá los argumentos de tokenize_words
.
Examples
count_words("Este es un ejemplo sencillo.")
#> [1] 5
count_words(c("Primera frase.", "Segunda frase con más palabras."))
#> [1] 2 5
count_words(NA_character_, na_as_zero = TRUE) # devuelve 0
#> [1] 0