Calcula la cantidad de palabras por cada elemento de un vector de texto,
utilizando tokenize_words para la tokenización. Permite definir
cómo tratar valores NA y si se deben descartar tokens vacíos.
Arguments
- text
Vector de caracteres con el/los texto(s) a analizar.
- na_as_zero
Lógico; si es
TRUE, cuandotexttieneNAdevuelve 0 en lugar deNAen el conteo.- drop_empty
Lógico; si es
TRUE, descarta tokens vacíos o con solo espacios al contar.- ...
Argumentos adicionales que se pasan a
tokenize_words.
Details
Esta función es un contenedor liviano que delega la lógica de separación en
tokenize_words y solo realiza el conteo. Si necesitás reglas
distintas de tokenización (p. ej., incluir o excluir guiones, números o tildes),
ajustá los argumentos de tokenize_words.
Examples
count_words("Este es un ejemplo sencillo.")
#> [1] 5
count_words(c("Primera frase.", "Segunda frase con más palabras."))
#> [1] 2 5
count_words(NA_character_, na_as_zero = TRUE) # devuelve 0
#> [1] 0