Skip to contents

Calcula la cantidad de palabras por cada elemento de un vector de texto, utilizando tokenize_words para la tokenización. Permite definir cómo tratar valores NA y si se deben descartar tokens vacíos.

Usage

count_words(text, na_as_zero = FALSE, drop_empty = TRUE, ...)

Arguments

text

Vector de caracteres con el/los texto(s) a analizar.

na_as_zero

Lógico; si es TRUE, cuando text tiene NA devuelve 0 en lugar de NA en el conteo.

drop_empty

Lógico; si es TRUE, descarta tokens vacíos o con solo espacios al contar.

...

Argumentos adicionales que se pasan a tokenize_words.

Value

Un vector entero con la cantidad de palabras por elemento de text.

Details

Esta función es un contenedor liviano que delega la lógica de separación en tokenize_words y solo realiza el conteo. Si necesitás reglas distintas de tokenización (p. ej., incluir o excluir guiones, números o tildes), ajustá los argumentos de tokenize_words.

See also

Examples

count_words("Este es un ejemplo sencillo.")
#> [1] 5
count_words(c("Primera frase.", "Segunda frase con más palabras."))
#> [1] 2 5
count_words(NA_character_, na_as_zero = TRUE)  # devuelve 0
#> [1] 0