Contar palabras en un texto

Calcula la cantidad de palabras por cada elemento de un vector de texto, utilizando tokenize_words para la tokenización. Permite definir cómo tratar valores NA y si se deben descartar tokens vacíos.

Usage

count_words(text, na_as_zero = FALSE, drop_empty = TRUE, ...)

Arguments

text: Vector de caracteres con el/los texto(s) a analizar.
na_as_zero: Lógico; si es TRUE, cuando text tiene NA devuelve 0 en lugar de NA en el conteo.
drop_empty: Lógico; si es TRUE, descarta tokens vacíos o con solo espacios al contar.
...: Argumentos adicionales que se pasan a tokenize_words.

Value

Un vector entero con la cantidad de palabras por elemento de text.

Details

Esta función es un contenedor liviano que delega la lógica de separación en tokenize_words y solo realiza el conteo. Si necesitás reglas distintas de tokenización (p. ej., incluir o excluir guiones, números o tildes), ajustá los argumentos de tokenize_words.

Examples

count_words("Este es un ejemplo sencillo.")
#> [1] 5
count_words(c("Primera frase.", "Segunda frase con más palabras."))
#> [1] 2 5
count_words(NA_character_, na_as_zero = TRUE)  # devuelve 0
#> [1] 0

Usage

Arguments

Value

Details

See also

Examples