Calcula el promedio de caracteres por palabra para cada elemento de
text
. Por defecto, se contabilizan todos los caracteres presentes en
cada token (tal como fueron devueltos por tokenize_words
),
por lo que normalmente no incluye puntuación si strip_punct = TRUE
.
Arguments
- text
Vector de caracteres con el/los texto(s) a analizar.
- na_as_zero
Lógico; si es
TRUE
, cuandotext
tieneNA
devuelve 0 en lugar deNA
. Además, si un elemento no contiene palabras, devuelve 0 en lugar deNA
.- drop_empty
Lógico; si es
TRUE
, descarta tokens vacíos antes de contar.- ...
Argumentos adicionales que se pasan a
tokenize_words
.
Details
El conteo de caracteres se realiza con nchar(..., type = "chars")
.
Si deseás excluir explícitamente ciertos signos (p. ej., guiones), asegurate
de configurar strip_punct
o keep_hyphens
en
tokenize_words
según corresponda.