Skip to contents

Divide un texto por separadores simples (espacios, guiones y puntuación), limpia cada token y descarta vacíos.

Usage

tokenize_clean(text)

Arguments

text

Cadena de texto (puede contener varias palabras).

Value

Vector de palabras limpias (puede ser de longitud 0).

Examples

tokenize_clean("¡Hola, mundo—cruel!")  # c("hola","mundo","cruel")
#> [1] "hola"  "mundo" "cruel"