Removes multiple vowels (holaaaa) and normalises common laughing patterns (jajaja, jejeje, ajajaaaaja). Useful for visualisations, and reducing the overall number of tokens present in the text variable.
Value
Data Frame or Tibble object with most repeat vowels & laughing patterns removed from the text variable
Examples
limpiar_examples %>% dplyr::select(mention_content)
#> # A tibble: 10 × 1
#> mention_content
#> <chr>
#> 1 "mi amigo sancho es un wn de vdd jajaja"
#> 2 "RT mi amigo sancho es un wn de vdd jajaja"
#> 3 "@don_quijote no digas eso, tu amigo es muy honorable #vamos #sancho"
#> 4 "nos han metido en una muy dificil situación"
#> 5 "nos han metido en una muy dificil situación"
#> 6 " Lo q no tenemos es tiempo. Mañana debemos luchar. "
#> 7 "a mi es muy grave quitarle la vida al otro"
#> 8 "ayyy nooo @robert_jordan 😢 😢 😢 "
#> 9 "todos se unen a nuestro grupo hagale un clic https::larebelion.es"
#> 10 "a mi me gustaría quedarme un ratito más"
limpiar_examples %>% limpiar_repeat_chars() %>% dplyr::select(mention_content)
#> # A tibble: 10 × 1
#> mention_content
#> <chr>
#> 1 "mi amigo sancho es un wn de vdd jaja"
#> 2 "RT mi amigo sancho es un wn de vdd jaja"
#> 3 "@don_quijote no digas eso, tu amigo es muy honorable #vamos #sancho"
#> 4 "nos han metido en una muy dificil situación"
#> 5 "nos han metido en una muy dificil situación"
#> 6 " Lo q no tenemos es tiempo. Mañana debemos luchar. "
#> 7 "a mi es muy grave quitarle la vida al otro"
#> 8 "ay no @robert_jordan 😢 😢 😢 "
#> 9 "todos se unen a nuestro grupo hagale un clic https::larebelion.es"
#> 10 "a mi me gustaría quedarme un ratito más"