example - regex python 3
PuntuaciĆ³n Regex dividida (3)
La documentación oficial de Python tiene un buen ejemplo para esto. Se dividirá en todos los caracteres no alfanuméricos (espacios en blanco y puntuación). Literalmente / W es la clase de caracteres para todos los caracteres que no son de Word. Nota: el guión bajo "_" se considera un carácter de "palabra" y no será parte de la división aquí.
re.split(''/W+'', ''Words, words, words.'')
Consulte https://docs.python.org/3/library/re.html para obtener más ejemplos, busque la página "re.split"
¿Alguien puede ayudarme un poco con expresiones regulares? Actualmente tengo esto: re.split(" +", line.rstrip())
, que se separa por espacios.
¿Cómo podría expandir esto para cubrir la puntuación, también?
Usando string.punctuation
y clase de caracteres:
>>> from string import punctuation
>>> r = re.compile(r''[/s{}]+''.format(re.escape(punctuation)))
>>> r.split(''dss!dfs^ #$% jjj^'')
[''dss'', ''dfs'', ''jjj'', '''']
import re
st=''one two,three; four-five, six''
print re.split(r''/s+|[,;.-]/s*'', st)
# [''one'', ''two'', ''three'', ''four'', ''five'', ''six'']