txt - pandas python
importar texto a pandas con mĂșltiples delimitadores (1)
Una forma podría ser usar los separadores de expresiones regulares permitidos por el motor de Python. Por ejemplo:
>>> !cat castle.dat
c stuff
c more header
c begin data
1 1:.5
1 2:6.5
1 3:5.3
>>> df = pd.read_csv(''castle.dat'', skiprows=3, names=[''a'', ''b'', ''c''],
sep='' |:'', engine=''python'')
>>> df
a b c
0 1 1 0.5
1 1 2 6.5
2 1 3 5.3
Tengo algunos datos que se ven así:
c stuff
c more header
c begin data
1 1:.5
1 2:6.5
1 3:5.3
Quiero importarlo en un marco de datos de 3 columnas, con columnas, por ejemplo
a , b, c
1, 1, 0.5
etc
He estado tratando de leer los datos como 2 columnas divididas en '':'', y luego dividir la primera columna en ''''. Sin embargo, me resulta molesto. ¿Hay una mejor manera de resolverlo en la importación directamente?
actualmente:
data1 = pd.read_csv(file_loc, skiprows = 3, delimiter = '':'', names = [''AB'', ''C''])
data2 = pd.DataFrame(data1.AB.str.split('' '',1).tolist(), names = [''A'',''B''])
Sin embargo, esto se complica aún más por el hecho de que mis datos tienen un espacio líder ...
Siento que esto debería ser una tarea simple, pero actualmente estoy pensando en leerlo línea por línea y usar algunos sustitutos de búsqueda para desinfectar los datos antes de importar.