read - Reemplazando parte de la cadena en el marco de datos de python pandas
pandas.read_csv example python (2)
Puede usar el parámetro regex
del método replace
para lograr eso:
misc[''product_desc''] = misc[''product_desc''].replace(to_replace=''/n'', value='''', regex=True)
Tengo un problema similar al publicado aquí:
Pandas DataFrame: elimina las partes no deseadas de las cadenas en una columna
Necesito eliminar los caracteres de nueva línea de una cadena en un DataFrame. Básicamente, he accedido a una API usando el módulo json de python y todo está bien. Crear el DataFrame también funciona increíblemente. Sin embargo, cuando quiero finalmente generar el resultado final en un csv, me atasco un poco, porque hay nuevas líneas que crean falsas ''nuevas filas'' en el archivo csv.
Así que básicamente estoy tratando de convertir esto:
''... este es un párrafo.
Y este es otro párrafo ... ''
dentro de esto:
''... este es un párrafo. Y este es otro párrafo ... ''
No me importa conservar ningún tipo de ''/ n'' o símbolos especiales para el salto de párrafo. Por lo tanto, se puede eliminar directamente.
He intentado algunas variaciones:
misc[''product_desc''] = misc[''product_desc''].strip(''/n'')
AttributeError: ''Series'' object has no attribute ''strip''
aquí está otro
misc[''product_desc''] = misc[''product_desc''].str.strip(''/n'')
TypeError: wrapper() takes exactly 1 argument (2 given)
misc[''product_desc''] = misc[''product_desc''].map(lambda x: x.strip(''/n''))
misc[''product_desc''] = misc[''product_desc''].map(lambda x: x.strip(''/n/t''))
No hay ningún mensaje de error, pero los caracteres de nueva línea tampoco desaparecen. Lo mismo con esto:
misc = misc.replace(''/n'', '''')
La línea de escritura en csv es esta:
misc_id.to_csv(''C:/Users/jlalonde/Desktop/misc_w_id.csv'', sep='' '', na_rep='''', index=False, encoding=''utf-8'')
La versión de Pandas es 0.9.1
¡Gracias! :)
strip
solo elimina los caracteres especificados al principio y al final de la cadena. Si quiere eliminar todo /n
, debe usar replace
.
misc[''product_desc''] = misc[''product_desc''].str.replace(''/n'', '''')