duplicates - eliminar - Notepad++ borrar líneas que contienen palabras duplicadas
textfx (4)
Para mí personalmente, aquí están los pasos que sigo. Supongamos que tiene solo 1 columna de datos en la columna A.
- Importe los datos a Excel.
- Clasifica los datos.
- Inserte una función para verificar si hay duplicados. La celda B2 sería: = IF (A2 = A1, "Duplicar", "")
- Seleccione toda la columna B.
- Dupdo.
- Pega especial y pega los valores.
- Ordene los datos según la columna B.
- Eliminar todos los marcados con "Duplicar".
- Copie los datos de nuevo a Notepad ++
Pensé que había un complemento como este, pero no puedo encontrarlo ahora. De lo contrario, este enlace puede ayudarte.
Tengo un documento txt que contiene una palabra seguida con una fecha en una línea, y así sucesivamente en cada línea. ¿Cómo puede Notepad ++ reconocer las mismas palabras en líneas diferentes y eliminar líneas duplicadas?
No es una respuesta directa a su pregunta, pero encontré este artículo basado en el título. Estaba buscando simplemente eliminar líneas duplicadas. Encontré una manera fácil de hacer eso aquí
- Marque todo el texto (CTRL + A). Haga clic en TextFX → Haga clic en Herramientas de TextFX → Verificar + ordenar salidas solo ÚNICAS (en columna) líneas (si no están ya marcadas).
- Haga clic en TextFX → Haga clic en Herramientas de textoFX → Haga clic en Ordenar líneas sin distinción de mayúsculas y minúsculas (en la columna)
Suponiendo que las fechas pueden ser diferentes para la misma ocurrencia de la misma palabra y desea mantener la que aparece primero en el archivo, entonces esto debería funcionar (asegúrese de que su archivo termine con una nueva línea para esto):
- Ve al cuadro de diálogo "Reemplazar" (puedes hacer Ctrl + F e ir a reemplazar la pestaña)
- En el "Modo de búsqueda" en la parte inferior, seleccione "Expresión regular" (asegúrese de que ". Coincide con la nueva línea" no esté seleccionado)
- En el campo "Buscar qué:" escriba
(/s*/w+ )(.*/r/n)((.*/r/n)*)/1.*/r/n
- En el campo "Reemplazar con:" escriba
/1/2/3
- Haga clic en "Reemplazar" hasta que no haya más apariciones ("Reemplazar todo" no parece funcionar para esto, quizás exista una expresión regular mejor para la que funcionará, pero no la he encontrado).
He probado esto en el archivo:
testing330 05:09-24/08
whatever 10:55-25/08
testing 15:57-26/08
testing667 19:22-30/08
linux 00:29-31/08
testing330 00:29-31/08
windows 12:25-31/08
y el resultado fue:
testing330 05:09-24/08
whatever 10:55-25/08
testing 15:57-26/08
testing667 19:22-30/08
linux 00:29-31/08
windows 12:25-31/08
Puede usar EditPlus en Windows O TextWrangler en Mac para ordenar y eliminar fácilmente las líneas duplicadas.
Después de Notepad ++ 6.5.2 (gratuito) puede ordenar las líneas O puede instalar el complemento "Caracteres TextFX" utilizando el "Administrador de complementos".
TextFX incluye numerosas funciones para transformar el texto seleccionado. Con: * Interactive Brace Matching * Cita manejo * Alternancia de mayúsculas y minúsculas * Text rewrap * Column Lineup * Fill Text Down * Insert counter text down * Conversión de texto a código * Conversión numérica * URI y codificación HTML * Conversión de HTML a texto * Enviar texto a W3C * Clasificación de texto * Ascii Chart * Reparación de espacios en blanco * Autoclose HTML & braces Página de inicio: http://textfx.no-ip.com/textfx/