Se Windows genera un errore, hai un problema di virus o vuoi discutere/segnalare l'uscita della nuova versione di un software per la piattaforma Microsoft, questa è la sezione giusta.
Stavo provando i programmi per scoprire le password degli archivi zip e rar, volevo creare un dizionario di parole in formato txt da allegare all'articolo, il problema è che il file supera già i 28 Mega e molte righe sono duplicate.
Volevo trovare il modo di togliere i doppioni, avevo trovato un programmino che mi sembrava funzionare ma alla fine toglieva tutte le due/tre/quattro righe ripetute, io volevo che me lasciasse almeno una.
Come posso farlo?
Avevo trovato delle indicazioni che si poteva farlo con Word ma non sono riuscito a capire dove sia in word 2013.
Fatemi sapere.
Grazie
“Se tutti i documenti raccontavano la stessa favola, ecco che la menzogna diventava un fatto storico, quindi vera.”
Mi ricordo che, quando mi occupavo ogni tanto di recupero password, utilizzavo (tra gli altri) uno strumento abbastanza intuitivo per effettuare varie manipolazioni alle wordlist: LINK
Purtroppo non ricordo bene se effettivamente fa ciò che chiedi, probabilmente si.
Due Mega righe sono tantine, ma ti consiglierei di provare con editor di testo "evoluti".
Notepad ++
Richiede l'installazione del plugin TextFX [Plugin > Plugin Manager > Show Plugin Manager > Available > TextFX Characters].
Poi: TextFX > TextFX Tools > Sort lines case sensitive (at column) assicurandosi che "+Sort outputs only UNIQUE" sia selezionato.
PSPad
Ancora più semplice: Modifica > Ordina testo... > Elimina duplicati > OK.
TextPad
Molto simile: Strumenti > Ordina... > Elimina duplicati > OK.
(dei tre il mio preferito è PSPad)
crazy.cat ha scritto:avevo trovato un programmino che mi sembrava funzionare ma alla fine toglieva tutte le due/tre/quattro righe ripetute, io volevo che me lasciasse almeno una
Se ti riferisci a Text Deduplicator Plus (di cui avevi iniziato la recensione), non ho riscontrato lo stesso problema: forse non ce la fa a gestire due milioni di righe (io l'ho provato con quattordici ).
A titolo di curiosità: spulciando tra i comandi di PowerShell mi sono imbattuto in Sort-Object che ha anche l'opzione -unique.
Per cui dovrebbe essere possibile rimuovere le righe doppie da un documento di testo anche senza installare nessun software specifico:
PippoDJ ha scritto:A titolo di curiosità: spulciando tra i comandi di PowerShell mi sono imbattuto in Sort-Object che ha anche l'opzione -unique.
Per cui dovrebbe essere possibile rimuovere le righe doppie da un documento di testo anche senza installare nessun software specifico:
Ho riprovato con Text Deduplicator Plus ma ha tolto oltre 100.000 righe in più rispetto a pspad. Ritengo il numero di pspad più attendibile, avevo verificato con altro programma i duplicati presenti.
“Se tutti i documenti raccontavano la stessa favola, ecco che la menzogna diventava un fatto storico, quindi vera.”
Ho riprovato con Text Deduplicator Plus ma ha tolto oltre 100.000 righe in più rispetto a pspad. Ritengo il numero di pspad più attendibile, avevo verificato con altro programma i duplicati presenti.
Text Deduplicator non fa distinzione tra maiuscole e minuscole (e non ha un'impostazione per cambiare questo comportamento). Cosa probabilmente indesiderabile se si cerca di eliminare i duplicati da un file di password.
A questo proposito, il comando PowerShell visto sopra, sarebbe meglio così:
PippoDJ ha scritto:Scusa crazy.cat, errore mio , ho copiato per sbaglio anche il prompt di PowerShell.
E' vero, potevo anche accorgermene, ma era mattina presto e dormivo ancora.
Ma che "delicato" che è anche powershell, mi va in crisi "solo" con un paio di milioni di righe di testo.
Adesso alleggerisco il file di testo giusto per capire se funziona bene.
Ok, confermo che funziona veloce con meno righe, magari in un giorno o due avrebbe fatto anche con l'altro file più grande.
“Se tutti i documenti raccontavano la stessa favola, ecco che la menzogna diventava un fatto storico, quindi vera.”
Inserendo un messaggio, dichiari di aver letto e accettato il regolamento di partecipazione.
Nello specifico, sei consapevole che ti stai assumendo personalmente la totale responsabilità delle tue affermazioni, anche in sede civile e/o penale,
manlevando i gestori di questo sito da ogni coinvolgimento e/o pretesa di rivalsa.
Dichiari inoltre di essere consapevole che il messaggio sarà visibile pubblicamente, accetti di diffonderlo con licenza
CC BY-NC-SA 3.0 (con attribuzione a "TurboLab.it") e rinunci ad ogni forma di compensazione (economica o altro).
Rinunci inoltre esplicitamente a qualsiasi pretesa di cancellazione del messaggio.