fat-lobyte hat geschrieben:Hallo. Darf man fragen, wies zurzeit aussieht?
Kann wie funktioniert die Identifizierung doppelter Dateien?
Kann man ähnliche Dateien nach Größe/Name/Hash finden?
Ich habe tatsächlich den Bedarf an dem Tool, und jetzt überleg ich mir ob ich dazu Dedupe als Beta-Tester einsetze oder ein anderes Tool verwende.
Dedupe ist zur Zeit im Winterschlaf, nach der Geschichte mit dem Stringproblemen zwischen Windows und Posix, habe ich mal wieder die Lust verloren. Außerdem stecke ich in meinen Hochzeitsvorbereitungen und habe anderes im Kopf... ABER:
Dedupe funktioniert, sogar mit Datenbankupdate, ist auch schon hochgeladen. Die aktuelle Revision findet Duplikate und bietet dir eine Auswahl an, was damit getan werden soll. Die Option zum Markieren absichtlicher Duplikate ist allerdings nicht fertig und funktioniert auch noch überhaupt nicht.
Derzeit werden Duplikate ausschließlich über den Hashwert gefunden, die anderen Möglichkeiten müssten sich aber mit verhältnismäßig wenig Aufwand einbauen lassen.
Derzeitiger Arbeitsablauf von Dedupe:
Dateien hinzufügen -> Hash wird berechnet ->Abspeichern in Datenbank
Duplikate suchen ->Duplikate werden per Userinterface abgefragt -> Verarbeitung der Eingaben
Es gibt eine Funktion Datenbankupdate. Dazu werden alle Pfade die in der Datenbank gespeichert sind noch einmal von der Festplatte abgefragt und ihre Werte mit den gespeicherten abgeglichen. Ist alles gleich geblieben, passiert nichts. Hat sich Größe, Änderungsdatum geändert, wird die Datei neu gehasht und die Datenbank aktualisiert. Diese Funktion wird vor jeder Operation durch den User aufgerufen, damit die Daten immer aktuell sind.
Ich denke man kann Dedupe schon produktiv einsetzen, wenn man nur einmalig Duplikate los werden will. Für die Automatische Duplikatüberwachung von ganzen Verzeichnissen, ist es noch nicht weit genug fertig, da das setzen von absichtlichen Duplikaten noch fehlt.
Feuer frei für eure Kommentare