proggen.org-Projekt: Dedupe
Verfasst: Sa Mai 08, 2010 11:26 am
Moin
Ausgehend von diesem Thread möchte ich ein erstes öffentliches proggen.org Projekt anbieten. Das bedeutet, dass der Quelltext offen ist und jeder, der möchte daran teilnehmen kann und zwar unabhängig von den eigenen Fähigkeiten. Es ist ein Lernprojekt - nicht nur für die Teilnehmer, auch für mich.
Für euch das Teamwork bei gleichzeitigem Lernen und Anwenden vom portablen Programmiertechniken, für mich der Aufbau einer Build-Struktur für drei Betriebsysteme und der Organisation einer unbekannten Anzahl von Programmierern, die wechseln können, Dokumentationsgenerierung und automatisierte Handbucherzeugung.
Mein Projektvorschlag ist ein Tool, dass aus allen Dateien einen Hashwert errechnet, um sie zu vergleichen, um Duplikate zu finden. Dies möchte ich später erweitern um Fotos auf Ähnlichkeiten untersuchen (um z.B. verkleinerte oder gedrehte Fotos zuordnen zu können). Das Ganze mit einer GUI, die auf Linux, Mac und Windows läuft.
Das Tool muss konfiguriert werden können (welche Verzeichnisse, welche Dateiendung?), es muss Daten verwalten (Datenstrukturen, die erstmal gelesenen Daten auf die Platte speichern) und natürlich Daten einlesen (Verzeichnisse scannen, Dateien öffnen und daraus einen Hashwert berechnen, prüfen, ob der Hashwert schonmal vorgekommen ist...) und natürlich Resultate erzeugen, nämlich eine Liste mit gleichen Dateien und diese Aufbereiten (z.B. vollständig identische Verzeichnisse) und natürlich Fehlermanagement (Fehlermanagement und Logging: z.B. Dateien konnten nicht geöffnet werden).
Das Ganze sollte sauber dokumentiert werden, damit es als Lehrprojekt auch lesbar für kommende User ist.
Das Projekt bekäme ein eigenes Board im Forum und einen Bereich im Wiki, wo die aktuelle Planung besprochen und begründet dokumentiert wird.
Interesse?
Ausgehend von diesem Thread möchte ich ein erstes öffentliches proggen.org Projekt anbieten. Das bedeutet, dass der Quelltext offen ist und jeder, der möchte daran teilnehmen kann und zwar unabhängig von den eigenen Fähigkeiten. Es ist ein Lernprojekt - nicht nur für die Teilnehmer, auch für mich.
Für euch das Teamwork bei gleichzeitigem Lernen und Anwenden vom portablen Programmiertechniken, für mich der Aufbau einer Build-Struktur für drei Betriebsysteme und der Organisation einer unbekannten Anzahl von Programmierern, die wechseln können, Dokumentationsgenerierung und automatisierte Handbucherzeugung.
Mein Projektvorschlag ist ein Tool, dass aus allen Dateien einen Hashwert errechnet, um sie zu vergleichen, um Duplikate zu finden. Dies möchte ich später erweitern um Fotos auf Ähnlichkeiten untersuchen (um z.B. verkleinerte oder gedrehte Fotos zuordnen zu können). Das Ganze mit einer GUI, die auf Linux, Mac und Windows läuft.
Das Tool muss konfiguriert werden können (welche Verzeichnisse, welche Dateiendung?), es muss Daten verwalten (Datenstrukturen, die erstmal gelesenen Daten auf die Platte speichern) und natürlich Daten einlesen (Verzeichnisse scannen, Dateien öffnen und daraus einen Hashwert berechnen, prüfen, ob der Hashwert schonmal vorgekommen ist...) und natürlich Resultate erzeugen, nämlich eine Liste mit gleichen Dateien und diese Aufbereiten (z.B. vollständig identische Verzeichnisse) und natürlich Fehlermanagement (Fehlermanagement und Logging: z.B. Dateien konnten nicht geöffnet werden).
Das Ganze sollte sauber dokumentiert werden, damit es als Lehrprojekt auch lesbar für kommende User ist.
Das Projekt bekäme ein eigenes Board im Forum und einen Bereich im Wiki, wo die aktuelle Planung besprochen und begründet dokumentiert wird.
Interesse?