Seite 1 von 6

Datenhaltung

Verfasst: Di Jun 08, 2010 10:22 am
von Xin
Worum sich bisher niemand kümmert ist die Datenhaltung, also wie werden gefundene Hashs auf der Platte verwaltet.

Wie sieht's hier aus?

Re: Datenhaltung

Verfasst: Di Jun 08, 2010 11:44 am
von Dirty Oerti
Also ich kann mich darum kümmern, aber du weißt ja, nur bis spätestens 1. Juli
Vielleicht sollten wir vor allem einmal klären, welche Ansprüche an unsere Datenhaltung gestellt werden.
Demnach kann man dann ein Modell entwerfen, das wir dann umsetzen können.

Ich fang mal an mit den Überlegungen:

Wir haben Hashwerte einzelner Dateien.
Folglich müssen wir Hashwerte in Verbindung mit einer Pfadangabe (der Datei) speichern.
Dazu sollten noch weitere Informationen kommen wie Größe der Datei, Datum der Indizierung (also wann die Datei in die Datenhaltung aufgenommen wurde) und eventuell Informationen zu Erstellungsdatum o.ä.
Gleichzeitig könnte die Datenhaltung aber auch Verknüpfungen zu anderen Elementen innerhalb der Datenhaltung enthalten (^^), um so schnell das Auffinden von Duplikaten zu ermöglichen.
Außerdem müssen noch "Steuerinformationen" gehalten werden, wie z.B. dass die jeweilige Datei nicht als Duplikat anzusehen ist (weil sie z.B. ein Backup ist) o.ä.

Re: Datenhaltung

Verfasst: Mi Jun 09, 2010 1:34 am
von Bebu
Ich werfe an dieser Stelle mal eine Datenbank in den Raum. Es muss nicht SQLite sein, würde sich aber anbieten. Vielleicht kennt aber noch jemand eine anderes Datenbanksystem, das sich für so einen Zweck besser eigenen würde.

Re: Datenhaltung

Verfasst: Mi Jun 09, 2010 3:14 pm
von Xin
Bebu hat geschrieben:Ich werfe an dieser Stelle mal eine Datenbank in den Raum. Es muss nicht SQLite sein, würde sich aber anbieten. Vielleicht kennt aber noch jemand eine anderes Datenbanksystem, das sich für so einen Zweck besser eigenen würde.
Auf den ersten Blick erscheint mir SQLite ebenfalls sinnvoll. Sollte sich niemand dafür finden, würde ich durchaus Interesse anmelden, da ich mit SQLite noch nicht gearbeitet habe und ich das Tutorial hier sowieso gerne mal nachvollziehen wollte.

Re: Datenhaltung

Verfasst: Mi Jun 09, 2010 9:35 pm
von Dirty Oerti
Hehe, das meinte ich damit eigentlich.
SQLite ist insofern mein Favorit unter den Datenbanksystemen, da es sehr klein und auch flott ist und außerdem ohne Server auskommt.
Dafür interessieren tu ich mich auch, gearbeitet hab ich damit aber noch nicht. (Ich wollte es auf meinen Heimserver mal testweise installieren und mir die Sache mal angucken)

Re: Datenhaltung

Verfasst: Di Jun 15, 2010 9:55 am
von Xin
Wir zwei müssen noch Streichhölzer ziehen. Zeit haben wir beide nicht wirklich. Ich habe schon Aufgaben und Du müsstest Dich ziemlich beeilen.
Also... wo bekommen wir die Streichhölzer her, wenn sich sonst keiner hier meldet?

Re: Datenhaltung

Verfasst: Di Jun 15, 2010 1:16 pm
von cloidnerux
Ich melde mich hier auch mal, obwohl ich noch nicht viel Erfahrung mit Datenbanken gemacht habe.
Ich habe es mal geschafft per C# und ADO.NET auf meine MySQL DB auf meinem Server zuzugreifen, der rest war ja nur noch die aus PHP bekannten Querrys.
Wenn sich sonst keiner meldet und/oder keiner Zeit hat, werde ich versuchen, etwas für Dedupe zusammen zu stricken.

Re: Datenhaltung

Verfasst: Di Jun 15, 2010 1:45 pm
von Bebu
Ich könnte auch noch meinen SQLite Wrapper dahingehend überarbeiten. Aber der Lerneffekt wäre für jemanden anders größer.

Re: Datenhaltung

Verfasst: So Jun 20, 2010 11:09 am
von Dirty Oerti
Tag :)

Also viel werd ich leider nicht mehr hinbekommen (stehen noch allerlei Veranstaltungen auf dem Plan -.- )

Re: Datenhaltung

Verfasst: So Jun 20, 2010 2:38 pm
von Xin
Dirty Oerti hat geschrieben:Also viel werd ich leider nicht mehr hinbekommen (stehen noch allerlei Veranstaltungen auf dem Plan -.- )
Das vermutete ich schon.

Ich hoffe, Du findest noch etwas Zeit hierfür, wenn Du in die nächste Veranstaltungsreihe gehst.
Gegebenenfalls mache ich das aber.