GAP Tabellen
Verfasst: Mi Jan 04, 2012 8:35 am
Hallo!
Ich stehe vor folgendem Problem:
Ich habe in mehreren Dateien Elemente, die mit IDs belegt sind. Nun darf keine dieser IDs zweimal auftauchen und ich möchte überprüfen, ob das so ist.
Beispieldatensatz 1:
GRID 1
GRID 2
GRID 3
GRID 5
GRID 6
Beispieldatensatz 2:
GRID 7
GRID 8
GRID 9
GRID 1
GRID 4
Mein erster Ansatz war, daß ich einfach alle IDs nacheinander in ein Array (daß ich vorher mit Nullen initialisiert habe) schreibe und dabei prüfe, ob ein Arrayeintrag ungleich Null ist, um dann eine Fehlermeldung zu geben. D.h. für das obige Beispiel: die ID 1 taucht doppelt auf
Das ist allerdings für die weitere Verarbeitung unhandlich, denn es können reichlich Fehlermeldungen kommen, mit denen ich die Anwender dann überfordern würde.
Daher würde ich gerne prüfen, ob es für jede Datei zusammenhängende ID-Bereiche gibt (in unserem Jargon heißen diese GAP-Tabellen).
Ein weiterer Vorteil wäre, daß ich aus vorhandenen GAP-Tabellen zusammenhängende ID-Bereiche identifizieren könnte, die noch unbelegt sind und die ich für neue Datensätze verwenden kann.
Für den 1. Datensatz also: 1 bis 3, 5 bis 6 oder kurz als Array: 1,3,5,6
Für den 2. Datensatz dann: 1, 4, 7 bis 9 oder als Array 1,4,7,9
Dann müßte ich prüfen, ob diese GAP-Tabelle überschneidungsfrei sind und hätte die Anzahl der Fehlermeldungen reduziert ohne Informationen zu verlieren.
Hat jemand eine Idee, wie man das intelligent in einen Algorithmus packt?
Ciao
Bruno
Ich stehe vor folgendem Problem:
Ich habe in mehreren Dateien Elemente, die mit IDs belegt sind. Nun darf keine dieser IDs zweimal auftauchen und ich möchte überprüfen, ob das so ist.
Beispieldatensatz 1:
GRID 1
GRID 2
GRID 3
GRID 5
GRID 6
Beispieldatensatz 2:
GRID 7
GRID 8
GRID 9
GRID 1
GRID 4
Mein erster Ansatz war, daß ich einfach alle IDs nacheinander in ein Array (daß ich vorher mit Nullen initialisiert habe) schreibe und dabei prüfe, ob ein Arrayeintrag ungleich Null ist, um dann eine Fehlermeldung zu geben. D.h. für das obige Beispiel: die ID 1 taucht doppelt auf
Das ist allerdings für die weitere Verarbeitung unhandlich, denn es können reichlich Fehlermeldungen kommen, mit denen ich die Anwender dann überfordern würde.
Daher würde ich gerne prüfen, ob es für jede Datei zusammenhängende ID-Bereiche gibt (in unserem Jargon heißen diese GAP-Tabellen).
Ein weiterer Vorteil wäre, daß ich aus vorhandenen GAP-Tabellen zusammenhängende ID-Bereiche identifizieren könnte, die noch unbelegt sind und die ich für neue Datensätze verwenden kann.
Für den 1. Datensatz also: 1 bis 3, 5 bis 6 oder kurz als Array: 1,3,5,6
Für den 2. Datensatz dann: 1, 4, 7 bis 9 oder als Array 1,4,7,9
Dann müßte ich prüfen, ob diese GAP-Tabelle überschneidungsfrei sind und hätte die Anzahl der Fehlermeldungen reduziert ohne Informationen zu verlieren.
Hat jemand eine Idee, wie man das intelligent in einen Algorithmus packt?
Ciao
Bruno