LabVIEWForum.de
string Vergleich mit Prozent Ausgabe - Druckversion

+- LabVIEWForum.de (https://www.labviewforum.de)
+-- Forum: LabVIEW (/Forum-LabVIEW)
+--- Forum: LabVIEW Allgemein (/Forum-LabVIEW-Allgemein)
+--- Thema: string Vergleich mit Prozent Ausgabe (/Thread-string-Vergleich-mit-Prozent-Ausgabe)

Seiten: 1 2


string Vergleich mit Prozent Ausgabe - Virusblocker - 19.10.2009 14:54

Hallo,
folgendes Problem. Ich möchte zwei Strings miteinander vergleichen, die nicht immer die gleiche länge haben. Ein String hat mal ein Buchstaben mehr als der andere, sonst sind die Strings gleich.
Es handelt sich dabei um Strings aus einer OCR.
Beipiel.

erwarteter String: Keine Meldungen verfügbar.
erkannter String: Kaine Meldungen verfiigbur.

Mit meinem jetzigen VI ist der Vergleich ab dem doppelten "i" hinfällig. Allerdings erkennt man als Mensch, das da ja doch noch 3 gleiche Buchstaben existieren danach. Das "g", "b", "r" und der "." Nur sind diese eben um eine Stelle verschoben und so nicht mehr gleich für meine Schleife. Teileweise kommt diese Doppellung von Buchstaben auch am Anfang vor. Wenn der erkannte String am Anfang anstatt einem "K" nun eine "Kk" erkennt, ist alles danach hinfällig, auch wenn es ja quasi richtig wäre.
Kann ich da noch irgendwas machen? Für jeden Gedanken wäre ich dankbar.

Gruß
Wolfgang

Lv80_img [attachment=21827]

Lv86_img [attachment=21828]


string Vergleich mit Prozent Ausgabe - schrotti - 19.10.2009 19:57

Eine wirklich interessante Frage. Zur Anregung hier erst einmal ein Link, denn eine sinnvollere Antwort fällt mir gerade nicht ein.

http://www.bonk-consulting.de/images/20050...5115_973692.pdf


string Vergleich mit Prozent Ausgabe - Virusblocker - 20.10.2009 14:32

Hallo Julius,
danke für den link. Hab das Dokument mal durchgearbeitet, und ich bin auch einen Schritt weiter gekommen. auf jedenfall bedeutend weiter als vorher.

Falls aber noch jemand anderes eine Idee hat, ist diese auch herzlich willkommenSmile

Gruß
Wolfgang


string Vergleich mit Prozent Ausgabe - schrotti - 20.10.2009 14:52

Das Verfahren 2.2.2 Umschlagsrepräsentation zusammen mit Levenshtein ließe sich evtl. mit relativ geringem Aufwand umsetzen.


string Vergleich mit Prozent Ausgabe - Virusblocker - 20.10.2009 16:12

Habe jetzt erstmal 2.2.3 n-Gramme umgesetzt. Ging recht fix und liefert auch erstmal "gute" Ergebnisse. Zum probieren meiner Automatisierung reicht es erstmal. Wenn das Zeitmäßig klappt bei meiner DA, werde ich mich da auch nochmal tiefer reinkniehen, aber erstmal stehen andere Dinge weiter oben auf der Liste...
Danke nochmal!!!

Edit: Ha da ist ja nen VI hinter deinem Link. Gerade erst gesehen:)Dann werde ich mir das morgen doch nochmal anschauen, wenn Zeit ist. Besten Dank...


string Vergleich mit Prozent Ausgabe - TSC - 20.10.2009 16:20

ich muss gestehen, ich habe die verlinkten Ansätze nicht gelesen. Meine Idee wäre, die Differenz der Sringlängen zu betrachten. Wenn du also vorher weißt, dass die Strings um ein zeichen verschieden sind, müsstest du ab dem ersten "fehler" eben schaun, ob du ihn durch entsprechende verschiebungen "bereinigen" kannst.

Nur ein ganz naiver, nicht durchdachter ansatz der mir grade durch den kopf ging.

LG
Torsten


string Vergleich mit Prozent Ausgabe - Virusblocker - 21.10.2009 06:29

Morgen Torsten,
diesen Gedanken hatte ich auch schon. Den hab ich aber erstmal wieder verworfen. Warum weis ich nichtmehr.

Gruß


string Vergleich mit Prozent Ausgabe - schrotti - 21.10.2009 08:53

Mit dem von mir verlinkten VI, welches den Levenshtein Distance berechnet, klappt das eigentlich sehr gut. Zwischen den beiden von dir genannten Strings berechne ich eine Ähnlichkeit von 84,6154%. Sollte für einen positiven Vergleich langen.


string Vergleich mit Prozent Ausgabe - Virusblocker - 21.10.2009 11:36

Hallo Julius.
Habe mir das nun auch mal schnell zusammengebastelt.
Was mir aber noch nocht einleuchtet. Wenn ich wie in dem PDF beschrieben das Verhältnis aus Abstand/Länge des Strings (bei meinem Beispiel also 5/27) berechne, komme ich auf ca 15%. Um auf die ca 85% zu kommen ist ja 1-X nötig.
Warum ist das so? Ich kann mir das mathematisch gerade nicht herleiten. Vermutlich stehe ich gerade etwas auf dem Schlauch...


string Vergleich mit Prozent Ausgabe - schrotti - 21.10.2009 11:46

1-x hört sich doch gut an, denn immerhin ermitteln wir hier den Unterschied zwischen beiden Strings.