Heiner Kücker

HTML-Tabellen-Parser

Home

Java-Seite

Alaska-XBase++-Seite

 . PrgStru

 . HtmlTabellenParser

Projekte

Philosophien
Techniken


Konzepte

Sudoku

Kontakt /
Impressum


Links

SiteMap





Letzte Aktualisierung:
02.12.2001
HtmlTabellenParser - Parser für HTML-Tabellen in Xbase++

Unterstützt in dieser Version noch keine geschachtelten Tabellen und ist noch oldfashioned (nicht als XBase-Klasse) geschrieben.
Table-Header <TH> werden noch nicht beachtet.
Wird von mir aber laufend aktualisiert.
Außerdem werde ich noch Fehlertoleranz gegen fehlende </TABLE>-, </TR>-, </TH>- und </TD>-Tags einbauen.

HTML-Tabellen kann man z.B. mit der be-connected-Library von Markus Reuscher aus dem Web holen.


Funktionen:

PROCEDURE MAINZur Verwendung der Funktionen des Parsers bitte auskommentieren
HtmlTabellenParseeigentliche Parser-Funktion, die Funktion HtmlTabellenParse erzeugt ein mehrdimensionales Array mit den Tabellenspalten
i_HtmlTabellenParseparst den Text zwischen <TABLE ...> und </TABLE>
erzeugt ein mehrdimensionales Array mit den Tabellenspalten
HtmlTabellenZeileParseparst eine HTML-Tabellen-Zeile zwischen <TR ...> und </TR>
liefert ein Array zurück
suchTagsuchen eines Tag´s in dem übergebenen HTML-Text
das Tag wird ohne einschließende spitze Klammern angegeben
zurückgegeben wird die Position des "<" ( 1-basiert ) des gesuchten Tag´s
Position Null heißt nicht gefunden
geheNachTagPosition nach dem aktuellen Tag suchen
suchTagVomEndesuchen eines Tag´s in dem übergebenen HTML-Text vom Ende aus
das Tag wird ohne einschließende spitze Klammern angegeben
zurückgegeben wird die Position des "<" ( 1-basiert ) des gesuchten Tag´s
Position Null heißt nicht gefunden
i_suchTaginnere Funktion für suchTag
weitersuchen falls erstes Zeichen stimmte
die inkrementierten Positionen bleiben lokal (auf Stack) wodurch die Positionen in der aufrufenden Routine erhalten bleiben
zurück geliefert wird logisch ja/nein
es wird impliziert, daß nach dem Tag-String ein Leerzeichen (Tag mit Optionen) oder ein < folgt
schneideLinksAbAbschneiden einer Anzahl Zeichen von einem String links
arr_haeng_anAnhängen eines Arrayïs an ein Array
im Gegensatz zu aadd ist das angehängte Array nur ein Eintrag im Original-Array
subs1Substring auf nur ein Zeichen
uppCompareVergleich nicht case-sensitive
arr_zeigAnzeige Array zum Debugging
getHtmlTabellenCellHolen eines Tabellen(Array)-Elements
sucheNachLinksAbsuchen eines Strings nach einem Tag von einer bestimmten Position an rückwärts
ascii2ansiString von ASCII-Code zu ANSI-Code umwandeln
ansi2asciiString von ANSI-Code zu ASCII-Code umwandeln


Download der Quelldateien HtmlTabellenParser.zip

Installation:

Entpacken in Verzeichnis Ihrer Wahl (z.B. G:\HtmlTabellenParser)

Kompilieren und Linken mit pbuild.

Start mit HtmlTabellenParser.

Achtung: Erweiterungen und Fixes stelle ich ohne Historie und ohne Ankündigung hier bereit.
Deshalb am besten immer die letzte Version runterladen.

Lizenzbedingungen:

Die Programme, Quelltexte und Dokumentationen können ohne irgendwelche Bedingungen kostenlos verwendet werden.
Sie sind Freeware und Open Source. Für Fehler und Folgen wird keinerlei Haftung übernommen.

Hinweise zur Fehlerbeseitigung und Verbesserung sind mir willkommen.

Ich freue mich auch über Feedback bezüglich der erfolgreichen Verwendung meiner Sourcen.

Bei Fragen helfe ich gern mit Hinweisen oder zusätzlicher Dokumentation, falls ich dafür Zeit habe.