Heiner KückerMulti Markable Buffered InputStream |
|
Home Java-Seite Bit Packed Array ASM Improved heterogene Map, HMap Constraint Code Generator JSP WorkFlow PageFlow FlowControl Page Flow Engine Web Flow Engine Control_and_Command JSP_Spreadsheet Code-Generator für Option-Either-Stil in Java verbesserter Comparator Fluent-Interface Code-Generator auf Basis einer Grammatik Visitor mit Multidispatch for-Schleife mit yield-return Kognitions-Maschine semantisches Netz Domain Parser Codegenerator_für hierarchische Datenstrukturen Expression_Engine Formula_Parser Thread Preprocessor State Transition Engine AspectJ Java_Explorer DBF_Library Kalender_Applet SetGetGen BeanSetGet CheckPackage LineNumbers GradDms Excel-Export StringTokenizer JspDoc JspCheck JSP-Schulung Java Server Pages Struts Ascii-Tabellen- Layouter Ascii-Baum- Layouter Ascii-Art-Fluss- Diagramm- Parser AsciiArt AssignmentMatrix Layouter StringSerial Silbentrennung JDBC_Schlüssel- Generierung bidirektional/ unidirektional gelinkte Liste Java_Sitemap Generator XmlBuilder RangeMap StringFormatter VersionSafe XCopy JTextField CommandLine- ParamReader Bitmap-Grafik MultiMarkable- Buffered- InputStream JavaCache JdomUtil CollectionUtil XML Really Pull Parser Log-Filter Remote-Protokoll Sudoku-Generator Delegation statt Mehrfachvererbung Disjunct Interval Set WebCam_Demo Weiterentwicklung_Java Alaska-XBase++-Seite Projekte Philosophien Techniken Konzepte Sudoku Kontakt / Impressum Links SiteMap Letzte Aktualisierung: 23.11.2005 |
Multi Markable Buffered InputStream
Der BufferedInputStream aus dem JDK erlaubt das Setzen einer Markierung an der aktuellen Position und das Zurückkehren zur markierten Position. Aber das ist nur mit einer Position gleichzeitig möglich. Die Java-Klasse MultiMarkableBufferedInputStream erlaubt das Setzen beliebig vieler Markierungen. Dies ist notwendig für die Benutzung in einem XML-Parser, um einen Blick nach vorn (look ahead) zum Beispiel um festzustellen, ob jetzt ein Element ( < ) oder ein Kommentar (<!-- ) beginnt. Ein Problem bei der Realisierung dieser Klasse war der zu verwendende Puffer. Ein Puffer konstanter Grösse müsste für den maximalen Abstand zwischen den Markierungen aufgerundet auf die Lese-Block-Grösse ausgelegt werden und würde sehr viel Speicher beanspruchen. Der maximale Abstand zwischen erster Markierung und dem Pufferende müsste bekannt sein. Ein dynamisches Anpassen des Puffers (Byte-Array) würde das Umkopieren aller Daten vom alten Puffer in den neu allokierten Puffer erfordern, was zum Stocken des aufrufenden Programmes führen würde und allgemein inperformant ist. Im Moment des Umkopierens würde der Speicherplatz für beide Puffer benötigt werden. Als Lösung dieser Probleme ist mir folgender Aufbau des Puffers aus einer einfach verlinkten Liste eingefallen. Beim Einlesen des dekorierten java.io.InputStream wird jeweils ein Byte Array in der jeweiligen Puffer-Grösse angelegt. Mehrere Puffer sind als einfach verlinkte Liste verbunden. Nun bestetht das Problem, dass alte Puffer freigegeben werden müssen, um den Speicher freizubekommen (garbage collection). Der MultiMarkableBufferedInputStream hat eine Referenz auf den jeweils aktuellen Puffer, welcher eine Referenz auf den nachfolgenden Puffer hat. Falls beim Lesen das Pufferende erreicht wird, legt diese Java-Klasse einen NachfolgePuffer an, befüllt diesen und entnimmt aus diesem die zu lesenden Bytes. Der neue Puffer wird der aktuelle Puffer und der Vorgängerpuffer wird nicht mehr referenziert. Damit kann er vom Garbage Collector entsorgt werden. Falls das aufrufende Java-Programm eine Markierung setzen will, bekommt es ein Markierungs-Objekt mit der Referenz auf den jeweiligen Puffer und die Position im Puffer. Dadurch bleibt der markierte Puffer referenziert und kann nicht vom Garbage Collector entsorgt werden. Dieser Puffer hat wiederum eine Referenz auf eventuelle Nachfolge-Puffer. Durch den Link auf den Nachfolgepuffer werden alle nachfolgenden Puffer, egal wie viele, mit referenziert und können nicht vom Garbage Collector entsorgt werden. Wenn das aufrufende Java-Programm zu einer Markierung zurückkehren will, ruft es die resetMark(Mark)-Methode mit dem Mark-Objekt auf. Dies setzt den übergebenen (markierten) Puffer als aktuellen Puffer mitsamt aller Nachfolgepuffer und aktualisiert die Position. Wenn das aufrufende Java-Programm ein Mark-Objekt löscht (die Referenz) oder es aus dem Scope fällt, kann der Garbage Collector den damit verbundenen Puffer und alle Nachfolge-Puffer entsorgen, die nicht von anderen Mark-Objekten oder im jeweiligen MultiMarkableBufferedInputStream-Objekt referenziert werden. Dadurch wird erreicht, dass es beliebig viele Markierungen geben kann, deren Puffer und eventuellen Nachfolge-Puffer solange wie notwendig referenziert werden, dass beliebig weit voraus gelesen werden kann (look ahead), dass nicht mehr benötigte Puffer dereferenziert werden und somit vom Garbage Collector entsorgt werden können. Mark --------> Puffer Byte Array, Position nextEntry | +------> Puffer Byte Array, Position nextEntry | +------> Puffer Byte Array, Position nextEntry | currentBuffListEntry ----------------> +------> Puffer Byte Array, Position nextEntry | +------> Puffer Byte Array, Position nextEntry |