Eigentlich bin ich ja nicht unglücklich darüber, dass das BRD-staatsfernsehen ARD seinen videotext auch im internetz zur verfügung stellt. Ich bin nur ein bisschen unglücklich darüber, wie die das getan haben. Weil das ziemlich stümperhaft ist und die benutzung dieses dienstes eher erschwert.
Es ist ja leider so, dass ich als obdachloser nicht immer an einer fetten internetleitung hänge. Diese frische sammlung von gequirlter scheiße würde ich dennoch immer wieder gern einmal lesen, da sie eine schöne zusammenfassung jener meldungen der kontentindustrie ist, durch die ich mich sonst nicht so gern quäle. Es fehlt mir an einem archivdienst.
Deshalb habe ich eben in einem anfall geistiger umnachtung gedacht, dass ich mir einen archivdienst selbst basteln könnte. Meine ansprüche daran sind eher klein. Ein kleines programm soll die ganzen webseiten regelmäßig abholen und mir als eine textdatei zumailen. Dabei soll über jeder meldung der zeitliche stand und die seitennummer stehen. Kaum hatte ich den gedanken gedacht, hatte ich auch schon den editor geöffnet und losgelegt.
Das war eindeutig zu schnell.
Denn ich habe nicht daran gedacht, was für einen kwelltext die ARD produzieren würde.
Es gibt ja viele möglichkeiten, einen vorformatierten text in das internetz zu bringen. Man kann zum beispiel dieses seit frühesten zeiten zum standard gehörende pre-täg nehmen, dass sich mittels CSS auch gut an die jeweiligen darstellungsbedürfnisse anpassen lässt. Und die farblichen hervorhebungen lässen sich bequem als spans mit einer CSS-klasse realisieren, es gibt ja nur acht farben (und die beiden attribute blinkend und versteckt). Weil das so einfach ist, habe ich mir auch gedacht, dass die das so machen würden.
Aber dort denkt man anders.
Man denkt bei der ARD nämlich, dass zur formatierung eines vorformatierten textes das font-täg viel adäkwater ist. Und deshalb wird dieser ganze text mit font formatiert. Natürlich gehen dabei diese ganzen formatierungen mit leerzeichen am zeilenanfang verloren, und das problem wird mit der entität für nicht-umbrechende leerzeichen gelöst. Im ergebnis entsteht ein HTML-dokument, dass sich nur noch mit großer mühe auf andere weise verarbeiten lässt. Eine medienanstalt zeigt hier ihre ganz besondere medienkompetenz…
Meine einzige erklärung: die wollen nicht, dass man so etwas leicht archivieren kann.
(Aber ich gebe so schnell nicht auf!)