Netztaucher

Sitemap erzeugen leicht gemacht.

In der letzten Woche tauchte in der „i-Workerliste“:http://www.iworker.de/ die Frage nach einem Werkzeug zum Erzeugen einer Sitemap auf. „Tobias Daur“:http://www.so-nso.de/~phpwcms/index.php ist so nett und schreibt eine Zusammenfassung. Etwas ausführlicher.

Zusammenfassende Betrachtung

Unter Windows ist mein Favorit xenulink, unter Linux webcheck. Letztlich fehlt aber nach wie vor ein Tool, das eine grafische Sitemap (svg, PDF, whatever) baut und darüber hinaus so intelligent ist bei identischem Title ein weiteres Merkmal heranzuziehen. Als Renderer kämen Flowcharter oder Mindmapper in Frage, die müßte man entsprechend füttern. Netobjets Fusion konnte zumindest eine grafische Darstellung mal, aber mit dem Tool will man eigentlich nicht arbeiten.

Zur Erzeugung einer Sitemap wurden folgende Werzeuge genannt:

* „Visio“:http://www.boxesandarrows.com/view/automating_diagrams_with_visio

* „cpan“:http://www.cpan.org
Ich habe den Scripts-Bereich von cpan durchsucht mit „map“ und Am ehesten in die richtige Richtung geht linkcheck und XLinks. Beide können Sites crawlen und Links zu prüfen. Stellen aber (kurz in den Code geguckt) offenbar keine Sitemaps dar.

* „sitemap-generator“:https://www.google.com/webmasters/sitemaps/docs/de/sitemap-generator.html#config
Der produziert, wie so viele andere auch, eine google-Sitemap. Das ist eine xml-Datei, die Google bei der Durchsuchung der Site hilft. Die Beispieldatei, die Google ausgibt, zeigt: Die XML-Datei arbeitet nicht mit einer Baumstruktur sondern gibt pro Seite den Pfad aus. Hilft also nichts, denn es werden weder Pfade/Hierarchien dargestellt noch ist das menschenlesbar. Ein weiteres, sehr simples Werkzeug ist „dieser Onlinegenerator“:http://www.sitemapspal.com/

* „webcheck“:http://ch.tudelft.nl/~arthur/webcheck/
Ein Python-Script. Fix installiert. Kommandozeilenbasiert. Mit recht mächtigen Paramtern, wie’s aussieht. Erzeugt als Report ein Verzeichnis mit einigen HTML-Dateien – hübscher und übersichtlicher als der Report von Xenulink. Eine Option zum Einstellen, daß statt title H1 rausgegeben werden soll, habe ich nicht gefunden, so daß dasselbe Problem wie bei Xenulink auftritt. Aber das Teil ist OS und plugin-fähig, so daß mit ein wenig Arbeit. Webcheck ist übrigens in Debian-Testing enthalten (ich habe hier stable).

* „Wget + shell-tools“:http://de.wikipedia.org/wiki/Wget
Klar, die Site mit wget ziehen ist nicht das Problem. Wenn ich mir nun aber eine Repräsentation der Sitestruktur erzeugen will, dann bedeutet das, daß ich mir das Tool, das ich suche, selber programmiere. Das geht zwar, aber genau das wollte ich ja vermeiden

* „Xenu“:http://home.snafu.de/tilman/xenulink.html
Ein Windows-Tool. Einfach zu installieren, produziert eine mächtig aussehende Tabelle. Und einen Report als HTML. Darin eine „Site Map“, die den Title der jeweiligen Seite ausgibt und Links auf Folgeseiten einrückt. Im Prinzip das was ich brauche. Nicht gerade schön, nicht das Traumtool für diesen Zweck (ja, Lutz, die blaue Blume!), aber tut’s. Naja, bis man es auf eine Site losläßt, die immer denselben Title verwendet Da fehlt dann eine Parametrierung wie „zeige statt title den 1. H1 jeder Seite an“ oder sowas.

* „Freemind“:http://freemind.sourceforge.net/wiki/index.php/Main_Page
Freemind bietet einen browse-Modus, und wirkt so, also könne man damit Websites durchbrowsen. Ich habe ein wenig gegoogelt, weil es bei mir nicht klappte, und vermute nun daß dahinter folgende Funktion steckt: Mit Freemind erstellte Mindmaps sind als HTML exportierbar und als Website darstellbar, solcherart erstellte Websites kann man direkt mit Freemind betrachten. Bei anderen öffnet Freemind den Standard-Browser. Tut’s also nicht. Allerdings könnte man das HTML-Format von Freemind analysieren und eventuell mit einem eigenen Skript anhand der webcheck-Daten erzeugen, so daß Freemind der grafische Renderer wäre. Ausgehend davon habe ich den Vorschlag weiterverfolgt, mindmapper zu testen. Mein Debian gibt mir vym und kdissert raus. Beide habe ich installiert, beide scheinen das nicht zu können.

Ich habe das Erstellen einer Sitemap mit Freemind selbst ausprobiert. Es überzeugt. Einziger Nachteil, die zu mappende Webseite muss lokal vorliegen. Dafür geht die Erzeugung total fix und die Sitemap lässt sich in allen Formaten die Freemind schreiben kann exportieren. Hier ein Screenshot der erzeugten Sitemap:
Sitemap mit Freemind

3 Kommentare
  1. Hendrik Knechtel
    Hendrik Knechtel sagte:

    Wollte nur mal nen Kommentar zu dem hier erwähnten Programm Freemind loswerden. Sieht ja ganz toll aus. Hatte aber laut der Beschreibung auf dieser Seite gehofft, das ich den Navi-Plan unserer Firmenwebseite damit ganz automatisch erstellen kann. Das war dann wohl ein Irrtum oder falsch erklärt. Ich kann mir damit die Ordnerstruktur anzeigen lassen (siehe Bild oben), aber keine grafische Sitemap erstellen (automatisch). Oder habe ich den Begriff Sitemap völlig falsch verstanden?????

    MFG

    Antworten
  2. Hendrik Knechtel
    Hendrik Knechtel sagte:

    Nun gut, ich dachte das Programm erstellt mir eine grafische Sitemap, auf der die verlinkung der Webseiten untereinander zu erkennen ist.

    Antworten

Dein Kommentar

An Diskussion beteiligen?
Hinterlasse uns Deinen Kommentar!

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.