buchspektrum Internet-Buchhandlung

Neuerscheinungen 2012

Stand: 2020-01-07
Schnellsuche
ISBN/Stichwort/Autor
Herderstraße 10
10625 Berlin
Tel.: 030 315 714 16
Fax 030 315 714 14
info@buchspektrum.de

Alexander Burgess

Segmentierung von Webseiten


Heuristik zur Segmentierung von XHTML-Seiten für die rauschfreie Suche und Indexierung
Aufl. 2012. 100 S. 220 mm
Verlag/Jahr: AV AKADEMIKERVERLAG 2012
ISBN: 3-639-42940-0 (3639429400)
Neue ISBN: 978-3-639-42940-4 (9783639429404)

Preis und Lieferzeit: Bitte klicken


In diesem Buch wird ein Verfahren zur Segmentierung von Webseiten in kohäsive, semantische Teile vorgestellt. Dabei werden rauschende Komponenten, wie Werbung, Menüs, Fußzeilen usw. von informativen Komponenten getrennt. So wird der eigentliche Inhalt eines XHTML-Dokuments, insbesondere einer Webseite, extrahiert. Die beschriebene Heurisitk vollzieht dies auf Basis einer Analyse des Textes der Seite und deren XHTML-Strukturen, in dem davon Verhältnisse abgeleitet werden. Anhand dieser Verhältnisse und der daraus bestimmten Kriterien sollen die einzelnen Komponenten gefunden und extrahiert werden.
hat sein Studium der Informatik im Jahr 2010 an der Hochschule Rosenheim erfolgreich abgeschlossen. Derzeit ist er als Java-Seniorentwickler beim Bayerischen Rundfunk beschäftigt.