Kategorisierung von Webseiten und Texten

In diesem Podcast geht um die automatische Kategorisierung von Texten, im speziellen um die von Webseiten. Es wird kurz auf verschiedene Möglichkeiten zur Kategorisierung von Webseiten eingegangen.

Natürlich sind die vorgestellten Methoden auf alle Textdaten anwendbar, ob Bücher, Auszüge, Artikel oder Webseiten.

Stichworte: Kategoriesysteme, Ontologien, Worthäufigkeit, Themencluster, Vektoren, Gravitationszentrum, “Kreise zeichnen ;-)

Die Inhalte sind vielleicht für den ein oder anderen ein wenig zu theoretisch, das liegt aber nunmal in der Sache dieses Themas. Danach wißt Ihr aber trotzdem ungefähr bescheid :-) . Viel Spaß

PS: Hintergrundmusik via CCMixter (The Savvy & The Chic Vol.1 *mixed by Hektor Thillet*).

Diese Artikel könnten Sie auch interessieren:

Name (notwendig)
Email (notwendig, wird aber nicht veröffentlicht)
Website