Textcloud API, Anwendungsbeispiele und Beschreibung
In diesem Podcast geht um die Textcloud API. Es wird intensiv auf die Verwendung eingegangen und alle Parameter besprochen.
Zusammengefasst geht es bei der TextCloud API, um Textextraktion. Welches sind die wichtigsten Wörter/Konzepte eines Textes? Nach Übergabe eures Textes erhaltet Ihr eine formatierte Liste der Wörter zurück.
An zwei, drei Stellen kann man mich nur schlecht verstehen. Sorry dafür, gelobe Besserung
.
Musik wieder via CCMixter (Scarecrow – Mississippi Kite, DoKashiteru – Our Slanted Voices, Eradan – Fortune).
Semager schlägt Metager ….. – nicht wirklich
Betrachtet man die Daten einiger Webseiten die durch “irgendwelche” Messungen versuchen festzustellen, wer wieviel Traffic und Besucher auf seiner Webseite hat, wird feststellen müssen, dass diese Tools ja ganz nett sind, um eine Tendenz festzustellen, aber denkbar ungegeignet, um mehrere Webseiten miteinander zu vergleichen.
Sehen wir uns mal die Suchmaschinen Semager und Metager im Vergleich an.
Bei Alexa:
Bei Alexa, dem vielleicht bekanntesten Trafficportal stimmen zwar die Tendenzen der einzelnen Webseiten, allerdings stimmen die Größenordnungen nicht wirklich. So weiß ich aus erster Quelle wieviele Suchanfragen täglich bei Metager reinkommen (40.000 – 60.000) und bei mir (4.000 – 6.000 zieht man alle APIs mal ab). Faktor 10 !! Und trotzdem zeigt der folgende Graph eine erstaunliche Übereinstimmung.

Die Vermutung, dass viele SEOs via Firefox und Alexa Plugin Semager nutzen liegt nahe.
Bei Compete:
Bei Compete sieht es ganz ähnlich aus. Auch hier kann man Tendenzen zwar halbwegs richtig ablesen, aber die Größenordnungen stimmen nicht. Zudem kommt man nicht umhin, eine gewisse Ähnlichkeit zwischen Alexa und Compete festzustellen…

Bei Quantcast:
Leider funktioniert die Einschätzung bei Quantcast überhaupt nicht, da für beide Domains nicht genügend Daten vorhanden sind.
Bei Google Trends:
Endlich ein Lichtblick, hier scheinen sowohl die Tendenzen als auch die Größenordnungen zu stimmen. Google Trends scheint demnach die besten Quellen zu haben.

Wen gibt es noch?
- Comscore – sicherlich eine sehr glaubwürdige Firma. Nur kann man hier nicht die Daten für seine Webseite abrufen, es sei denn man wäre ein Global Player, dann ist man vielleicht dabei..
- Techorati – gut wenn man Blogs miteinander vergleichen will. Aber auch nur gut und auch nur für Blogs.
Und da verließen Sie Ihn auch schon. Mehr als die hier genannte gibt es leider nicht wirklich. Vielleicht hier und da noch ein paar Nischen und sicherlich auch vieles das aus einer Linkanalyse heraus interessante Rankings erstellen kann. Aber was wirkliche echte Besucher anbelangt, ist es rar gesäht. Google hat aufgrund seiner Adsense und Analytics Daten hier einen meiner Meinung nach uneinholbaren Vorteil.
Semantische Katholiken
Mal ganz ehrlich, wenn man nach evangelische gemeinde neustadt bei Google sucht und stattdessen die katholische Kirche findet, kann doch etwas nicht stimmen.
Ich vermute mal ganz stark, dass Google nun auch vermehrt Semantik in die Suchergebnisse mit einbezieht, zumal der Begriff “evanglisch” unter den ersten beiden Treffern auf deren Homepage nicht ein einziges Mal vorkommt. Und das hier Jemand eine Google-Bombe gelegt hat, kann ich mir ehrlich gesagt auch nicht vorstellen.
Bleibt nur übrig, dass Google eine semantische Nähe von evangelisch zu katholisch berechnet hat.
.. was wohl die Kirche dazu meint?
Na, da bin ich ja froh, das das bei mir nicht passiert
. Stattdessen findet Semager sogar die “evangelische kirchengemeinde neustadt”. Wenn das mal nicht semantisch ist …






