Zusammenarbeit mit SEOlytics

In unserem Webseiten Test wird sich schon bald einiges tun. Aufgrund einer neuen Kooperation mit SEOlytics werden wir hier bald umfassendere Informationen auch zum Backlink Profil und zum Ranking anbieten können.

Welche Informationen genau dargestellt werden ist noch offen. Sollten Sie bestimmte Wünsche haben, werden wir gerne versuchen diese zu berücksichtigen. Bitte schreiben Sie dazu einfach in die Comments, was Sie vermissen.

In welcher Reihenfolge wird gecrawlt?

Breadth-First Search: Hierbei werden von der Startseite aus (Level 0) alle Links verfolgt, die auf eine Webseite verweisen (Level 1). Anschließend wird rekursiv von den Level n-Webseiten aus jeder Link verfolgt bis auf Level n + 1. Es wird von der Wurzel an eine Baumstruktur Level für Level aufgebaut.

Depth-First Search: Im Gegensatz zur Breitensuche wird hier jeder gefundene Link direkt weiterverfolgt. Erst wenn auf Level n keine Verlinkung mehr folgt, wird auf Level n – 1 weitergecrawlt.

Backlink-Count: Als nächste Seite wird stets diejenige gecrawlt, auf welche nach dem aktuellen Crawlingschritt die meisten Links der bisher erfassten Seiten zeigen.

Batch-PageRank: Alle k (mit k Element von N) erfassten Seiten wird ein ungefährer Page-Rank-Wert berechnet. Die k Seiten mit dem höchsten PageRank werden im nächsten Durchlauf gecrawlt.

OPIC: Alle Seiten bekommen am Anfang eine bestimmte “cash”-Menge. Bei jedem
Crawl einer Seite wird deren “cash” an die Seiten, auf welche sie verlinkt, aufgeteilt. Die folgende Crawlingpriorität wird dann anhand der Höhe des “cash” festgelegt.

Larger Sites First: Es werden zuerst parallel mehrere Webseiten mit einer großen Anzahl an Unterseiten gecrawlt. So kann sich der Crawl über längere Zeit mit umfangreichen Seiten beschäftigen, ohne den Zielserver durch zu viele Anfragen in kurzer Zeit zu überlasten.

Auszug aus einer lesenswerten Bachelor Arbeit von Susanne Weber:
Analyse von Linkstrukturen in begrenzten Teilräumen des World Wide Web

Gesucht wird: ein Domainer

Immer wieder stolpert unser Crawler über Domains, die keinen DNS Eintrag mehr haben und nicht erreichbar sind. Möglich dass diese Domains wieder frei sind, vielleicht aber auch nicht (SEMAGER prüft keine Registry Daten). Tatsache ist, dass sich hier einige Schätze verbergen könnten, sollten diese wieder registriert und mit entsprechendem Content angereichtert werden.

Wir suchen daher einen Partner der sich mit der Prüfung und dem „greppen“ von Domains auskennt, dies seit Jahren erfolgreich praktiziert und Interesse an einer Zusammenarbeit mit einer Suchmaschine hat.

Semantische Adwords bei Google ?

Das ist neu, suche ich bei Google nach „semager.de“ wird Werbung geschaltet von elo.com. Ich bezweifele das diese diesen Suchbegriff eingekauft haben. Kann eigentlich nur bedeuten, das Google hergeht und das am meisten verwandte Keyword dazu ( = semantische Suche ) als Quasi-Suchbegriff benutzt und dazu ebenfalls Werbung schaltet.

Hm… ich glaube das könnte Ärger geben.

Update: Im Netz gibt es Hinweise darauf, dass dies tatsächlich Möglich wäre: http://www.shopanbieter.de/news/archives/5670-google-was-bedeutet-die-semantische-suche-fuer-adwords-kunden.html

Bing API nicht mehr kostenlos

Die Bing Search API, von vielen geliebt für Ihre kostenlosen Suchergebnisse von Microsoft Suchmaschine Bing, wird ab dem 1. August nicht mehr kostenlos sein.

In Zukunft müssen Anwender über den Windows Azure Marketplace eine Registrierung haben und einen Obulus bezahlen. Nach der Preisliste zu Urteilen kauft man eine Anzahl an Requests pro Monat ein und kann anschließend über diese verfügen. Verbaucht man nur die hälfte, muss man trotzdem den vollen Betrag zahlen.

Die Preise varieren zwischen 1 Euro und 1.50 Euro pro eintausend Abfragen je nach Modell und Menge, was nach meiner Meinung ein ziemlich teurer Preis ist.