Google will FTP Daten auslesen

Heute morgen ist mir ein seltsamer Eintrag in meinen Logs aufgefallen:

Jan 15 08:11:14 www proftpd[13677]: www.ng-marketing.com (crawl-66-249-72-80.googlebot.com[::ffff:66.249.72.80]) – USER anonymous: no such user found from crawl-66-249-72-80.googlebot.com [::ffff:66.249.72.80] to ::ffff:82.212.221.34:21

Es sieht so aus als versuche Google sich mit einem Anonymen Benutzer an meinem FTP anzumelden. Zwar gibt es vereinzelte Hinweise im Netz das Google das schon länger versucht, aber woher wissen die eigentlich, DASS dort ein FTP ist ??

Es gibt keinen Link dorthin! Bleibt nur die Vermutung, dass ein Port-Scan stattgefunden hat….

Kommentare:  1 Kommentar

Design und Performance Updates

Der fleißige Nutzer von Semager wird sicherlich schon gemerkt haben, dass neben einigen Design-Updates auch ein deutlicher Geschwindigkeits-Ruck durch Semager gegangen ist. Neben den Suggests, sprich Suchvorschläge sobald man anfängt zu tippen, wurde einige Scripte überarbeitet und zwischenzeitlich obsolet gewordener Programmcode gelöscht.

Das größte Update fand im Backend statt, hier gab es eine neue Server-Architektur, so dass sich unsere Kunden auf enorme Performance Schübe freuen dürfen. Z.B. können nun Keywords und deren Kategorien mit einer Geschwindkeit von bis zu 200-300 Stück pro Sekunde(!) abgefragt werden. Natürlich profitiert davon auch die Berechnung der Wortverwandtschaften, welche nun um bis zu Faktor 5 schneller berechnet werden.

Im August wird noch ein Update im Frontend stattfinden, so dass auch hier ein deutlich schnelleres Sucherlebniss stattfinden wird.


Wer hat noch CPU Ressourcen frei?

Heutige Prozessoren sind für normale Office Arbeiten und Internet eigentlich total überdimensioniert. Wer also seinen Rechner gerade mal mit 5-10% Auslastung betreibt dem sei das World Community Grid empfohlen.

Why not donate your unused computer time to help discover new materials that efficiently capture and store solar radiation as energy for later use?

Effiziente Solarenergie ist nur ein Beispiel, bei dem euer Computer helfen kann. Es gibt sehr viele Projekte die Interessant sind und gefördert werden sollten: Krebs, Aids, Wasser, … alles Projekte, bei denen die CPU eures Rechners helfen kann. Es tut euch nicht weh, hilft aber der Forschung weiter.

Über 550.000 tausend Mitglieder mit mehreren Millionen PCs nehmen daran teil. Damit kommen pro Tag über 300 Jahre Rechenkapazität zustande !!

Die Software gibt es für Windows, Apple und Linux (unter dem Windows Download ist ein Link für weitere Betriebssysteme).

PS: bitte retweeten


Semager im Ministerium für Bildung und Forschung (BMBF)

Vorträge sind was feines. Man lernt eine Menge interessanter Menschen und Möglichkeiten kennen. So geschehen letzte Woche Donnerstag in Bonn im Bundesministerium für Bildung und Forschung (BMBF). Mein Vortrag ging über semantische Tools und Algorithmen, sowie über deren Fortschritte im Laufe der Zeit. Das Gremium beschäftigte sich mit Weiterbildungsdatenbank, deren Normalisierung, Statistiken, sowie Möglichkeiten wie Besucher zu besseren Suchtreffern gelangen können.

Ankündigung hier: Agenda Infoweb Weiterbildung Gremium 2011

Bilder da: IWWB Gremium 2011


Signifikante Kollokationen

Ab sofort findet Ihr in der Webseiten-Analyse als Ergebnis die Box “Als zusammenhängende Ausdrücke erkannt” unten rechts unterhalb der Spam-Signale. Damit zeigt das Tool euch auf, welche Wörter mit sehr hoher Signifikanz immer paarweise auftreten.

Langfristig wird dies die Qualität der Keyword Ergebnisse erhöhen. Veränderungen im Ranking der Keywords untereinander sind kaum zu erwarten. Es werden lediglich einige Wörter, die sonst unmittelbar hintereinander standen, nun als ein einzelner Ausdruck zusammengefasst.

Bis dieser neue Algorythmus sichtbare Änderungen in den Keyword-Listen bewirkt, bedarf es aber noch einer Weile, da hier noch eine Menge Berechnungen zu machen sind. In der Berechnung der Webseiten-Analyse ist dieser Code jedoch schon implementiert.


« ältere Einträge