Der Zugriff eines Benutzers auf das Internet läuft meist vom Rechner
des Benutzers über einen sog. Proxy-Server des Providers oder des
Unternehmens in das Internet:
Bei dem Aufruf einer Internet-Adresse (URL) schaut das Programm des
Benutzers (Browser) zunächst im Cache des Benutzers, ob die angeforderte
Seite dort vorhanden ist. Wird die gesuchte Seite dort gefunden, so
wird sie in den Browser geladen und dem Benutzer angezeigt. Der Cache
ist ein individueller Speicher, dessen Größe man sich selber
einstellen kann. Wenn der Cache auf 5 MB Größe eingestellt
ist, reicht diese Größe aus, um einige hundert Internet-Seiten
zu speichern.
Wird nun die gesuchte Seite im Cache des Benutzers nicht gefunden,
so reicht das Programm den Benutzerwunsch zum nächsten Internet-Knotenrechner
weiter. Das ist bei individuell-privater Nutzung der Rechner des Internet-Providers
(T-Online, AOL, CompuServe usw.), der dem Benutzer die Auffahrt auf
die Datenautobahn ermöglicht. Beim Internet-Zugang in einer Firma
ist es in der Regel ein besonderer Rechner, der sog. Proxy-Server.
Der nächste Internet-Knotenrechner bzw. Proxy-Server verfügt
seinerseits wieder über einen Zwischenspeicher, in den jede neu
angeforderte Internet-Seite beim erstmaligen Aufruf geladen wird (Proxy-Cache).
Dadurch soll beim wiederholten Anfordern dieser Seite vermieden werden,
daß die Seite neu aus dem Internet geladen werden muß. Der
Proxy-Server schaut also bei der Anforderung einer Seite durch einen
Benutzer zuerst nach, ob die Seite schon in seinem Cache gespeichert
ist. Wenn ja, schickt er die Seite direkt an den Benutzer, ohne daß
ein Zugriff in das wirkliche Internet stattgefunden hat. Erst wenn die
Seite im Proxy-Cache nicht gefunden wurde, wird die Suche der Seite
im Internet fortgesetzt und eine direkte Verbindung zum in der angeforderten
URL benannten Rechner aufgebaut. Dieser schickt dann die Seite über
den Proxy-Server als Zwischenstation an den Benutzer.
Sowohl lokale als auch Proxy-Cachemechanismen führen zu einer
deutlich verringerten Zählung von PageImpressions, besonders bei
Angeboten, die sowohl intensiv (viele Nutzer) als auch lange (lange
durchschnittliche Verbindungszeiten) genutzt werden.
Auch die Ermittlung von Nutzerzahlen ("Visits", "unique users") stößt
auf einige technische Schwierigkeiten: Hinter einem Rechnernamen bzw.
einer Internet-IP-Adresse (z.B. 'spleenux.spiegel.de' oder '194.77.34.12')
können sich mehrere Nutzer mit jeweils eigenen Web-Browsern verbergen.
Das liegt zum einen an der Zuweisung von dynamischen Internet-Adressen,
die bei vielen Internet-Service-Providern (ISP) zum Einsatz kommt. Die
Provider weisen den gerade aktiven Nutzern Adressen aus einem Pool zu,
dadurch können sie mit wenigen Adressen prinzipiell eine große
Zahl von Nutzern bedienen. Derartige Methoden müssen besonders
große Provider wie Compuserve oder T-Online einsetzen. Da diese
Dienste aber ohnehin mit Cache-Servern arbeiten, ist die Ermittlung
von halbwegs korrekten 'Visit'-Zahlen für Nutzer aus dieser Gruppe
nahezu unmöglich, wenn man nicht spezielle Zusatzinformationen
auswertet.
Zum anderen setzen viele Unternehmen mittlerweile aus Sicherheitsgründen
sogenannte 'Firewalls' ein. Diese Firewalls setzen interne IP-Adressen
auf eine einzige externe IP-Adresse um, die bei Zugriffen auf Webserver
auch stets im Log erscheint, auch wenn unterschiedliche Angehörige
des Unternehmens auf das Angebot zugegriffen haben. Kommt beim Unternehmen
noch der Einsatz eines Proxy-Servers hinzu, ergibt sich eine ähnliche
Situation wie bei großen ISP.
In den Browsern kann man die Abfrage des Proxy-Servers umgehen:
Netscape Navigator:
Microsoft Internet Explorer:
Übrigens: Die Benutzeraktivitäten werden an verschiedenen
Stellen protokolliert, so auch im Rechner des Benutzers. Auch wenn der
Cache gelöscht ist, können die in den letzten 30 Tagen besuchten
URLs aufgerufen werden (z.B. bei Netscape Navigator mit dem Befehl "about:global")!
Anders verhält es sich auf der Proxy-Server-Ebene. Die meisten
Server sind so eingestellt, daß nur die "echten" Internet-Zugriffe
festgehalten werden, nicht aber die Zugriffe, die aus dem Cache des
Proxy-Servers bedient wurden.
In einem Proxy-Server-Protokoll ist in der Regel pro Zugriff festgehalten,
wer das war (Kennung des anfordernden Rechners), was angefordert wurde
(Internet-Adresse der angeforderten Seite), wann dies geschah (Datum
und Uhrzeit) und wieviele Bytes dabei übertragen wurden.
Man kann allerdings noch viel mehr protokollieren, z. B. auch, welche
Begriffe man bei der Benutzung einer Suchmaschine eingegeben hat.
Also: Wenn Sie unsere Web-Site bereits besucht haben, vergessen Sie bitte
nicht bei den jeweiligen Seiten die regelmäßige Aktualisierung!
Denn Ihr Browser hat evtl. noch im Cache (Zwischenspeicher) die Version
zum Zeitpunkt Ihres letzten Besuches gespeichert.
Bei Netscape Navigator (engl. Version) mit "Reload"
bei Microsoft Internet Explorer mit "Aktualisieren".