Logfile-Analyse Begriffserklärung und Definition

logfile-analyseDas Auswerten von Webserver-Dateien oder personenbezogenen Daten von einem Benutzer ist in Deutschland nur unter Einwilligung der betroffenen Person zulässig. Die Zustimmung muss für die Verwendung der Daten von dem Nutzer nachzuvollziehen sein. Eine versteckte Zustimmung in Form einer Zustimmung der allgemeinen Geschäftsbedingungen ohne einen konkreten Hinweis auf den Eingriff in die Privatsphäre ist nicht zulässig. Die Protokollierung wird am häufigsten bei Webservern und Firewalls durchgeführt.

Der Hintergrund bezieht sich in der Regel auf das Onlinemarketing (PR). Die Firmen nutzen Programme, um das Verhalten der Webseitenbesucher zu kategorisieren und einen Vergleich zu konkurrierenden Seiten im Internet herstellen zu können. Die Gebrauchstauglichkeit eines Softwareproduktes wird in der ISO-Norm 9241 Teil 11 beschrieben. Im Vordergrund steht die Auskunft, wie das Verhältnis vom erreichten Ziel zum definierten Ziel ist (Effektivität).

Das zweite Kriterium ist die Wirtschaftlichkeit von dem Produkt. Die Logfile-Analyse erlaubt es, Statistiken zu interpretieren die eine Optimierung der eigenen Internetseite in Bezug auf die Effektivität und die Effizienz aufzeigen.

Die Kommunikationsranddaten der Logfile-Analyse

Die Randdaten enthalten Informationen über die elektronische Struktur. Relevant sind alle Geräte die Daten über Personen aufzeichnen können, unabhängig davon, ob diese mobil oder stationär sind. Dazu gehören Geräte wie Telefone, Datenspeicher, Software, Netzwerkkomponenten, Faxgeräte, Datenverarbeitungsanlagen und einige mehr. Es wird protokolliert, wer mit wem kommuniziert hat oder wie lange die Kommunikation angehalten hat.

Der Telefonanschluss oder die E-Mail Adresse sind statische Daten zum Identifizieren der Quelle. Die IP (Internet Protocol) Adresse kann statisch in einem System eingetragen sein oder durch eine Software dynamisch vergeben werden. Der NAT (Network Address Translation) Router ersetzt die Datenpakete durch andere, damit sie in andere Netze weitergeleitet werden. Für die IP-Adresse, die die Quelle und das Ziel identifiziert bedeutet das die Adresse der Quelle im NAT-Router verändert wird.

Die veränderte Adresse wird die öffentliche Adresse genannt, die im Internet zu sehen ist und unterschiedlich zur privaten Adresse von der Source ist. Bei IPv4 ist diese Technik weit verbreitet aufgrund der Knappheit der IP Adressen. Die Abläufe in Anwendungen, Datenbanken und Servern können durch die Randdaten aus den Protokolldateien gelesen werden. Die Logfile-Analyse ist in der Lage die Protokolldateien mithilfe einer entsprechenden Software zu lesen. Bei einem fremden Webserver ist dies vom Gesetzgeber verboten. Den eigenen Webserver mittels einer Software zu analysieren ist erlaubt.

Das Verhalten, wann User auf eine Seite zugreifen, wie lange sie auf einer Seite sind oder an welchem Punkt sie die Seite verlassen, sind wichtige Informationen für die PR (Public Relation). Ein umstrittener Punkt ist das Auswerten von Telekommunikationsdaten. Es können ohne eine Analyse die Dauer und der Gesprächsteilnehmer ermittelt werden. Dieser Zustand ist legal. Nur mit einer Verfügung vom Gesetzgeber darf durch eine Logfile-Analyse der Kommunikationsinhalt geprüft werden.

Schwierigkeiten bei der Logfile-Analyse

Das Internetprotokoll HTTP (Hyper Text Transport Protocol) ist in dem OSI-Modell in der Anwendungsschicht zu finden. Es wurde geschaffen, um die Seiten im Internet auf dem jeweiligen Browser anzuzeigen. Ursprünglich ist HTTP ein zustandsloses Protokoll. Diese Zustandslosigkeit bedeutet, dass jeder Zugriff von einem Benutzer als eigene Transaktion angesehen wird. Es macht keinen Unterschied, ob der gleiche User innerhalb der Internetseite auf eine Unterseite verzweigt. Das Wechseln ist eine eigenständige Transaktion. Es wurden keine Sitzungsinformationen ausgetauscht und als Ganzes protokolliert. Ein zustandsbehaftetes Protokoll wie FTP (File Transfer Protocol) muss für jede Sitzung im Internet eine Authentifizierung aufbauen.

Erst durch eine Session-ID kann das zustandslose Protokoll HTTP eine Identifikation mitführen. Die Session-ID merkt sich die jeweilige Webanwendung und kann die Anfragen einer gemeinsamen Sitzung zuordnen und protokollieren. WebDAV (Web-based Distributed Authoring and Visioning) ist eine Erweiterung von dem HTTP/1.1 Protokoll. Mit dieser Erweiterung kann HTTP/1.1 ganze Verzeichnisse laden. Es wurden einige Attribute im Paketkopf von HTTP hinzugefügt und Anfragemethoden entwickelt, die ein Webserver beantworten muss.

Mit der HTTP-Methode PROFIND werden Ressourcen in Erfahrung gebracht, die Auskunft über die Webarchitektur (URL), Dienste oder Software von einem System in einem Logfile dokumentieren. Die PROPATCH Methode ändert oder löscht eine Ressource. Der Hintergrund ist, dass die Transaktionen nicht durch mehrere gleichzeitig laufende Aktionen die Datenintegrität beeinflussen.

Mit COPY wird eine Ressource kopiert und als URI (Uniform Resource Identifier) angegeben. Ein URI ist eine Zeichenfolge zur Identifizierung von Webseiten, E-Mail Empfängern und Aufruf von Webservices. Bei der Logfile-Analyse kann aus der URI der Inhalt der Ressource ermittelt werden und wo diese zu finden ist. Als Ressource sind in diesem Zusammenhang die Dateien auf einem Webserver zu verstehen. Die URI kann nicht nur Dateien als Ressource auswerten. Telefonnummer, Sozialversicherungsnummer oder E-Mail Adresse sind in der RFC 2396 von 1998 als Ressource anzusehen, die als eine Identifikation dient.

Besteht kein Zugriff auf den Webserver, kann mit Hilfe von transparenten Pixeln, die in Grafiken oder anderen Textteilen versteckt eingebunden sind, ein Zugriff auf die Logdatei vom Webserver geschaffen werden. Der Zugriff erfolgt über die unsichtbaren Pixel, die im Paketkopf ein PROFIND Attribut gesetzt haben.

Fehler erkennen durch Logfile-Analyse

Die Logdatei schreibt alle Prozesse von einem Computersystem mit. Die Protokolldatei dokumentiert den Sender und Empfänger von einem Dienst mit dem korrekten Zeitstempel. Ein wichtiger Hinweis für den Verwalter ist, was der Empfänger für einen Dienst oder Prozess angefordert hat. Für die Logfile-Analyse ist entscheidend, womit ein Dienst angefordert worden ist. Bei TCP/IP Netzwerken ist das TCP Protokoll das der Transportschicht vom OSI Modell zugeordnet ist ausschlaggebend. Eine nicht zugeordnete IP-Adresse würde vom TCP Protokoll einen Logeintrag verursachen mit einem Fehlercode oder der Nachricht „Client does not exist“.

In einem Firmennetzwerk mit einem oder mehreren Druckservern ist die Spooldatei für die Protokollierung zuständig. Die Druckaufträge werden nicht direkt an den Drucker gesendet, sondern an einen Spooler. Dieser wartet, bis der Drucker frei ist, dann sendet er den Druckauftrag von der Druckwarteschlange zum Drucker. Beim Auftreten von einem Fehler ist die Ursache in der Spooldatei festgehalten.

Aufwendiger ist ein Update von einem oder mehreren Servereinheiten im Netzwerk. Die Systemdateien besitzen je nach Betriebssystem (Novell, Windows, Unix) eigene Logfiles, die jeden Vorgang dokumentieren. Die ausgetauschten Dateien werden mit einem Zeitstempel und einem Pfad für die Wiederherstellung in einem ChangeLog festgehalten. Der ChangeLog ist eine Textdatei, die nicht maschinell ausgewertet wird im Gegensatz zu einem Logfile.

Bei einer Inkompatibilität innerhalb heterogener Netzwerke mit unterschiedlichen Kommunikationsprotokollen wird die Logfile-Analyse durch die vom jeweiligen Hersteller mitgelieferten Monitoring Funktionen vorgenommen. Die Dateien werden von der Software ausgelesen und auf Fehlercodes geprüft. Der entsprechende Code wird dem Verwalter angezeigt mit einem Lösungsvorschlag. Ohne eine Software für das Monitoring muss der Admin die entsprechenden Logdateien editieren und prüfen, wo die Schwachstelle im Netzwerk ist. Die Logfile-Analyse in einem heute üblichen TCP/IP Netzwerk darf auch innerhalb einer Firma nicht gegen die gesetzlichen Bestimmungen verstoßen bei einem öffentlich zugänglichen Internetportal. Personenbezogene Daten dürfen nur gespeichert werden, soweit diese zur Abrechnung dienen.



Zurück zur Hauptseite: l

Sie haben Fragen?

Kostenlose, unverbindliche Erstberatung:

Anrufer aus Deutschland:
Tel. 0771 - 1589439
Internationale Beratung:
Tel. +49771 - 1589439
Anfrage per Email:
buero@seo-analyse.com

» zum Anfrage-Formular

SEO-Analyse.com empfehlen:

Onpage Optimierung

Onpage Optimierung

Wir schaffen für Ihre Webseite oder Ihren Shop eine optimale Onpage-Basis für weiterführende Optimierungsmaßnahmen.

Offpage Optimierung

Offpage Optimierung

Natürlicher Linkaufbau gemäß den Regeln der Suchmaschinen - wir bieten ihn!

SEO Beratung

SEO Beratung

Unsere Spezialisten beraten Sie gerne hinsichtlich Ihrer akuten oder strategischen Fragen.

Ranking Monitoring

Ranking Optimierung

Bei uns Standard: qualifiziertes Monitoring Ihrer Google Platzierungen.

Google Optimierung

Google Suchmaschinenoptimierung

Wir kombinieren Google Optimierung mit ganzheitlicher Suchmaschinenoptimierung.

SEO Strategie

SEO Strategie

Praxisbewährte Strategien, die auf Zahlen und Fakten basieren.

SEO Tools

SEO Tools

Immer im Bild: professionelle SEO Tools informieren Sie über den Status Quo.