Zum Inhalt springen

SEO Analyse » SEO Lexikon » l » Logfile-Analyse

Logfile-AnalyseDas Auswerten von Webserver-Dateien oder personenbezogenen Daten von einem Benutzer ist in Deutschland nur unter Einwilligung der betroffenen Person zulässig. Die Zustimmung muss für die Verwendung der Daten von dem Nutzer nachzuvollziehen sein. Eine versteckte Zustimmung in Form einer Zustimmung der allgemeinen Geschäftsbedingungen ohne einen konkreten Hinweis auf den Eingriff in die Privatsphäre ist nicht zulässig. Die Protokollierung wird am häufigsten bei Webservern und Firewalls durchgeführt.

Der Hintergrund bezieht sich in der Regel auf das Onlinemarketing (PR). Die Firmen nutzen Programme, um das Verhalten der Webseitenbesucher zu kategorisieren und einen Vergleich zu konkurrierenden Seiten im Internet herstellen zu können. Die Gebrauchstauglichkeit eines Softwareproduktes wird in der ISO-Norm 9241 Teil 11 beschrieben. Im Vordergrund steht die Auskunft, wie das Verhältnis vom erreichten Ziel zum definierten Ziel ist (Effektivität).

Das zweite Kriterium ist die Wirtschaftlichkeit von dem Produkt. Die Logfile-Analyse erlaubt es, Statistiken zu interpretieren die eine Optimierung der eigenen Internetseite in Bezug auf die Effektivität und die Effizienz aufzeigen.

Die Kommunikationsranddaten der Logfile-Analyse

Die Randdaten enthalten Informationen über die elektronische Struktur. Relevant sind alle Geräte die Daten über Personen aufzeichnen können, unabhängig davon, ob diese mobil oder stationär sind. Dazu gehören Geräte wie Telefone, Datenspeicher, Software, Netzwerkkomponenten, Faxgeräte, Datenverarbeitungsanlagen und einige mehr. Es wird protokolliert, wer mit wem kommuniziert hat oder wie lange die Kommunikation angehalten hat.

Der Telefonanschluss oder die E-Mail Adresse sind statische Daten zum Identifizieren der Quelle. Die IP (Internet Protocol) Adresse kann statisch in einem System eingetragen sein oder durch eine Software dynamisch vergeben werden. Der NAT (Network Address Translation) Router ersetzt die Datenpakete durch andere, damit sie in andere Netze weitergeleitet werden. Für die IP-Adresse, die die Quelle und das Ziel identifiziert bedeutet das die Adresse der Quelle im NAT-Router verändert wird.

Die veränderte Adresse wird die öffentliche Adresse genannt, die im Internet zu sehen ist und unterschiedlich zur privaten Adresse von der Source ist. Bei IPv4 ist diese Technik weit verbreitet aufgrund der Knappheit der IP Adressen. Die Abläufe in Anwendungen, Datenbanken und Servern können durch die Randdaten aus den Protokolldateien gelesen werden. Die Logfile-Analyse ist in der Lage die Protokolldateien mithilfe einer entsprechenden Software zu lesen. Bei einem fremden Webserver ist dies vom Gesetzgeber verboten. Den eigenen Webserver mittels einer Software zu analysieren ist erlaubt.

Das Verhalten, wann User auf eine Seite zugreifen, wie lange sie auf einer Seite sind oder an welchem Punkt sie die Seite verlassen, sind wichtige Informationen für die PR (Public Relation). Ein umstrittener Punkt ist das Auswerten von Telekommunikationsdaten. Es können ohne eine Analyse die Dauer und der Gesprächsteilnehmer ermittelt werden. Dieser Zustand ist legal. Nur mit einer Verfügung vom Gesetzgeber darf durch eine Logfile-Analyse der Kommunikationsinhalt geprüft werden.

Schwierigkeiten bei der Logfile-Analyse

Das Internetprotokoll HTTP (Hyper Text Transport Protocol) ist in dem OSI-Modell in der Anwendungsschicht zu finden. Es wurde geschaffen, um die Seiten im Internet auf dem jeweiligen Browser anzuzeigen. Ursprünglich ist HTTP ein zustandsloses Protokoll. Diese Zustandslosigkeit bedeutet, dass jeder Zugriff von einem Benutzer als eigene Transaktion angesehen wird. Es macht keinen Unterschied, ob der gleiche User innerhalb der Internetseite auf eine Unterseite verzweigt. Das Wechseln ist eine eigenständige Transaktion. Es wurden keine Sitzungsinformationen ausgetauscht und als Ganzes protokolliert. Ein zustandsbehaftetes Protokoll wie FTP (File Transfer Protocol) muss für jede Sitzung im Internet eine Authentifizierung aufbauen.

Erst durch eine Session-ID kann das zustandslose Protokoll HTTP eine Identifikation mitführen. Die Session-ID merkt sich die jeweilige Webanwendung und kann die Anfragen einer gemeinsamen Sitzung zuordnen und protokollieren. WebDAV (Web-based Distributed Authoring and Visioning) ist eine Erweiterung von dem HTTP/1.1 Protokoll. Mit dieser Erweiterung kann HTTP/1.1 ganze Verzeichnisse laden. Es wurden einige Attribute im Paketkopf von HTTP hinzugefügt und Anfragemethoden entwickelt, die ein Webserver beantworten muss.

Mit der HTTP-Methode PROFIND werden Ressourcen in Erfahrung gebracht, die Auskunft über die Webarchitektur (URL), Dienste oder Software von einem System in einem Logfile dokumentieren. Die PROPATCH Methode ändert oder löscht eine Ressource. Der Hintergrund ist, dass die Transaktionen nicht durch mehrere gleichzeitig laufende Aktionen die Datenintegrität beeinflussen.

Mit COPY wird eine Ressource kopiert und als URI (Uniform Resource Identifier) angegeben. Ein URI ist eine Zeichenfolge zur Identifizierung von Webseiten, E-Mail Empfängern und Aufruf von Webservices. Bei der Logfile-Analyse kann aus der URI der Inhalt der Ressource ermittelt werden und wo diese zu finden ist. Als Ressource sind in diesem Zusammenhang die Dateien auf einem Webserver zu verstehen. Die URI kann nicht nur Dateien als Ressource auswerten. Telefonnummer, Sozialversicherungsnummer oder E-Mail Adresse sind in der RFC 2396 von 1998 als Ressource anzusehen, die als eine Identifikation dient.

Besteht kein Zugriff auf den Webserver, kann mit Hilfe von transparenten Pixeln, die in Grafiken oder anderen Textteilen versteckt eingebunden sind, ein Zugriff auf die Logdatei vom Webserver geschaffen werden. Der Zugriff erfolgt über die unsichtbaren Pixel, die im Paketkopf ein PROFIND Attribut gesetzt haben.

Fehler erkennen durch Logfile-Analyse

Die Logdatei schreibt alle Prozesse von einem Computersystem mit. Die Protokolldatei dokumentiert den Sender und Empfänger von einem Dienst mit dem korrekten Zeitstempel. Ein wichtiger Hinweis für den Verwalter ist, was der Empfänger für einen Dienst oder Prozess angefordert hat. Für die Logfile-Analyse ist entscheidend, womit ein Dienst angefordert worden ist. Bei TCP/IP Netzwerken ist das TCP Protokoll das der Transportschicht vom OSI Modell zugeordnet ist ausschlaggebend. Eine nicht zugeordnete IP-Adresse würde vom TCP Protokoll einen Logeintrag verursachen mit einem Fehlercode oder der Nachricht „Client does not exist“.

In einem Firmennetzwerk mit einem oder mehreren Druckservern ist die Spooldatei für die Protokollierung zuständig. Die Druckaufträge werden nicht direkt an den Drucker gesendet, sondern an einen Spooler. Dieser wartet, bis der Drucker frei ist, dann sendet er den Druckauftrag von der Druckwarteschlange zum Drucker. Beim Auftreten von einem Fehler ist die Ursache in der Spooldatei festgehalten.

Aufwendiger ist ein Update von einem oder mehreren Servereinheiten im Netzwerk. Die Systemdateien besitzen je nach Betriebssystem (Novell, Windows, Unix) eigene Logfiles, die jeden Vorgang dokumentieren. Die ausgetauschten Dateien werden mit einem Zeitstempel und einem Pfad für die Wiederherstellung in einem ChangeLog festgehalten. Der ChangeLog ist eine Textdatei, die nicht maschinell ausgewertet wird im Gegensatz zu einem Logfile.

Bei einer Inkompatibilität innerhalb heterogener Netzwerke mit unterschiedlichen Kommunikationsprotokollen wird die Logfile-Analyse durch die vom jeweiligen Hersteller mitgelieferten Monitoring Funktionen vorgenommen. Die Dateien werden von der Software ausgelesen und auf Fehlercodes geprüft. Der entsprechende Code wird dem Verwalter angezeigt mit einem Lösungsvorschlag. Ohne eine Software für das Monitoring muss der Admin die entsprechenden Logdateien editieren und prüfen, wo die Schwachstelle im Netzwerk ist. Die Logfile-Analyse in einem heute üblichen TCP/IP Netzwerk darf auch innerhalb einer Firma nicht gegen die gesetzlichen Bestimmungen verstoßen bei einem öffentlich zugänglichen Internetportal. Personenbezogene Daten dürfen nur gespeichert werden, soweit diese zur Abrechnung dienen.

Zusammenfassung

In Deutschland ist die Logfile-Analyse rechtlich reguliert und erfordert die Zustimmung der Nutzer, besonders wenn personenbezogene Daten betroffen sind. Die Analyse ist im Kontext von Onlinemarketing und Public Relations (PR) weit verbreitet, um Benutzerverhalten und Website-Effizienz zu bewerten.

Randdaten in Logfiles enthalten diverse Informationen wie IP-Adressen und Kommunikationsdauer. Diese Daten kommen von verschiedenen Geräten, darunter Telefone und Netzwerkkomponenten. Es ist jedoch gesetzlich verboten, fremde Webserver ohne Erlaubnis zu analysieren.

HTTP ist ein zustandsloses Protokoll und jede Benutzeraktion gilt als separate Transaktion. Die Zustandslosigkeit kann jedoch durch die Verwendung von Session-IDs umgangen werden, um Benutzeraktivitäten besser zu verfolgen.

Fehlererkennung ist ein wichtiger Aspekt der Logfile-Analyse. Die Protokolldateien erfassen sämtliche Prozesse, einschließlich Fehlercodes und Systemstörungen, was Administratoren bei der Fehlerbehebung unterstützt.

In Unternehmensnetzwerken müssen Logfiles sorgfältig im Einklang mit den gesetzlichen Bestimmungen ausgewertet werden. Spezielle Monitoring-Software hilft dabei, die Logdateien effizient zu analysieren und etwaige Schwachstellen im Netzwerk zu identifizieren.

Häufige Fragen und Antworten

Was ist eine Logfile-Analyse?

Bei einer Logfile-Analyse handelt es sich um die Auswertung von Protokolldateien, die von Webservern und Firewalls generiert werden. Diese Protokolldateien enthalten wichtige Informationen über die Kommunikation zwischen Benutzern und dem Server sowie andere Status- und Fehlermeldungen.

Welche Informationen können aus Logfiles gewonnen werden?

Aus Logfiles können verschiedene Informationen gewonnen werden, wie zum Beispiel die IP-Adresse des Benutzers, die aufgerufenen Seiten, die Verweildauer auf den Seiten, der Zeitpunkt des Seitenaufrufs und vieles mehr. Diese Informationen können für die Analyse des Benutzerverhaltens und die Optimierung der Website genutzt werden.

Welche Vorteile bietet eine Logfile-Analyse?

Eine Logfile-Analyse bietet verschiedene Vorteile, wie zum Beispiel:

  • Besseres Verständnis des Benutzerverhaltens auf der Website
  • Optimierung der Website-Effizienz und Benutzerfreundlichkeit
  • Identifizierung von Problemen und Fehlerquellen
  • Optimierung des Website-Traffics und der Conversion-Rate

Bildnachweis: iStock.com/shapecharge


Zurück zur Hauptseite: l
Alle Marken, Warenzeichen, Unternehmens- und Produkt-Bezeichnungen sind mit, aber auch ohne definitive Kennzeichnung, Eigentum des Inhabers der Rechte. Alle aufgeführten Elemente dienen lediglich der informativen Beschreibung.