reCAPTCHA ist ein Captcha-Dienst, der seit 2009 zu Google gehört. Wie andere Captcha-Dienste stellt er sicher, dass bestimmte Angebote im Internet nur von Menschen abgerufen werden können. Die Nutzer müssen daher eine vorgegebene Zahlen- oder Buchstabenfolge eingeben, erst danach kann auf das Angebot zugegriffen werden.
Captchas wie reCAPTCHA sollen dabei verhindern, dass Bots auf der Homepage zum Einsatz kommen können. Dabei handelt es sich um automatisierte Programme, die verschiedene, vorher bestimmte Aktionen auf einer Seite ausführen. Am bekanntesten sind Spambots. Diese werden dazu genutzt, um Foren oder Kommentarfunktionen mit ungewollter Werbung zu füllen.
Aber auch für Streaminganbieter ist der Einsatz von Bots ein Ärgernis, da sie hohen Traffic und damit Kosten verursachen können. Um die negativen Wirkungen von Bots zu verhindern, werden Captchas eingesetzt. Dies führt jedoch dazu, dass Hacker und Bot-Entwickler versuchen, die Captchas zu knacken.
Als sicherster Captcha-Dienst gilt dabei reCAPTCHA, was auch der Grund ist, warum es weltweit auf vielen Internetseiten zum Einsatz kommt. Entwickelt wurde reCAPTCHA von Luis von Ahn, Ben Maurer, Colin McMillen, David Abraham und Manuel Blum an der Carnegie Mellon University‘ in Pittsburgh. Ziemlich schnell wurde jedoch Google auf den Dienst aufmerksam und kaufte reCAPTCHA im Jahr 2009.
Funktionsweise von reCAPTCHA
Im Kampf gegen Bots setzten Anbieter im Internet verstärkt auf den Einsatz von Captchas, um die eigene Homepage zu schützen. Nahezu jedes Angebot setzt sie heute in irgendeiner Form ein und so verbringen die Internetnutzer immer mehr Zeit mit der Eingabe von Captchas. Der Grundgedanke hinter reCAPTCHA ist der, dass man diese Eingaben in irgendeiner Form nutzen sollte.
Daher kamen Luis von Ahn und sein Team auf die Idee, ein Captcha zu entwickeln, mit dem man das Einscannen von Büchern unterstützen kann. Bei der Digitalisierung eines Buches kommt es immer wieder vor, dass bestimmte Wörter durch die Software nicht erkannt werden. Unter normalen Umständen bedeutet dies, dass ein menschlicher Mitarbeiter jeden Text durchgehen muss, um die entsprechenden Stellen zu überprüfen. reCAPTCHA nutzt für diese Aufgabe nun die Menschen, die ein Captcha lösen sollen.
So werden bei reCAPTCHA keine willkürlichen Zahlen- oder Buchstabenkombinationen verwendet, sondern richtige Wörter. Diese Wörter stammen aus den Scanprozessen der Bücher. Im Verlaufe des Prozesses wird jedes eingescannte Buch von zwei unterschiedlichen Worterkennungsprogrammen analysiert.
Jedes Wort, das die beiden Programme erkennen wird mit dem Ergebnis des jeweiligen anderen Programms und einem Wörterbuch abgeglichen. Stellt man bei diesem Vergleich einen Unterschied fest, dann wird das betroffene Wort zu einem Captcha. reCAPTCHA zeigt dabei immer zwei Wörter an und der Nutzer wird aufgefordert, beide einzugeben.
Das erste Wort bei reCAPTCHA stammt aus dem Pool der nicht erkannten Scanwörter, während es sich bei dem Zweiten um ein Kontrollwort handelt. Das Kontrollwort ist auch das Wort, welches das Captcha am Ende löst. Die Logik hinter dem System ist, dass man davon ausgeht, dass die richtige Eingabe des Kontrollwortes gleichbedeutend ist mit der richtigen Eingabe des Scanwortes.
Nutzer, die sich die Mühe machen, bei reCAPTCHA ein Wort richtig zu schreiben, werden dies auch bei einem zweiten Wort tun. Es wird jedoch nicht sofort jede Eingabe als Bestätigung für die richtige Bedeutung angesehen. Dazu muss das Wort erst eine bestimmte Anzahl von Punkten erreichen.
Für die reCAPTCHA Eingabe durch Benutzer gibt es einen Punkt und für die Ergebnisse der Worterkennungsprogramme jeweils 0,5 Punkte. Erhält ein Wort nur eine einzige Eingabe, durch alle Nutzer, dann kann es zu einem Kontrollwort werden.
Die Möglichkeit das Captcha für die Digitalisierung von Büchern eingesetzt werden konnten, war der Grund, warum Google auf reCAPTCHA aufmerksam wurde. Nach dem Kauf hatte man nun ein Programm zur Verfügung, dass gezielt bei dem Aufbau von Google Books helfen konnte. Seit 2012 hat Google eine weitere Einsatzmöglichkeit entdeckt. reCAPTCHA zeigt nun auch Hausnummern an, die aus dem Google Streetview Projekt stammen.
Sicherheit von reCAPTCHA
Da reCAPTCHA als das sicherste Captcha-System weltweit gilt, kommt es bei sehr vielen Anbietern zum Einsatz. Daher steigt die Verlockung für Hacker ein Programm zu entwickeln, dass reCAPTCHA knackt. Bei vielen Programmierern stehen dabei noch nicht einmal finanzielle Interessen im Vordergrund, sondern der Ruhm und die Herausforderung.
Damit die Hackversuche nicht von Erfolg gekrönt sind, wird reCAPTCHA regelmäßig geupdated. So verändert man in unregelmäßigen Abständen die Schriftart und die Darstellungsform der Wörter. Bis 2012 hielten sich die Erfolge daher für Hacker in Grenzen.
Im Mai des Jahres 2012 präsentierten jedoch erstmals drei Hacker auf einer Konferenz ein erfolgreiches System, das dazu in der Lage sein sollte reCAPTCHA zu knacken. Das Skript nannte sich Stiltwater und nutze einen völlig neuen Ansatz. Anstatt sich auf die Schrift und die Wörter zu konzentrieren, analysierte Stiltwater die Audiofassung des Captchas. Diese hatte man eingebaut, um auch sehbehinderten Menschen die Nutzung zu ermöglichen.
Die drei Hacker hatten erkannt, dass diese Version nur eine geringe Anzahl von Wörtern benutzte. Auch das Hintergrundrauschen, das einen Hack erschweren sollte, hatten sie analysiert und dabei festgestellt, dass es sich um immer wieder gleiche Radioeinspielungen handelte. Die Erfolgsrate von Stiltwater wurde mit 99,1% beziffert.
Google hatte jedoch anscheinend von der Konferenz und dem Skript gehört und änderte noch vor der Präsentation das System. Als Anpassung darauf wurden noch zwei weitere Versionen von Stiltwater veröffentlicht, die eine Erfolgsrate von 60% aufweisen konnten. Google nahm daraufhin eine größere Veränderung am System vor und konnte so, eine erneute Sicherheit herstellen. Seitdem haben viele weitere Programmierer sich an reCAPTCHA versucht, ohne jedoch einen wirklichen Erfolg zu erzielen.
Zusammenfassung
reCAPTCHA ist ein global führender Captcha-Dienst, der von Google im Jahr 2009 erworben wurde, um sicherzustellen, dass Internetangebote nur von Menschen abgerufen werden können. Er hilft, Bots wie Spambots auszusperren und wird auch von Streaminganbietern genutzt, um hohen Traffic und Kosten zu vermeiden. Entwickelt an der Carnegie Mellon University, hat sich reCAPTCHA als sicherster Captcha-Dienst weltweit etabliert.
Die Funktionsweise von reCAPTCHA besteht darin, dass es die Eingabe von Captchas nutzt, um die Digitalisierung von Büchern zu unterstützen. Anstatt willkürlicher Kombinationen verwendet reCAPTCHA echte Wörter aus Scanprozessen, wobei ein Wort aus dem Pool der nicht erkannten Scanwörter stammt und das andere ein Kontrollwort ist. Die Verwendung von Captchas für die Digitalisierung von Büchern war ein Grund für Google’s Interesse, das reCAPTCHA auch für das Google Books Projekt einsetzt.
In Bezug auf die Sicherheit von reCAPTCHA wird das System regelmäßig aktualisiert, um Hackerangriffe zu verhindern. Dennoch gelang es 2012 drei Hackern, das System kurzzeitig zu überwinden, indem sie die Audiofassung analysierten. Google hat daraufhin größere Veränderungen vorgenommen, um die Sicherheit wiederherzustellen und seitdem ist es Hackern nicht gelungen, signifikante Erfolge gegen reCAPTCHA zu erzielen.
Häufige Fragen und Antworten
Was ist reCAPTCHA?
reCAPTCHA ist ein Captcha-Dienst, der seit 2009 zu Google gehört. Als Captcha-Dienst ermöglicht er, dass bestimmte Angebote im Internet nur von Menschen abgerufen werden können, indem Nutzer eine vorgegebene Zahlen- oder Buchstabenfolge eingeben müssen.
Wie funktioniert reCAPTCHA?
reCAPTCHA funktioniert, indem es die Eingabe von Captchas nutzt, um die Digitalisierung von Büchern zu unterstützen. Anstatt willkürlicher Kombinationen verwendet reCAPTCHA echte Wörter aus Scanprozessen. Nutzer werden aufgefordert, zwei Wörter einzugeben – eines stammt aus dem Pool der nicht erkannten Scanwörter und das andere ist ein Kontrollwort. Die Logik dahinter ist, dass die richtige Eingabe des Kontrollwortes gleichbedeutend mit der richtigen Eingabe des Scanwortes ist.
Warum wird reCAPTCHA eingesetzt?
Captchas wie reCAPTCHA werden eingesetzt, um Bots daran zu hindern, Internetseiten zu manipulieren. Insbesondere Spambots und andere automatisierte Programme sollen so abgewehrt werden. Streaminganbieter setzen Captchas ein, um hohen Traffic und damit verbundene Kosten zu vermeiden. reCAPTCHA ist dabei aufgrund seiner Sicherheit der am weitesten verbreitete und eingesetzte Captcha-Dienst weltweit.
Wie sicher ist reCAPTCHA?
reCAPTCHA gilt als das sicherste Captcha-System weltweit. Es wird regelmäßig aktualisiert, um Hackerangriffe zu verhindern. Obwohl es 2012 kurzzeitig von Hackern überwunden wurde, hat Google daraufhin größere Veränderungen vorgenommen, um die Sicherheit wiederherzustellen. Seitdem haben Hacker keine signifikanten Erfolge gegen reCAPTCHA erzielt.