„Menschliche Prozessoren“

Ein Team der Carnegie Mellon’s School of Computer Science hat vor kurzem vier neue Spiele vorgestellt, die dazu beitragen sollen, Indizierung und Ranking multimedialer Inhalte bei Suchmaschinen zu verbessern. Der Leiter des Teams, Luis von Ahn, hatte vor einiger Zeit das unter dem Namen „Google Image Labeler“ bekannt gewordene Spiel ESP Game entwickelt. Ziel der neuen „Games with a purpose“ (Gwap) ist es, Aufgaben, die bisher noch nicht von Computern erledigt werden können, an Menschen auszulagern.

Für Suchmaschinen stellen multimediale Inhalte ein Problem dar, da sie oftmals unzureichend gekennzeichnet sind. Da die inhaltliche Erfassung von Bild- und Tondokumenten immer noch sehr aufwendig ist, gestaltet sich der Abgleich mit einer textuellen Suchanfrage schwierig. Bisher wurde dieses Problem dadurch gelöst, dass bei der Bildersuche der Titel des Bilds und der umgebende Text berücksichtigt werden. Diese Methode bringt jedoch nicht immer ideale Resultate und für ein sinnvolles Ranking stehen oftmals nicht genügend Metadaten zur Verfügung.

Das „ESP Game“ löst dieses Problem sehr geschickt: Indem zwei Spieler Tags für ein Bild vergeben und Punkte für Übereinstimmungen erhalten, wird eine große Zahl von Bildern mit Metadaten versehen und somit besser für die Suche aufbereitet. Durch die Übereinstimmung zwischen zwei unabhängigen Spielern gibt es zudem eine Kontrollfunktion, die bei einem einzelnen menschlichen Tagger nicht gegeben wäre. Da das Ganze auch noch Spaß macht, gibt es außerdem eine Motivation für die Spieler, diese Aufgaben auch ohne Entlohnung zu erfüllen.

Die vier neuen Spiele verfahren nach demselben Prinzip. Auch hier spielen jeweils zwei Spieler miteinander, Punkte gibt es für Übereinstimmungen. Bei „Matchin“ entscheiden die Spieler, welches Bild von einer Auswahl ihnen am besten gefällt und schaffen so die Grundlage für ein verbessertes Ranking. Bei „Tag a Tune“ werden, ähnlich wie beim Image Labeler, Tags vergeben, hier allerdings für Lieder. Bei „Squigl“ werden die Ränder eines Objekts in einem Bild nachgezeichnet, wodurch sich Entwickler erhoffen, in Zukunft die Objekterkennung verbessern zu können. „Verbosity“ hat einen weniger direkten Bezug zur Online-Suche: Die hier erzeugten Begriffsumschreibungen sollen als Grundlage künftiger Anwendungen im Bereich der künstlichen Intelligenz genutzt werden.

Luis von Ahn beschreibt seine Spiele als „Algorithmen, die statt auf einem Computerprozessor auf einem Prozessor laufen, der aus Menschen besteht, die über das Internet mit Computern interagieren“ (pdf). Nicholas Carr bezeichnet dies als einen „Transfer menschlicher Intelligenz in Maschinenintelligenz“, der durch das Internet ermöglicht werde. Abgesehen von der Tragweite solcher Begriffsvermischungen ist es interessant zu beobachten, welche neuen Beziehungen zwischen Mensch und Computer hier entstehen. Amazons Mechanical Turk verfolgt explizit das Konzept, eine Schnittstelle zu schaffen, über die menschliche Arbeitskraft so in Software eingebaut werden kann, dass Aufgaben, zu denen der Computer nicht imstande ist, mitprozessiert werden können.

Der Bereich der Suchmaschinen ist für diese Entwicklung besonders aufschlussreich, weil das Ranking letztlich auf der mathematischen Modellierung menschlicher Relevanzbewertungen beruht. Carr bezeichnet daher Googles PageRank als eine Methode, die menschliche Intelligenz zu aggregieren, die in das Setzen von Links eingeflossen ist. (Auch hier sei die Frage dahingestellt, ob die Terminologie adäquat gewählt ist.) Den Suchmaschinenbetreibern ist somit daran gelegen, ihre Algorithmen letztlich so weit menschlichen Relevanzentscheidungen anzunähern, dass für die Nutzer kein Unterschied mehr erkennbar ist. Reichen die Computer-Kapazitäten selbst nicht aus für diese Aufgabe, so muss eben, wie mit den Gwaps, auf menschliche „Prozessorkraft“ zurückgegriffen werden.

Interessant ist aber, dass sich für (Spam-)Suchmaschinenoptimierer genau dasselbe Problem von der anderen Seite stellt: Sie müssen möglichst billig (also möglichst automatisiert) Inhalte und Links generieren, die von den Suchmaschinen als Produkte menschlicher „Intelligenz“ wahrgenommen werden. Sind automatisierte Verfahren nicht mehr in der Lage, diesen Anschein aufrechtzuerhalten, z.B. wenn Google eine Link-Farm oder automatisch generierten Text als solche identifiziert und die entsprechenden Seiten ausschließt, wird auch hier auf billige menschliche Arbeitskraft zurückgegriffen. Die Schnittstellen sind in diesem Fall weniger glatt, das Prinzip ist aber dasselbe: In SEO-Foren wie Abakus häufen sich die Angebote der Texter, Submitter und Linkbuilder, die für geringe Entlohnung Inhalte generieren, die den Turing-Test der Suchmaschinencrawler gerade eben noch bestehen.

Technorati Tags: , , , , ,

0 Responses to “„Menschliche Prozessoren“”


  1. No Comments

Leave a Reply