SuMa Awards 2009

Die Awards für innovative Suchmaschinen-Projekte aller Art gehen in die zweite Runde. Es gibt wieder einige tausend Euro zu gewinnen. Hier ist der Ausschreibungstext:

“Das Internet beherrscht zunehmend unser Leben. Sei es bei den alltäglichen Dingen wie den Hausaufgaben, bei der Jobsuche oder beim Einkaufen, sei es global gesehen: Das Netz ist zur wichtigsten Informationsquelle geworden und die Suchmaschinen zu unseren Wegweisern. Aber kann es richtig sein, dass wir alle demselben Wegweiser folgen? Und stimmt es nicht seltsam, dass dieser Wegweiser alle unsere Schritte verfolgt und aufzeichnet?

Mit einem Marktanteil von über 90% hat ein einziger Anbieter in Deutschland das Quasi-Monopol auf den Zugang zu den Informationen im Internet. Welche Nutzerdaten erfasst und für welche Zwecke diese verwendet werden lässt sich nicht nachvollziehen. Von einem freien, pluralistischen und demokratischen Zugang zum Wissen im Netz kann schon lange nicht mehr die Rede sein.

Mit den SuMa Awards wollen wir ein deutliches Zeichen gegen diese Entwicklung setzten und zugleich für Aufklärung sorgen. Der SuMa-eV spricht zusammen mit dem Bundesverband Deutscher Internet-Portale (BDIP) all diejenigen an, die sich mit dem Einfluss digitaler Informationen auf unsere Gesellschaft konstruktiv auseinandersetzen, sei es künstlerisch, wissenschaftlich, journalistisch, pädagogisch, technisch, im familiären Alltag oder auf jede beliebige andere Art und Weise.

Unser Ziel ist es, die Bedeutung der Informationserschließung für die zukünftige Entwicklung unserer Gesellschaft in das Bewusstsein und den Fokus der Öffentlichkeit zu rücken.

Die Verleihung der SuMa Awards unterliegt keiner thematischen Einschränkung. Eingereichte Arbeiten können ihre Botschaft beispielsweise in künstlerischer, wissenschaftlicher, programmierter, literarischer, juristischer oder medialer Form ausdrücken – aufklärend, provokativ, veranschaulichend etc.”

Weitere Informationen gibt es unter www.suma-awards.de

Technorati Tags: , , ,

Suche und Zeit

Das Projekt Zoetrope (PDF) klingt so ziemlich nach dem Interessantesten, was die Welt der Suchmaschinen in letzter Zeit zu bieten hatte. Wie schon das Internet Archive soll Zoetrope die Möglichkeit schaffen, Veränderungen von Websites über Zeit nachzuvollziehen.  Jedoch macht das Interface von Zoetrope einen wesentlich spannenderen Eindruck. So soll es z.B. möglich sein, einzelne Bereiche einer Seite mit einer „Linse“ einzurahmen und anhand eines Sliders durch die Veränderungen in genau diesem Bereich zu spulen. Daneben werden eine Reihe von Informationen angezeigt, die zu der jeweiligen Version vorliegen. Außerdem lassen sich die Veränderungen der Daten im zeitlichen Vergleich und im Vergleich zwischen Seiten visualisieren:

[youtube 7C-B7qdClak]

Die Einführung der zeitlichen Dimension in die Interfaces der Online-Suche ist längst überfällig, denn auf der Seite der Algorithmen ist sie seit langem vollzogen. Durch die kontinuierliche Archivierung des Index, der Linktopologie und der Nutzerdaten verfügt z.B. Google über eine Datengrundlage, in der sich eine ganze Reihe von zeitlichen Dynamiken und Trends ermitteln lässt. Wie in den entsprechenden Patenten nachzulesen ist, werden aus diesen Daten zudem zeitlich basierte Relevanzmodelle erstellt, die in das Ranking einfließen. Zum Beispiel wird eine Seite, bei der über längere Zeit keine Veränderungen festgestellt werden, als „stale“ definiert, was je nach Suchanfrage positive oder negative Konsequenzen für das Ranking haben kann.

Leider hat Google bisher wenig Interesse daran gezeigt, diese zeitliche Dimension auch für die Nutzer zu erschließen. Aufgefallen ist mir dies zum ersten Mal als ich den Add-on Customize Google installiert habe und plötzlich neben jedem Suchergebnis einen (völlig logischen) Link zum Internet Archive vorfand. Das intuitive Interface von Zoetrope ist daher ein sehr willkommener erster Schritt in Richtung besserer Interaktionsmöglichkeiten mit der zeitlichen Dynamik des Internets.

Jenseits der spielerischen Qualitäten erscheint mir dieser Entwicklung aus zwei Gründen besonders interessant: Zum einen könnten hier für die Wissenschaft (und die Hobby-Wissenschaft) neue Möglichkeiten entstehen, Entwicklungen im Netz über längere Zeiträume nachzuvollziehen. Für die Nutzer der Online-Suche könnten solche Tools zum anderen eine eigenständigere und transparentere Informationsbeschaffung ermöglichen. Denn wenn eine Seite automatisch als Spam klassifiziert wird, weil sie in einem bestimmten Zeitraum zu viele neue Links erhalten hat, so sollten doch zumindest die Nutzer denselben Einblick in das zugrunde liegende Datenmaterial erhalten wie die Algorithmen.

Der Vorschlag von Alan Liu, auf den ich schon einmal hingewiesen hatte, für Wikipedia-Artikel ein visuelles „pathologisches Profil“ zu erstellen und Nutzer in der Interpretation solcher Visualisierungen zu schulen, erscheint mir in dieser Hinsicht weiterhin viel versprechend. Vielleicht bieten Ansätze wie Zoetrope Nutzern zukünftig Werkzeuge, um das „pathologische Profil“ von Websites schnell und effektiv erfassen zu können und so in größerem Maß selbst entscheiden zu können, wo sie nach relevanten und vertrauenswürdigen Informationen suchen wollen.

Technorati Tags: , , ,

“Deep Search”-Dokumentation online

Die Video-Dokumentation der Konferenz “Deep Search. The Digital Future of Finding Out” in Wien ist jetzt online. Es lohnt sich, die Vorträge waren sehr gut und ergänzten sich hervorragend. Weitere Berichte gibt es u.a. beim Institute of Network Cultures, beim ORF und bei Nhan Vu. Ein erweiterter Tagungsband auf deutsch und englisch folgt im Frühahr.

Technorati Tags: , , ,

“Virtualität und Kontrolle” – Symposium in Hamburg

Eine spannende Veranstaltung Anfang November in Hamburg:

“Moderne Gesellschaften werden zusehends zu Systemen, die „durch unablässige Kontrolle und unmittelbare Kommunikation“ funktionieren“ (Gilles Deleuze). Diese Entwicklung weist ebenso politische, ökonomische, kulturelle wie technisch-mediale Aspekte auf. Nicht zuletzt stellt sie vor Probleme des „Virtuellen“: Wie lassen sich Fluchtlinien, Techniken und Stratageme denken, die den Techniken der Kontrolle und Selbstkontrolle entgehen – politisch, ökonomisch, kulturell und künstlerisch?

Das internationale Symposion Virtualität und Kontrolle trägt ebenso wissenschaftlichen wie künstlerischen Charakter. Neben Vorträgen wird es eine Szenische Lesung im Nachtasyl des Hamburger Thalia Theaters geben, werden Fragen des Films erörtert, beteiligen sich Künstlerinnen und Künstler mit Installationen und Aktionen.”

Mehr dazu bei hsozkult

[via surveillance studies]

Technorati Tags: , , , ,

SuMa Kongress und Deep Search

Jetzt sind es nur noch einige Tage bis zu meinem Vortrag „Suchmaschinen: Eine neue Form der Medienmacht“ beim SuMa Kongress 2008. Obwohl ich schon länger Mitglied des Vereins bin, habe ich den Kongress in den letzten Jahren immer verpasst – umso besser, diesmal direkt als Vortragender dabei zu sein. Besonders freue ich mich auf die Verleihung der SuMa Awards, deren Gewinner ja schon bekannt gegeben wurden. Ich finde, mit dieser ersten Runde der Awards haben wir einen guten Anfang gemacht. Für das nächste Jahr habe ich die Koordination der Awards übernommen und ich bin gespannt, welche Einsendungen wir bekommen werden, wenn sich die Existenz dieser Preise erst einmal weiter herumgesprochen hat.

Anfang November steht mein zweiter Vortrag in diesem Herbst an. Bei der Konferenz „Deep Search“, die im Rahmen des 2nd Information Retrieval Facility Symposium in Wien stattfindet, stehen einige spannende Vorträge auf dem Programm:

Keynote

The world according to grep
Paul Duguid, Adjunct Professor, School of Information
Website

Overview

From Trust to Tracks
Claire Lobet-Maris, Professor, Computer Science Institute University of Namur, co-director of the CITA (Cellule Interfacultaire de Technology Assessment),
Website

Search Engines and Civil Liberties

Google und Privacy
Gerhard Reischl, Journalist, Vienna
Website

Search engines and digital civil rights
Joris van Hoboken, PhD candidate, Institute for Information Law,University of Amsterdam
Website

Search Engines and Power

Dissecting the Gatekeepers
Theo Röhle, PhD Candidate, Institute for Media and Communication, Uni Hamburg
Website

Democratizing Search
Bernhard Rieder, Assistant Professor, Département Hypermédia, Université de Paris VIII – Vincennes Saint-Denis
Website

Making things visible

Issue Tracking on the Web
Richard Rogers, Chair in New Media & Digital Culture at the University of Amsterdam
Website

Multipolar Search
Gon Zifroni & Tsila Hassine, Metahaven, Amsterdam and Brussels & media artist and web-programmer
Website

Technorati Tags: , , , ,

PhD position: “Surfing the information waves”

Interesting PhD vacancy at the Eindhoven University of Technology:

PhD student on the project “Surfing the information waves: Finding, revealing, and evaluating information online” at the School of Innovation Sciences.

Job description
The Ph.D. student is expected to do research leading to a Ph.D. thesis in the project “Surfing the information waves: Finding, revealing, and evaluating information online”. At the core of this project lies the question how people deal with the reliability of information on the Internet, to what extent the formal and informal mechanisms that facilitate reliable exchange of information offline have online equivalents, and to what extent new online mechanisms and tools are and can be developed to facilitate reliable
information exchange.

Typical questions of interest are: How do people discern useful and reliable information from useless and unreliable information in online settings? How can users be motivated to provide reliable information and how can the provision of unreliable information be minimized? To what extent do the answers to these questions depend on the kind of online setting? For the project we anticipate doing research in several areas of application, such as medical information sites and groups, social networking sites
(Facebook, Twitter, LinkedIn, Plaxo, Xing, etc), and general economic and consumer sites, such as eBay, Amazon.

Requirements
The candidate should have a Masters degree (or equivalent) in the social sciences (sociology, psychology, political or communication science), excellent knowledge and skills in quantitative methods of data analysis, and familiarity with new forms of online communication. Most of all, we are looking for someone with a natural curiosity with respect to online interaction of any kind. Knowledge about theories pertaining to the topic in (social) psychology or sociology would be an additional asset. The candidate should be proficient in English (speaking and writing).

Conditions of employment
We offer a (full-time) Ph.D. position for 4 years. Gross salaries are in the range of €28K gross per annum in the first year and €35K during the fourth year and include attractive enefits (e.g. technical infrastructure, child care, sports facilities). A small teaching load an be part of the job.

More information can be found at:
http://www.tue-tm.org/snijders/PhD/

Application
Send your application or requests for further information by email to Prof. dr. C. Snijders (c.c.p.snijders ‘at’ tue.nl). The application should consist of a motivation for your application, and extended curriculum vitae, a description of your obtained scientific degree, and a list of courses and the grades you obtained for those courses.

Kontextsensitive Rassenkunde

DNAEben erreichte mich über einen Freund dieses Highlight moderner Werbetechnologie: Erwähnt man bei Facebook Worte wie “Israel”, so wird einem prompt angeboten, per DNA-Analyse seinen jüdischen Wurzeln nachzugehen. Sein passender Kommentar dazu: Das ginge heute als alles viel umkomplizierter mit dem Rassennachweis….

Technorati Tags: ,

Verdatung und Klassifizierung international

Gerade geht mein erster Tag beim Workshop Values in Computer Information Systems Design an der Santa Clara University vorbei. Nachdem wir den halben Tag über Klassifizierung, Datenbanken und Identität diskutiert haben und dazu extrem spannenden Input von Geoffrey Bowker, Helen Nissenbaum und Susan Leigh Star bekommen haben, hat unser Team gerade unsere Ideen zum Projektthema “data bodies” vorgestellt. Umso erstaunlicher, festzustellen, dass genau zu dieser Zeit ein Workshop in Wien fast dieselben Fragen aufwirft:

  • Welche Rolle spielt der Körper im Zusammenhang mit Identifizierungstechniken?
  • Wie wird der Mensch/der menschliche Körper zum Objekt der Wissenschaften?
  • Durch welche (technischen) Verfahren wird ein Körper in “Datensätze” transformiert? (Datensätze verstehen wir als Komplexitätsreduktion, als Abstraktion, das heißt von der rein sprachlichen Beschreibung bis hin zu Logarithmen.)
  • Gibt es im Kontext der Identifizierungstechniken einen “nicht verdateten Körper”? Was wäre der “vor”-verdatete Körper?

Die Seite zum Workshop “Verdaten. Klassifizieren. Archivieren.Identifizierung von Personen aus kulturwissenschaftlicher Perspektive” enthält interessante Abstracts. Hoffentlich bekommt man nach dem Workshop noch mehr zu lesen. Noch besser wäre wahrscheinlich eine Live-Schaltung zwischen Wien und Santa Clara gewesen, aber hier wird sonntags nicht gearbeitet: morgen steht erst einmal ein Wander-Trip in die kalifornischen Berge auf dem Programm.

Technorati Tags: , , ,

Tracking, Prediction and the Assemblage

Jordan Crandall recently posted some interesting notes on nettime from his presentation at the “Everyday Life of Surveillance” seminar in Durham.

Crandall talks about the “tracking apparatus” – new methods of data collection, analysis and prediction which the canonical concepts of the panopticon and the carceral fail to comprehend. Instead, he develops his concept of the assemblage, which encompasses a new modality of power:

It is not “control” as such:  When a degree of stabilization is reached (as enacted in practice), or a certain materialization threshold crossed, effects can be produced.  In this way actors can become functional, operational.  But not necessarily.  To act as an agent of control, there is a balance to be achieved between stabilization and destabilization. A certain degree of reliability, but not rigidity.  It is a fine line, a precarious zone.

Crandall develops some interesting thoughts on the nature of tracking and prediction and on the way these phenomena can be understood – not merely in terms of surveillance but also as a way to “guide disorder” by means of “statistical inclinations”. In my view, the text offers a range of viable options for surveillance studies to move forward into more organisational, dispersed and networked conceptual frameworks.

One thing that left me wondering, though, is if he actually endorses Chris Anderson’s view that scientific method has become obsolete. (Which has been thoroughly and rightfully criticised by Bernhard Rieder.) On the one hand, he affirmatively quotes Anderson on data mining: “We can analyze the data without hypotheses about what it might show.  We can throw the numbers into the biggest computing clusters the world has ever seen and let statistical algorithms find patterns where science cannot.” On the other hand he says: “When we track — when we study how something or someone is moving in order to predict its future location or orientation — we subject everything to the classifying schemes available to us.  We fasten our objects (and subjects) onto a classifying grid or database-driven identity assessment.”

Interesting read, in any case.

Technorati Tags: , , , , ,

„Menschliche Prozessoren“

Ein Team der Carnegie Mellon’s School of Computer Science hat vor kurzem vier neue Spiele vorgestellt, die dazu beitragen sollen, Indizierung und Ranking multimedialer Inhalte bei Suchmaschinen zu verbessern. Der Leiter des Teams, Luis von Ahn, hatte vor einiger Zeit das unter dem Namen „Google Image Labeler“ bekannt gewordene Spiel ESP Game entwickelt. Ziel der neuen „Games with a purpose“ (Gwap) ist es, Aufgaben, die bisher noch nicht von Computern erledigt werden können, an Menschen auszulagern.

Für Suchmaschinen stellen multimediale Inhalte ein Problem dar, da sie oftmals unzureichend gekennzeichnet sind. Da die inhaltliche Erfassung von Bild- und Tondokumenten immer noch sehr aufwendig ist, gestaltet sich der Abgleich mit einer textuellen Suchanfrage schwierig. Bisher wurde dieses Problem dadurch gelöst, dass bei der Bildersuche der Titel des Bilds und der umgebende Text berücksichtigt werden. Diese Methode bringt jedoch nicht immer ideale Resultate und für ein sinnvolles Ranking stehen oftmals nicht genügend Metadaten zur Verfügung.

Das „ESP Game“ löst dieses Problem sehr geschickt: Indem zwei Spieler Tags für ein Bild vergeben und Punkte für Übereinstimmungen erhalten, wird eine große Zahl von Bildern mit Metadaten versehen und somit besser für die Suche aufbereitet. Durch die Übereinstimmung zwischen zwei unabhängigen Spielern gibt es zudem eine Kontrollfunktion, die bei einem einzelnen menschlichen Tagger nicht gegeben wäre. Da das Ganze auch noch Spaß macht, gibt es außerdem eine Motivation für die Spieler, diese Aufgaben auch ohne Entlohnung zu erfüllen.

Die vier neuen Spiele verfahren nach demselben Prinzip. Auch hier spielen jeweils zwei Spieler miteinander, Punkte gibt es für Übereinstimmungen. Bei „Matchin“ entscheiden die Spieler, welches Bild von einer Auswahl ihnen am besten gefällt und schaffen so die Grundlage für ein verbessertes Ranking. Bei „Tag a Tune“ werden, ähnlich wie beim Image Labeler, Tags vergeben, hier allerdings für Lieder. Bei „Squigl“ werden die Ränder eines Objekts in einem Bild nachgezeichnet, wodurch sich Entwickler erhoffen, in Zukunft die Objekterkennung verbessern zu können. „Verbosity“ hat einen weniger direkten Bezug zur Online-Suche: Die hier erzeugten Begriffsumschreibungen sollen als Grundlage künftiger Anwendungen im Bereich der künstlichen Intelligenz genutzt werden.

Luis von Ahn beschreibt seine Spiele als „Algorithmen, die statt auf einem Computerprozessor auf einem Prozessor laufen, der aus Menschen besteht, die über das Internet mit Computern interagieren“ (pdf). Nicholas Carr bezeichnet dies als einen „Transfer menschlicher Intelligenz in Maschinenintelligenz“, der durch das Internet ermöglicht werde. Abgesehen von der Tragweite solcher Begriffsvermischungen ist es interessant zu beobachten, welche neuen Beziehungen zwischen Mensch und Computer hier entstehen. Amazons Mechanical Turk verfolgt explizit das Konzept, eine Schnittstelle zu schaffen, über die menschliche Arbeitskraft so in Software eingebaut werden kann, dass Aufgaben, zu denen der Computer nicht imstande ist, mitprozessiert werden können.

Der Bereich der Suchmaschinen ist für diese Entwicklung besonders aufschlussreich, weil das Ranking letztlich auf der mathematischen Modellierung menschlicher Relevanzbewertungen beruht. Carr bezeichnet daher Googles PageRank als eine Methode, die menschliche Intelligenz zu aggregieren, die in das Setzen von Links eingeflossen ist. (Auch hier sei die Frage dahingestellt, ob die Terminologie adäquat gewählt ist.) Den Suchmaschinenbetreibern ist somit daran gelegen, ihre Algorithmen letztlich so weit menschlichen Relevanzentscheidungen anzunähern, dass für die Nutzer kein Unterschied mehr erkennbar ist. Reichen die Computer-Kapazitäten selbst nicht aus für diese Aufgabe, so muss eben, wie mit den Gwaps, auf menschliche „Prozessorkraft“ zurückgegriffen werden.

Interessant ist aber, dass sich für (Spam-)Suchmaschinenoptimierer genau dasselbe Problem von der anderen Seite stellt: Sie müssen möglichst billig (also möglichst automatisiert) Inhalte und Links generieren, die von den Suchmaschinen als Produkte menschlicher „Intelligenz“ wahrgenommen werden. Sind automatisierte Verfahren nicht mehr in der Lage, diesen Anschein aufrechtzuerhalten, z.B. wenn Google eine Link-Farm oder automatisch generierten Text als solche identifiziert und die entsprechenden Seiten ausschließt, wird auch hier auf billige menschliche Arbeitskraft zurückgegriffen. Die Schnittstellen sind in diesem Fall weniger glatt, das Prinzip ist aber dasselbe: In SEO-Foren wie Abakus häufen sich die Angebote der Texter, Submitter und Linkbuilder, die für geringe Entlohnung Inhalte generieren, die den Turing-Test der Suchmaschinencrawler gerade eben noch bestehen.

Technorati Tags: , , , , ,