Monthly Archive for January, 2008

Später Start ins Jahr

So langsam wird es ja doch mal Zeit, den Blog aus dem Winterschlaf zu reißen und zum einjährigen Bestehen gibt es dann auch direkt mal ein neues Design.

Die zwei wesentlichen Nachrichten aus der Suchmaschinenwelt waren in der letzten Zeit sicherlich der Grazer Google-Bericht (pdf) und der Start von Wikia Search. Der Google-Bericht von Hermann Maurer und anderen hat kurz vor Weihnachten noch mal so richtig Leben in die Mailinglisten gebracht, hoch her ging es z.B. auf InetBib, wo Stefan Weber, einer der Autoren der Studie, u.a. mit Mathias Schindler von Wikimedia diskutiert und sich schließlich von den Teilen des Berichts distanziert, an denen er nicht beteiligt war. Eigentlich hätte ich gedacht, dass Hermann Maurer nach dem furchtbar schlecht recherchierten Artikel im Informatik Spektrum (pdf) in Google-Belangen nicht mehr als Experte herangezogen werden würde, aber in der aktuellen Technology Review kommt er doch noch einmal zu Wort.

Die Alpha-Version von Wikia Search ist seit dem 7. Januar online. Die Euphorie hält sich insgesamt eher in Grenzen und es wird immer wieder beteuert, dass alles ja erst in den Anfängen steckt. Interessant an dem Start fand ich eigentlich weniger die Suchergebnisse oder die technischen Details (auch der Suma-Blog entdeckt hier bisher wenig Neues), als die Diskussionen hinter den Kulissen, die man auf der Search Wikia-Mailingliste verfolgen konnte. Im Moment ist die Liste wieder fast völlig verstummt, aber für eine Weile fand dort unter den Akronymen POV/NPOV/MPOV eine interessante Diskussion zum Thema Relevanz statt. POV steht für point-of-view, die beiden Extreme für die Relevanzbewertung von Suchergebnissen wären demnach neutral point-of-view (NPOV) oder my-point-of-view (MPOV). Während sich einige Teilnehmer der Liste für den MPOV aussprechen (wie ihn ja Google Coop, Eurekster, Rollyo usw. schon anbieten), ist Wales strikt dagegen: „Wikia will not be a niche search engine, and I think as a key part of the infrastructure, we want to strive to be neutral, neutral, neutral.“

Neutrale Suchergebnisse? Da gefiel mir die Antwort von Alex Halavais schon wesentlich besser:

So, any search engine is inherently a selection (biasing) system. The hope is that the way in which those biases are constructed are – and this is of primary importance – transparent to the user. I want to know how the search engine has decided to make a given result its top-ranked choice. Communicating that can be extraordinarily difficult, of course, but the perspective of full disclosure is a good start.

Auf die Gleichung Transparenz = Nachvollziehbarkeit = höchste erreichbare Neutralität kann die Liste sich schließlich auch einigen. Wobei man allerdings wieder bei dem Problem landet, auf das Richard Rogers beim Quaero Forum in Maastricht in Bezug auf das niederländische Projekt Open Search auch schon hingewiesen hat: Was macht man mit den Spammern, für die die Transparenz der Algorithmen das Einfallstor in die Suchergebnisse ist? Man bräuchte schon eine Community von Wikipedia-Ausmaßen, um solchen Mißbrauch manuell zu verhindern. Dies könnte allerdings von daher schwierig werden, weil die Ausgestaltung von abstrakten Suchalgorithmen wesentlich weniger Identifikationspotenzial bereithält als die Mitarbeit an einem Wikipedia-Artikel. (Ein Problem, dass Wales auch in Davos angesprochen hat.) Ein Weg könnte vielleicht über die stärkere visuelle Vermittlung der Relevanzkriterien an die Nutzer gehen. Gäbe es eine Möglichkeit, die Entwicklung der Relevanzkriterien nicht nur offenzulegen, sondern auch für Laien plausibel grafisch darzustellen und eine Interaktion zu ermöglichen, gäbe es u.U. die Möglichkeit, mehr Menschen in die Arbeit einzubeziehen. Es bleibt jedenfalls noch einiges zu tun.

Technorati Tags: , , , ,