Author Archive for Theo Röhle

The Search Race

Alt Search Engines ist schon seit langem eine der besten Adressen für Informationen über vielversprechende Google-Alternativen. Jetzt ist die Bewertung der alternativen Suchmaschinen interaktiv geworden: Unter www.thesearchrace.com kann man (nach Registrierung) über verschiedene Suchmaschinen abstimmen und noch nicht erfasste Suchmöglichkeiten hinzufügen. Neben der aktuellen Platzierung ist in der Liste auch jeweils eine kurze Beschreibung der verschiedenen Suchvarianten angegeben. Bleibt zu hoffen, dass sich die Liste schnell füllt und dass es im Laufe des Rennens zur “Search Engine of the Year” interessante neue Ansätze zu entdecken geben wird.

Technorati Tags: , ,

Band zum acatech-Symposium

Zum acatech Symposium „Mehr als Stichworte. Wie arbeiten die Suchmaschinen von morgen?“, das letztes Jahr in Berlin stattfand (mein Bericht hier), ist jetzt der Tagungsband erschienen. Er enthält u.a. Beiträge von Marcel Machill, Rainer Kuhlen und Rudi Schmiede und kann als PDF heruntergeladen werden. Damit ist auch der Überblick über die Suchmaschinenforschung von Machill/Beiler/Zenker aus dem Band „Die Macht der Suchmaschinen“ gratis verfügbar, was vor allem für Einsteiger in die Thematik interessant sein dürfte.

[via @-web]

Technorati Tags: , , , ,

“the most annoying thing since email chain letters …”

…and Joris made me part of it. But since it’s the first time I’ve been tagged for a blog meme, I thought I might just as well pass it along. So here’s the deal: pick sentence 6-8 on page 123 of the nearest book, write them down and pass the game on to 5 other bloggers. Or else…

My sentences come from Stewart Clegg’s Frameworks of Power:

“The stability of the relationship between the nature of a thing and the appropriate conditions for the realization of that nature is highly problematic for social phenomena, precisely because the causal relationship is mediated by judgement, choice, will (subjectivity) rather than being unmediated by reflection. Of course, the range is variable: in perhaps 90 percent of cases, one may say that drivers in such and such a city, at a specific intersection (observed for a specific period) and at a recurrent time, always stop at a red light. However, it is still knowledge of the highway code which enables them to stop: they know what a red light means and have reasons for almost never running a red light at this particular intersection.”

It would be interesting if someone put together all these bits of text at some stage, but I don’t see how they would find them. Anyway, now it’s your turn:

Bernhard Rieder at thepoliticsofsystems.net

Jan Schmidt at schmidtmitdete.de

Tina Guenther at sozlog.de

Klaus Schönberger at Kulturwissenschaftliche Technikforschung

Sebastian Erlhofer at Netzwerkkommunikation

24 Seiten Google

Endlich einmal ein wirklich empfehlenswerter journalistischer Beitrag zum Thema Suchmaschinen: Die Schweizer Wochenzeitung hat eine 24-Seiten-Beilage mit dem Titel “Dein großer Bruder” herausgebracht. Vom Datenschutz bis zu alternativen Suchmöglichkeiten deckt die Beilage so ziemlich alle Aspekte der Suchmaschinenproblematik ab. Mit dabei ist auch ein Interview mit dem Soziologen Rudi Schmiede und ein von Klaus Patzwald verfasster Einblick in die Geschichte der Suchmaschinen. Die Beilage kann gratis als Klassensatz für die Schule bestellt werden, was der Medienkompetenz in Sachen Suchmaschinen sicher gut tun wird.

Technorati Tags: , ,

Später Start ins Jahr

So langsam wird es ja doch mal Zeit, den Blog aus dem Winterschlaf zu reißen und zum einjährigen Bestehen gibt es dann auch direkt mal ein neues Design.

Die zwei wesentlichen Nachrichten aus der Suchmaschinenwelt waren in der letzten Zeit sicherlich der Grazer Google-Bericht (pdf) und der Start von Wikia Search. Der Google-Bericht von Hermann Maurer und anderen hat kurz vor Weihnachten noch mal so richtig Leben in die Mailinglisten gebracht, hoch her ging es z.B. auf InetBib, wo Stefan Weber, einer der Autoren der Studie, u.a. mit Mathias Schindler von Wikimedia diskutiert und sich schließlich von den Teilen des Berichts distanziert, an denen er nicht beteiligt war. Eigentlich hätte ich gedacht, dass Hermann Maurer nach dem furchtbar schlecht recherchierten Artikel im Informatik Spektrum (pdf) in Google-Belangen nicht mehr als Experte herangezogen werden würde, aber in der aktuellen Technology Review kommt er doch noch einmal zu Wort.

Die Alpha-Version von Wikia Search ist seit dem 7. Januar online. Die Euphorie hält sich insgesamt eher in Grenzen und es wird immer wieder beteuert, dass alles ja erst in den Anfängen steckt. Interessant an dem Start fand ich eigentlich weniger die Suchergebnisse oder die technischen Details (auch der Suma-Blog entdeckt hier bisher wenig Neues), als die Diskussionen hinter den Kulissen, die man auf der Search Wikia-Mailingliste verfolgen konnte. Im Moment ist die Liste wieder fast völlig verstummt, aber für eine Weile fand dort unter den Akronymen POV/NPOV/MPOV eine interessante Diskussion zum Thema Relevanz statt. POV steht für point-of-view, die beiden Extreme für die Relevanzbewertung von Suchergebnissen wären demnach neutral point-of-view (NPOV) oder my-point-of-view (MPOV). Während sich einige Teilnehmer der Liste für den MPOV aussprechen (wie ihn ja Google Coop, Eurekster, Rollyo usw. schon anbieten), ist Wales strikt dagegen: „Wikia will not be a niche search engine, and I think as a key part of the infrastructure, we want to strive to be neutral, neutral, neutral.“

Neutrale Suchergebnisse? Da gefiel mir die Antwort von Alex Halavais schon wesentlich besser:

So, any search engine is inherently a selection (biasing) system. The hope is that the way in which those biases are constructed are – and this is of primary importance – transparent to the user. I want to know how the search engine has decided to make a given result its top-ranked choice. Communicating that can be extraordinarily difficult, of course, but the perspective of full disclosure is a good start.

Auf die Gleichung Transparenz = Nachvollziehbarkeit = höchste erreichbare Neutralität kann die Liste sich schließlich auch einigen. Wobei man allerdings wieder bei dem Problem landet, auf das Richard Rogers beim Quaero Forum in Maastricht in Bezug auf das niederländische Projekt Open Search auch schon hingewiesen hat: Was macht man mit den Spammern, für die die Transparenz der Algorithmen das Einfallstor in die Suchergebnisse ist? Man bräuchte schon eine Community von Wikipedia-Ausmaßen, um solchen Mißbrauch manuell zu verhindern. Dies könnte allerdings von daher schwierig werden, weil die Ausgestaltung von abstrakten Suchalgorithmen wesentlich weniger Identifikationspotenzial bereithält als die Mitarbeit an einem Wikipedia-Artikel. (Ein Problem, dass Wales auch in Davos angesprochen hat.) Ein Weg könnte vielleicht über die stärkere visuelle Vermittlung der Relevanzkriterien an die Nutzer gehen. Gäbe es eine Möglichkeit, die Entwicklung der Relevanzkriterien nicht nur offenzulegen, sondern auch für Laien plausibel grafisch darzustellen und eine Interaktion zu ermöglichen, gäbe es u.U. die Möglichkeit, mehr Menschen in die Arbeit einzubeziehen. Es bleibt jedenfalls noch einiges zu tun.

Technorati Tags: , , , ,

Call: Ethics, Technology and Identity

Conference, June 18-20 of 2008, The Hague

“Information technology plays an increasingly important role in society and in human lives. Identity Management Technologies (e.g. biometrics, profiling, surveillance), in combination with a variety of identification procedures and personalized services are ubiquitous and pervasive. This calls for careful consideration and design of collecting, mining, storing and use of personal information.

Access, rights, responsibilities, benefits, burdens and risks are apportioned on the basis of identities of individuals. These identities are formed on the basis of personal data collected and stored and manipulated in databases. This raises ethical questions, such as obvious privacy issues, but also a host of identity related moral questions concerning (the consequences of) erroneous classifications and the limits of our capacity for self-presentation and self definition.

Which conceptions of identity are used when addressing ethical issues regarding information technology? How can the concepts of ‘identity’ and ‘identification’ be understood from a philosophical perspective when discussing morally problematic developments in information technology? What are the philosophical semantics pertaining to reference and identification which may help clarify ambiguities and ethical issues? How can we arrive at a normatively sound conception of personal identity as a starting point for the study of the ethical aspects of the (information) technology that is shaping our lives? This conference aims to discuss the theme of ‘identity’ in light of new (information) technology.”

Key-note speakers

  • David Velleman, New York University
  • Oscar Gandy, University of Pennsylvania
  • Robin Dillon, Lehigh University
  • David Shoemaker, Bowling Green State University

More information here.

Technorati Tags: , , , , ,

Google Body

Meldung von brad brace zur Präsentation von Google Body:

MOUNTAIN VIEW–Information search giant Google, Inc. announced Thursday the release of Google Body, a search service aiming to index the internal and external anatomy of every living creature on the planet. “Google has long been dedicated to making information both useful and universally accessible,” notes Google VP of Product Development Eric Hind. “We’re happy now to extend search to information about human bodies, mine and yours, inside and out, from the number of follicles on my head to the length of the President’s toenails.”

[…]

The service, which has been available for some three months to invitation-only beta testers, enables users to search for aggregate information about the anatomy of user-defined groups. “The service is a boon to the medical research community,” says Dr. Jennifer Guns of the Johns Hopkins Clinic for Specialism. “Nothing will replace truly controlled trials, but the ability to get a snapshot of, say, the blood pressure of men between 50 and 65 on New York’s Upper East Side, can certainly give companies an idea of where they might best spend their research dollars.

Early testers have remarked upon a fuzzy-logic “match my organ” feature, which helps users get in touch with the nearest, most suitable donor for multiple organ systems. “We think of Body as way to bring people together,” remarks Google’s Hind. […]

Vielleicht gar nicht so weit weg, wie man denken könnte.

[via nettime]

Technorati Tags:

Call: Query Log Analysis – Technology & Ethics

ACM Transactions on the Web hat einen Call for Papers für eine Sonderausgabe veröffentlicht, die vielversprechend klingt:

The complete records of queries received by web search engines (Query Logs or QLs) are the fundamental evidence of their audience search goals and the engines’ ability to provide satisfactory answers. QLs include information such as queries submitted, reformulations, session boundaries, results actually explored (click through data), time spent reading each result, and so on. Commercial search engines use QL analysis to extract patterns of individual and collective behavior and use this feedback for improving search performance and accuracy. At the same time, the queries made by a particular individual often reflect their current interests and preoccupation and reveal a surprising amount of highly personal information. Continue reading ‘Call: Query Log Analysis – Technology & Ethics’

Neues von Michael Wesh: Information R/evolution

Nach dem bekannten Web 2.0 Film ist jetzt ein neues Video von Michael Wesh zum Thema Kategorisierung und Folksonomies auf YouTube zu sehen. Wie der erste Film ist auch dieser sehr schön erzählt, der Ton ist aber für meinen Geschmack ein bisschen zu missionierend. Shirkys Text hat eben doch einige Probleme.

[Thanks Joris]

Technorati Tags: , , ,

The Future of Reputation: Das Ende der Privatheit?

Das erste Kapitel von Daniel J. Soloves neuem Buch “The Future of Reputation: Gossip, Rumor, and Privacy On the Internet.” kann hier gratis heruntergeladen werden. Klingt vielversprechend. Passt vielleicht auch gut zum PHOENIX-Wissenschaftsforum am Samstag mit dem Thema “Daten, Daten, Daten - Das Ende der Privatheit?”. Aus der Pressemitteilung:

Für das Internet gilt generell: Wer surft, wird erkannt - und das bereits bei der Einwahl. Gilt die Aussage: “Wer sich nichts zu Schulden kommen lässt, der braucht keinen Datenschutz”? Oder ist der Schutz unserer persönlichen Daten wichtiger denn je?

[via Blogoscoped]

Technorati Tags: , , ,