Archive for the 'Suchmaschinen' Category

Page 3 of 5

CfP: Vor Google – Suchmaschinen im analogen Zeitalter

Workshop in Wien, Fr/Sa 10./11.10.2008
Deadline für Einsendungen: 31.10.2007

Call for Papers: Vor Google – Suchmaschinen im analogen Zeitalter

Google gilt als die mächtigste Marke der Welt, noch vor Microsoft und Coca-Cola. Es wundert nicht, dass die Wichtigkeit, die Suchmaschinen in der heutigen Informationsgesellschaft zukommt, dazu führt, dass sie zu Objekten von Sachbüchern (J. Battelle; D. Vise/M. Malseed) und wissenschaftlichen Werken (D. Lewandowski) werden. Continue reading ‘CfP: Vor Google – Suchmaschinen im analogen Zeitalter’

Google-Neusprech: “Werbung ist Demokratie”

Es begann damit, dass Google-Mitarbeiterin Lauren Turner im “Health Advertising Blog” der Firma Michael Moores neuen Film “Sicko” kritisierte. Nach einer Welle von Kommentaren stellte sie jetzt noch einmal klar, dass es sich bei dem Eintrag um ihre private Meinung handelte. Die nunmehr verkündete offizielle Google-Meinung ist allerdings kaum weniger beunruhigend:

“advertising is a very democratic and effective way to participate in a public dialogue”

Bei Google Blogoscoped werden drei offensichtlichen Probleme mit dieser Aussage ausführlicher diskutiert:

  1. In this “democracy,” it will cost you money to participate; the more money you have, the more you can participate.
  2. This “democracy” co-exists with a second, somewhat competing democracy; the one under the rule of PageRank, which Google says relies on “the uniquely democratic nature of the web” by analyzing links.
  3. In this “democracy,” Google is actively involved in talking to the various candidates to spend their campaign money with them.

Technorati Tags: , , ,

Google + DoubleClick = heile Welt?

Im offiziellen Google Blog wurde gestern die geplante Übernahme des Werbevermarkters DoubleClick näher erläutert. Das Wort Datenschutz kommt in dem Beitrag allerdings nicht vor. Auch im neueröffneten Google Public Policy Blog, in dem ja die Lobby-Aktivitäten der Firma offen diskutiert werden sollen, steht eine Frage von Michael Zimmer zum Thema ziemlich einsam da. Aus Google-Sicht schafft die Übernahme nämlich nur Vorteile für alle Beteiligten:

By enabling our AdSense network to work with DoubleClick’s delivery mechanisms, for example, advertisers can obtain more precise metrics in order to judge the effectiveness of their campaigns. The combination of the technologies and expertise of Google and DoubleClick will help publishers better monetize their unsold inventory, thus helping to fuel the creation of even more rich and diverse content on the Internet.

So unschuldig sind die Aktiviäten von DoubleClick allerdings wohl kaum einzuschätzen. „More precise metrics“ umfasst bei der gegenwärtigen Spanne der Google-Dienste eine gewaltige Menge von Nutzerdaten. Dass diese nicht nur genutzt werden, um Rest-Werbeplätze an den Mann zu bringen, zeigt eine Behavioural Targeting-Broschüre (pdf) von DoubleClick. Hier heißt es unter anderem:

Boomerang delivers true behavior-driven advertising, so you can reach pre-qualified prospects and customers more quickly and easily. [...] By identifying users who have expressed an interest in your product or service, you can re-target them across your media buy.

Wie in meinem Beitrag zum Thema personalisierte Suche (pdf) beschrieben, geht es also um das Sammeln von Nutzerdaten, um Werbung besser an individuelle Interessen und individuelles Nutzerverhalten anpassen zu können. Etwas mehr Ehrlichkeit könnte man von Google in dieser Frage schon erwarten.

Technorati Tags: , , , , , ,

Personalisierte Online-Suche als Datenlieferant des Marketings

Soeben ist ein neuer Beitrag von mir mit dem Titel “‘Think of it first as an advertising system’: Personalisierte Online-Suche als Datenlieferant des Marketings” (pdf) in der Online-Zeitschrift kommunikation@gesellschaft erschienen. Der Text befasst sich mit der Frage, wie die Nutzerdaten, die bei der personalisierten Suche erhoben werden, für kommerzielle Zwecke eingesetzt werden.

Etwas ausführlicher:

Suchmaschinen gehören seit langem zu den wichtigsten Werbeträgern im Netz und es wird mittlerweile offen zugestanden, dass die gezielte Vermarktung von Werbeplätzen sich zur Kernaufgabe der Suchmaschinenbetreiber entwickelt hat. Um dem Ruf nach relevanteren Suchergebnissen nachkommen zu können, binden neue Formen der personalisierten Suche immer weitere Bereiche des Nutzerverhaltens in den Suchprozess ein, gleichzeitig schaffen die gesammelten Daten aber auch die Grundlage für eine noch engere Verzahnung ökonomischer Interessen mit dem persönlichen Nutzungskontext. Mit Bezug auf aktuelle Theoriebildung aus den „Surveillance studies“ diskutiert der Beitrag die Rolle der personalisierten Suche als Bindeglied zwischen Nutzer und Werbung. Sowohl die Entwicklung der Online-Werbung als auch die technischen Grundlagen der personalisierten Suche werden skizziert, um schließlich an zwei konkreten Beispielen zu erläutern, welche Daten bei der personalisierten Suche erhoben werden und wie diese zu Werbezwecken verwendet werden können. Dabei wird deutlich, dass die zunächst zur Verbesserung der Suchergebnisse erhobenen Nutzerinformationen einem immer stärkeren kommerziellen Verwertungsdruck ausgesetzt sind.

Diskutiert werden kann der Beitrag auch im Blog der Zeitschrift.

Technorati Tags: , , , , , , , , , ,

Bericht vom acatech-Symposium in Berlin

Nach eineinhalb Wochen komme ich nun endlich mal dazu, vom acatech-Symposium in Berlin am 31.5. zu berichten. Im @-web-Newsletter gab es schon eine ausführliche Besprechung der technischen Neuerungen in den geplanten „Suchmaschinen von morgen“. Interessant waren allerdings auch die politischen Diskussionen, die dort geführt wurden.

Der Informationswissenschaftler Rainer Kuhlen (Uni Konstanz), Autor des sehr guten Beitrags „Macht Google autonom“ im Buch „Die Google-Gesellschaft“, heizte durch manchen provokanten Kommentar die Diskussion an. Google sei keine Such- sondern eine Marketingmaschine, außerdem sei es aufgrund der starken Konzentration an der Zeit, über eine „Zerschlagung“ der Monopolstrukturen nachzudenken. Vom Vertreter des Bundesministeriums für Bildung und Forschung (BMBF), Wolf-Dieter Lukas, erntete Kuhlen für diese Ansicht keine Zustimmung – er sah im Gegenteil keinerlei Handlungsbedarf. Stattdessen lobte Lukas den Unternehmergeist der Google-Gründer und stellte fest, dass diese bisher alles richtig gemacht hätten. Woraufhin er sich den Vorwurf gefallen lassen musste, das BMBF entwickele sich von einer Bildungs- zu einer Wirtschaftsförderungsinstitution. Im Verlauf der Diskussion wurde deutlich, dass sich Kuhlens Argumentation hauptsächlich auf den Bereich der wissenschaftlichen Informationen bezog. Angesichts der zunehmenden kommerzielle Verwertung wissenschaftlicher Informationen, die ursprünglich durch öffentliche Förderung entstanden sind, sprach er von einer Verknappungssituation, die sich durch eine Erweiterung von Open Access-Modellen entschärfen ließe.

Interessant war in diesem Zusammenhang auch der Vortrag des Soziologen Rudi Schmiede von TU Darmstadt. Seine Frage, ob wir auf dem Weg in die „Google-Gesellschaft“ sind, bejahte er, allerdings mit einigen neuen begrifflichen Anordnungen. So sprach Schmiede sich dafür aus, im Bereich der Suchmaschinen den Begriff der Medienkompetenz durch den der Urteilskraft zu ersetzten, da so eine breitere Sicht auf die Konsequenzen von Googles Definitionsmacht möglich wird. Er bemängelte die unzureichende Ausbildung, auch im journalistischen Bereich, die eigentlich auf eine Stärkung der individuellen Urteilskraft abzielen müsse. Im Bereich der Technikentwicklung müsse zudem die Autonomie der Individuen Zielvorgabe sein und daher stärkeres Gewicht auf anthropozentrische Technikgestaltung gelegt werden.

Es war sehr erfrischend, auf einer so hochkarätig besetzten und perfekt durchorganisierten Tagung einmal so deutliche Kontroversen zu erleben – auch wenn letztendlich die geplante Umsetzung der technischen Projekte im Vordergrund stand und wahrscheinlich auch stehen wird.

Technorati Tags: , , , , , , ,

Google auf dem letzten Platz in Datenschutzbericht

In einem Vergleich der Datenschutzpraxis führender Internetfirmen belegt Google den letzten Platz und wird als einzige von 23 Firmen als „datenschutzfeindlich“ eingestuft. Der von der englischen Organisation Privacy International (PI) erstellte Bericht (pdf) wurde am 9.6. veröffentlicht und soll bereits starke Reaktionen von Googles Seite hervorgerufen haben. So wurde PI angeblich zu Last gelegt, dass ein Mitarbeiter Verbindungen zu Microsoft hat und sich der Bericht daher zu einseitig auf Google konzentriere. In einem offenen Brief an Google widerspricht PI diesen Anschuldigungen.

Die Kritik an Googles Datenschutzpraxis umfasst im Einzelnen:

  • Google account holders that regularly use even a few of Google’s services must accept that the company retains a large quantity of information about that user, often for an unstated or indefinite length of time, without clear limitation on subsequent use or disclosure, and without an opportunity to delete or withdraw personal data even if the user wishes to terminate the service.
  • Google maintains records of all search strings and the associated IP-addresses and time stamps for at least 18 to 24 months and does not provide users with an expungement option. While it is true that many US based companies have not yet established a time frame for retention, there is a prevailing view amongst privacy experts that 18 to 24 months is unacceptable, and possibly unlawful in many parts of the world.
  • Google has access to additional personal information, including hobbies, employment, address, and phone number, contained within user profiles in Orkut. Google often maintains these records even after a user has deleted his profile or removed information from Orkut.
  • Google collects all search results entered through Google Toolbar and identifies all Google Toolbar users with a unique cookie that allows Google to track the user’s web movement. Google does not indicate how long the information collected through Google Toolbar is retained, nor does it offer users a data expungement option in connection with the service.
  • Google fails to follow generally accepted privacy practices such as the OECD Privacy Guidelines and elements of EU data protection law. As detailed in the EPIC complaint, Google also fails to adopted additional privacy provisions with respect to specific Google services.
    Google logs search queries in a manner that makes them personally identifiable but fails to provide users with the ability to edit or otherwise expunge records of their previous searches.
  • Google fails to give users access to log information generated through their interaction with Google Maps, Google Video, Google Talk, Google Reader, Blogger and other services.

Interessant ist aber auch, dass keine der anderen Firmen in dem Bericht besonders gut wegkommt. Die Datenschutzsituation insgesamt wird als „erschreckend“ beschrieben und im Fazit findet sich eine recht düstere Einschätzung der gegenwärtigen Entwicklungen im Netz:

The current frenzy to “capture” ad space revenue through the exploitation of new technologies and tools will result in one of the greatest privacy challenges in recent decades. The Internet appears to be shifting as a whole toward this aim, and the opportunity to create market differentiators based on responsible privacy may diminish unless those avenues are explored immediately.

Technorati Tags: , , , , ,

New York Times berichtet über Googles Relevanzkriterien

Nach unzähligen Google-Reportagen, die sich in Beschreibungen bunter Sitzbälle, der Essensauswahl und des Massagesessels von Sergey Brin ergehen, dringt jetzt tatsächlich einmal so etwas wie Information aus dem Googleplex.

New York Times-Reporter Saul Hansell durfte einige Tage lang das Search Quality-Team von Google begleiten. Seine Eindrücke wurden vor einigen Tagen in dem Artikel „Google Keeps Tweaking Its Search Engine“ veröffentlicht.

Einerseits wird hier deutlich, wie weit die Entwicklung der Relevanzkriterien seit der Erfindung des PageRank fortgeschritten ist. PageRank selbst wird als nur ein “Signal” unter ca. 200 anderen bezeichnet. Interessant ist, wie so genannte „classifier“ und das Konzept der „topicality“ eingesetzt werden, um Relevanzkriterien an bestimmte Suchwörter anzupassen:

Once Google corrals its myriad signals, it feeds them into formulas it calls classifiers that try to infer useful information about the type of search, in order to send the user to the most helpful pages. Classifiers can tell, for example, whether someone is searching for a product to buy, or for information about a place, a company or a person. Google recently developed a new classifier to identify names of people who aren’t famous. Another identifies brand names. These signals and classifiers calculate several key measures of a page’s relevance, including one it calls “topicality” — a measure of how the topic of a page relates to the broad category of the user’s query. A page about President Bush’s speech about Darfur last week at the White House, for example, would rank high in topicality for “Darfur,” less so for “George Bush” and even less for “White House.” Google combines all these measures into a final relevancy score.

Auch das Thema Personalisierung wird angesprochen, leider wird aber nicht wirklich deutlich, ob diese Form der Personalisierung nur im Rahmen einer Suche mit aktiviertem Suchprotokoll erfolgt, oder aber immer, sobald man eingeloggt ist:

Increasingly, Google is using signals that come from its history of what individual users have searched for in the past, in order to offer results that reflect each person’s interests. For example, a search for “dolphins” will return different results for a user who is a Miami football fan than for a user who is a marine biologist. This works only for users who sign into one of Google’s services, like Gmail.

Bei Matt Cutts wird die Reportage auch noch einmal aus Google-Sicht besprochen.

Technorati Tags: , , , ,

Erste Server für Search Wikia

Bisher machte das Search Wikia-Projekt von Wikipedia-Gründer Jimmy Wales vor allem durch einen großen Medienhype auf sich aufmerksam, von konkreten technischen Umsetzungen war allerdings kaum etwas zu sehen. Wie Seth Finkelstein berichtet, scheint jetzt aber doch Bewegung in die Sache gekommen zu sein. Die ersten Server sollen letzte Woche geliefert worden sein, man darf also gespannt sein, ob der versprochene nutzergesteuerte Google-Killer jetzt Wirklichkeit wird.

Technorati Tags: , , ,

Symposium zu den Suchmaschinen von morgen

acatech veranstaltet am 31. Mai ein Symposium mit dem Titel „Mehr als Stichworte: Wie arbeiten die Suchmaschinen von morgen?” in Berlin. Zum Inhalt des hochkarätig besetzten Symposiums schreiben die Veranstalter:

Welche Informationen eine Suchmaschine liefert, liefern soll oder liefern darf, in welcher Sprache sie bedient werden kann, wie das “Ranking” der Suchergebnisse erfolgt etc. sind mittlerweile Fragen von großer ökonomischer und zunehmend auch von politischer Bedeutung. Diesen Fragen soll bei der Veranstaltung im Dialog zwischen Informationstechnik, Medienwissenschaft, Wirtschaft und Politik nachgegangen werden.

Eine weitere Dimension der Entwicklung ist die Tatsache, dass schnell weitere “Daten” ins Internet gespeist werden: Dazu zählen Fotos, Videos, eingescannte Bücher, medizinische Datenbanken sowie in naher Zukunft viele von Sensoren in Realzeit generierte Daten zum Beispiel über die Umwelt, den Zustand von Produkten, den momentanen Ort von Gegenständen und Personen oder sogar über die eigene Gesundheit. Die Suche in solchen semantisch komplexen Datenbereichen erfordert “intelligente” Mechanismen, die weit über heutige (im Wesentlichen stichwortbasierte) Verfahren hinausgehen, damit aus den Daten nützliche Information und letztlich Wissen und Wert entsteht. Auch die großen Suchmaschinenbetreiber wie Google sind hier aktiv, indem sie zum Beispiel die Digitalisierung und Online-Bereitstellung der Bestände großer Bibliotheken oder die Individualisierung und Personalisierung der Suche betreiben. Sie werden damit zu einem noch bedeutenderen “Player” und Machtfaktor in der Medienlandschaft.

Weitere Informationen gibt es direkt bei acatech.

Technorati Tags: , , , , ,

ISPs schlimmere Datensammler als Google?

Auf dem Blog des Google-Mitarbeiters Matt Cutts findet zur Zeit eine recht interessante Diskussion zum Thema Google und Datenschutz statt. Cutts wundert sich, wieso beim Datenschutz so viel über Google gesprochen wird, aber nur sehr selten darüber, welche Daten von Internet Service Providers (ISPs) gesammelt werden, die ja zudem über personenbezogene Daten wie Adresse und Bankverbindung verfügen. Die Antwort erschien mir bisher eigentlich recht klar: Google nutzt die Daten für Werbung, ISPs (außer vielleicht AOL) tun dies in der Regel nicht. Interessant ist in diesem Zusammenhang allerdings der Hinweis, dass es bei vielen ISPs normale Praxis zu sein scheint, Clickstream-Daten an andere Firmen weiterzuverkaufen. Die Verdienstmöglichkeiten werden dabei auf ca. 40 Cent pro Nutzer und Monat beziffert, also ca. 60 Dollar pro Jahr.

Ein kurzer Blick in Peter Schaars “Datenschutz im Internet” (2002) zeigt, dass dies sogar in Deutschland legal wäre. Wenn ich es richtig verstehe dürfen Nutzungsdaten, worunter auch Clickstreams fallen, demnach (allerdings nur mit Einwilligung des Nutzers) “für Zwecke der Werbung, der Marktforschung oder zur bedarfsgerechten Gestaltung der Teledienste verwendet werden” (S. 142). Auch dürfen anonymisierte Nutzungsprofile erstellt werden, wenn der Nutzer nicht widerspricht. “Ferner ist es dem Diensteanbieter erlaubt, zum Zwecke der Marktforschung anderer Diensteanbieter anonymisierte Nutzungsdaten an diese zu übermitteln” (ebd.)

Es wäre sicherlich interessant, in Erfahrung zu bringen, ob der Verkauf von Clickstreams auch von deutschen ISPs praktiziert wird. Vor allem von welchen. Und wer kauft diese Daten?

Technorati Tags: , , , , ,