Archive for April, 2007

Symposium zu den Suchmaschinen von morgen

acatech veranstaltet am 31. Mai ein Symposium mit dem Titel „Mehr als Stichworte: Wie arbeiten die Suchmaschinen von morgen?” in Berlin. Zum Inhalt des hochkarätig besetzten Symposiums schreiben die Veranstalter:

Welche Informationen eine Suchmaschine liefert, liefern soll oder liefern darf, in welcher Sprache sie bedient werden kann, wie das “Ranking” der Suchergebnisse erfolgt etc. sind mittlerweile Fragen von großer ökonomischer und zunehmend auch von politischer Bedeutung. Diesen Fragen soll bei der Veranstaltung im Dialog zwischen Informationstechnik, Medienwissenschaft, Wirtschaft und Politik nachgegangen werden.

Eine weitere Dimension der Entwicklung ist die Tatsache, dass schnell weitere “Daten” ins Internet gespeist werden: Dazu zählen Fotos, Videos, eingescannte Bücher, medizinische Datenbanken sowie in naher Zukunft viele von Sensoren in Realzeit generierte Daten zum Beispiel über die Umwelt, den Zustand von Produkten, den momentanen Ort von Gegenständen und Personen oder sogar über die eigene Gesundheit. Die Suche in solchen semantisch komplexen Datenbereichen erfordert “intelligente” Mechanismen, die weit über heutige (im Wesentlichen stichwortbasierte) Verfahren hinausgehen, damit aus den Daten nützliche Information und letztlich Wissen und Wert entsteht. Auch die großen Suchmaschinenbetreiber wie Google sind hier aktiv, indem sie zum Beispiel die Digitalisierung und Online-Bereitstellung der Bestände großer Bibliotheken oder die Individualisierung und Personalisierung der Suche betreiben. Sie werden damit zu einem noch bedeutenderen “Player” und Machtfaktor in der Medienlandschaft.

Weitere Informationen gibt es direkt bei acatech.

Technorati Tags: , , , , ,

ISPs schlimmere Datensammler als Google?

Auf dem Blog des Google-Mitarbeiters Matt Cutts findet zur Zeit eine recht interessante Diskussion zum Thema Google und Datenschutz statt. Cutts wundert sich, wieso beim Datenschutz so viel über Google gesprochen wird, aber nur sehr selten darüber, welche Daten von Internet Service Providers (ISPs) gesammelt werden, die ja zudem über personenbezogene Daten wie Adresse und Bankverbindung verfügen. Die Antwort erschien mir bisher eigentlich recht klar: Google nutzt die Daten für Werbung, ISPs (außer vielleicht AOL) tun dies in der Regel nicht. Interessant ist in diesem Zusammenhang allerdings der Hinweis, dass es bei vielen ISPs normale Praxis zu sein scheint, Clickstream-Daten an andere Firmen weiterzuverkaufen. Die Verdienstmöglichkeiten werden dabei auf ca. 40 Cent pro Nutzer und Monat beziffert, also ca. 60 Dollar pro Jahr.

Ein kurzer Blick in Peter Schaars “Datenschutz im Internet” (2002) zeigt, dass dies sogar in Deutschland legal wäre. Wenn ich es richtig verstehe dürfen Nutzungsdaten, worunter auch Clickstreams fallen, demnach (allerdings nur mit Einwilligung des Nutzers) “für Zwecke der Werbung, der Marktforschung oder zur bedarfsgerechten Gestaltung der Teledienste verwendet werden” (S. 142). Auch dürfen anonymisierte Nutzungsprofile erstellt werden, wenn der Nutzer nicht widerspricht. “Ferner ist es dem Diensteanbieter erlaubt, zum Zwecke der Marktforschung anderer Diensteanbieter anonymisierte Nutzungsdaten an diese zu übermitteln” (ebd.)

Es wäre sicherlich interessant, in Erfahrung zu bringen, ob der Verkauf von Clickstreams auch von deutschen ISPs praktiziert wird. Vor allem von welchen. Und wer kauft diese Daten?

Technorati Tags: , , , , ,

Gesellschaft für Informatik (GI) gründet Arbeitskreis „Überwachung“

Oft genug vermisst man seitens der Entwickler und Naturwissenschaftler den nötigen Abstand zu den eingesetzten Technologien. Umso erfreulicher sind dann kritische Projekte wie der 2006 gegründete Arbeitskreis „Überwachung“ im Fachbereich Informatik und Gesellschaft der GI.

In der Ankündigung in eigener Sache heißt es:

Technische Entwicklungen laufen oft lange Zeit unauffällig ab, bis sie schlagartig und mit Macht sichtbar werden. So auch potentielle Überwachungstechnologien von Biometrie und Data Mining über Videoüberwachung bis RFID: In den 80er und 90er Jahren nur in einigen Nischen vertreten, werden sie in jüngster Zeit als Lösung für viele aktuelle Probleme propagiert und implementiert.

Wir sehen diese Entwicklung als Herausforderung, die eingesetzten Technologien kritisch zu beleuchten, um prinzipielle Beschränkungen und Risiken zu identifizieren. Diese Aufgabe benötigt Zusammenarbeit verschiedenster Fachbereiche, sowohl innerhalb der Informatik als auch darüber hinaus. Wir planen deshalb in diesem Arbeitskreis eine Bestandsaufnahme der Situation auf technischer und juristischer Ebene. Wir möchten eine aktive interdisziplinäre Arbeitsgruppe bilden.

Das Gründungstreffen des GI-Arbeitskreises „Überwachung“ findet am Donnerstag, den 26. April 2007, ab 11.00 Uhr in Berlin-Adlershof statt. Interessierte treffen sich in der Rudower Chaussee 25, 12489 Berlin, Haus 3, Raum 408. Um vorherige Anmeldung bei Constanze Kurz (kurz (at) informatik.hu-berlin.de) wird gebeten.

Der Arbeitskreis findet im Übrigen im Kontext der GI-Tagung „Kontrolle durch Transparenz - Transparenz durch Kontrolle“, Berlin-Adlershof, 27.-29. April 2007 statt. Diese breiter angelegte Veranstaltung des Fachbereichs Informatik und Gesellschaft thematisiert aktuelle Umbrüche der Informationsgesellschaft, die in acht Workshops bearbeitet werden sollen. Für die Teilnehmenden und alle, die die Konferenz nicht selbst besuchen, steht bereits vorab ein Tagungs-Wiki mit Materialien zu den Workshops zur Verfügung. Eine Transparenz der GI-Tagung ist also schon mal gewährleistet.

Technorati Tags: , , , , , , ,

CfP “Das neue Netz?”

Jan Schmidt und Florian L. Mayer von der Bamberger Forschungsstelle “Neue Kommunikationsmedien” organisieren vom 20. bis 22. September einen Workshop zum Thema “Das neue Netz? Bestandsaufnahme und Perspektiven”. Ziel des Workshops ist es, möglichst unterschiedliche Perspektiven auf die Entwicklungen im sogenannten “Web 2.0” zusammen zu führen und innerhalb der zweieinhalb Tage eine fruchtbare Diskussion über neue und möglicherweise nicht so neue Entwicklungen im gegenwärtigen Internet anzustoßen. Deadline für Beiträge ist der 15. Mai, der Workshop steht auch im Zusammenhang mit dem Sammelband “Kommunikation, Partizipation und Wirkungen im Social Web – Weblogs, Wikis, Podcasts und Communities aus interdisziplinärer Sicht” (Call for Chapters).

In der Einleitung zum Call for Papers heißt es:

Das Schlagwort “Web 2.0″ hat spätestens im Verlauf des letzten Jahres auch die deutschsprachige Diskussion erreicht. Es versucht, verschiedene aktuelle Trends zusammenzufassen, die gemeinsam haben, dass dem/der aktiven Internet-Nutzer/in eine größere Rolle beim Erstellen, kollaborativen Bearbeiten, ‘Remixen’ und Teilen von Inhalten zukommt. Bestandteile des Web 2.0 sind (1) eine Reihe von innovativen Internet-Anwendungen (wie Weblogs, Wikis, Social Networking Sites oder kollektive Verschlagwortungssysteme, …), (2) spezifische Prozesse der Software-Entwicklung (Stichworte wären hier beispielsweise “perpetual beta”, “mashups”, “user-centric design” oder “design through embedded observation”) sowie (3) Geschäftsmodelle, die auf das Erschließen von Nischenmärkten des “long tail” und nutzergenerierte Inhalte setzen.

Der Vehemenz und Aufgeregtheit der Diskussionen um das Web 2.0 zum Trotz, sind die entsprechenden Anwendungen noch nicht im “Mainstream” der Internetnutzung angekommen. Eine Sonderauswertung der ARD/ZDF-Onlinestudie 2006 erbrachte, dass bislang nur etwa 20% der deutschen Onliner Web 2.0-Angebote nutzen, und von ihnen nur etwa die Hälfte auch tatsächlich aktiv ist, also selbst Inhalte beiträgt. Zudem legt der Begriff einen „diskreten Versionssprung“ nahe, ohne auf die Kontinuitäten in der Internetnutzung Rücksicht zu nehmen, die immer schon Möglichkeiten der Partizipation, Kollaboration und der Meinungsäußerung bot – man denke zum Beispiel an die Newsgroups des frühen Usenet, oder an weit verbreitete Dienste wie Chats oder Diskussionsforen. Schließlich wird der Begriff vorrangig in (medien)ökonomischen Diskursen verwendet, weil sich mit ihm die Hoffnung verbindet, über neue Geschäftsmodelle eine kommerzielle Verwertung der Nutzeraktivitäten zu erzielen. Exemplarisch wird dies in Versuchen deutlich, unentgeltlich erstellte Inhalte als „User-Generated Content“ in die Wertschöpfung etablierter Unternehmen einzubinden bzw. die Nischenmärkte zu erschließen, die sich rund um spezialisierte Interessen kristallisieren. Die Nutzer/innen auf ihre Rolle in Marktprozessen zu reduzieren, wird der Vielfalt von tatsächlichen Verwendungsweisen und Interaktionsformen im Internet jedoch nicht gerecht.

Aus diesen Gründen erscheint es sinnvoll, die wissenschaftliche Auseinandersetzung mit den gegenwärtigen Entwicklungen im Internet ohne die Vorannahme eines “revolutionären Sprungs” zu führen und stattdessen zu untersuchen, inwieweit tatsächlich neue Nutzungspraktiken entstehen und inwieweit Verbindungen zu älteren Verwendungsweisen des Internet bestehen sowie welche individuellen und gesellschaftlichen Folgen sich aus dem möglicherweise nur inkrementellen Wandel ergeben.

Technorati Tags: , , , , , , ,

Beschwerde gegen Googles DoubleClick-Kauf eingereicht

CNET berichtet, dass die drei Organisationen Electronic Privacy Information Center (EPIC), Center for Digital Democracy (CDD) sowie U.S. Public Interest Research Groups (U.S. PIRG) heute bei der Federal Trade Commission (FTC) eine Beschwerde gegen Googles Kauf von DoubleClick eingereicht haben. Die Übernahme soll so lange unterbunden werden, bis die Praxis der Datensammlung und -speicherung von der Kommission genauer untersucht wurde, DoubleClicks Datensammlungen bereinigt sind und Google klare Bedingungen vorlegt, wie Datenschutz künftig gewährleistet werden kann.

In der Beschwerde heißt es unter anderem:

Google’s proposed acquisition of DoubleClick will give one company access to more information about the Internet activities of consumers than any other company in the world. Moreover, Google will operate with virtually no legal obligation to ensure the privacy, security and accuracy of the personal data that it collects.

Die komplette Beschwerde als PDF gibt es bei EPIC.

Laut Google werden die Daten der beiden Firmen zunächst nicht kombiniert. Eine Zusammenführung in der Zukunft solle zudem nur dazu dienen, doppelte Werbeeinblendungen zu vermeiden. Es scheint allerdings schwer vorstellbar, dass mit einer solchen Datenansammlung nicht mehr geschehen wird.

(via Searchblog)

Technorati Tags: , , , , , , , , ,

Geringe Partizipation im Web 2.0

Eine aktuelle Studie von Hitwise deutet auf ein erstaunlich geringes Partizipationsniveau im Web 2.0 hin. Obwohl die Besuche von Web 2.0-Seiten in den letzten zwei Jahren um fast 700% angestiegen sind (leider wird nicht genau genannt, welche Seiten untersucht wurden), ist der Anteil der Nutzer, die aktiv Inhalte hochladen, verschwindent gering: Bei YouTube gerade mal 0,16%, bei Flickr 0,2%. Der Autor der Studie, Bill Tancer, geht daher davon aus, dass die meisten Internetnutzer sich nicht wesentlich vom couch potatoe unterscheiden. Einzige Ausnahme: Wikipedia, wo ganze 4,6% der Besucher tatsächlich Änderungen an Einträgen vornehmen.

(via nettime)

Technorati Tags: , , , , ,

Re-public Spezialausgabe zu Wiki politics

Die letztes Jahr gestartete Online-Zeitschrift Re-public hat eine interessante Spezialausgabe zum Thema Wiki politics herausgebracht. Unter den Beiträgen finden sich Artikel zu den Themen Gratis-Arbeit im Web 2.0 und P2P als emanzipatorisches Projekt sowie ein Interview mit „Hacker-Manifest“-Autor McKenzie Wark zu Wikipedia und Co.

Technorati Tags: , , , , , , ,

Neue Suchmaschinen spüren geschütztes Material auf

Die noch relativ unregulierte Phase des freien Video- Sharings im Netz neigt sich zusehends ihrem Ende zu. Mussten Copyrightverletzungen bei YouTube bisher in einem umständlichen Prozess manuell gemeldet werden, so setzt Google in Zukunft auf ein wesentlich effektiveres System, das geschütztes Material automatisch erkennen und, falls es nicht autorisiert ist, ausfiltern soll.

Das von Google entwickelte System mit den Namen “Claim your Content” ist jedoch nur eines unter vielen Neuentwicklungen, die Sharing-Anbietern helfen sollen, den chaotischen Rechte-Zuständen auf ihren Servern Herr zu werden. Für Firmen wie Autonomy, die sich im Rahmen der Enterprise Search auf große, heterogene Datenbestände konzentrieren, tun sich hier breite Betätigungsfelder auf. So preist Autonomy-CEO Michael Lynch die Software Virage Automatic Copyright Infringement Detection (Acid) damit an, dass sie durch das Abgleichen von Ton- und Bildmaterial mit vorhandenen Datenquellen schon bei einem 10-sekündigen Sport erkennen kann, ob es sich um geschütztes Material handelt. Angeblich soll das Verfahren auch gegen Verfremdungen des Materials wie Abdunkeln usw. gefeit sein.

Ob in Zukunft Videos, die einige Sekunden urheberrechtlich geschützten Materials enthalten, tatsächlich sofort ausgefiltert werden, wird wohl von den gegenwärtigen Verhandlungen abhängen. Da die technischen Möglichkeiten schon jetzt gegeben sind, ist aber gut vorstellbar, dass von den großen Medienunternehmen entsprechende Forderungen erhoben werden. Von der kreativen Lust an Collage und Kommentierung, die zuweilen auf den Sharing-Sites herrscht, bliebe dann sicherlich wenig erhalten.

Technorati Tags: , , , , , , , ,

Yale-Konferenz thematisiert Zugang zu Wissen

Vom 27.-29. April 2007 veranstaltet das Yale Information Society Project die zweite Annual Access to Knowledge Conference. Das Programm verspricht einige interessante Vorträge, unter anderem auch Panels zum Thema Suchmaschinen, Digitale Archive und Open Access.

Über das dazugehörige offene Wiki kann man die Konferenz von zu Hause aus verfolgen, Material einstellen und die Proceedings der letzten Konferenz einsehen. Hier dürfte sich also bald eine sehr interessante, frei zugängliche Materialsammlung zu diesen Themenfeldern finden lassen.

In der Konferenzbeschreibung heißt es u.a.:

The last several years have witnessed the coalescing of the Access to Knowledge (A2K) social movement that champions human rights, human development, and the public interest as the focal points of innovation and information policy.

The A2K2 conference program is focused around mobilizing different spheres of society: Industry, Civil Society, Governments, and Technologists. The policy panels focus on a diverse set of A2K issues and are oriented towards tangible legal and technological solutions and collaborative strategies for policy makers and individual institutions.

Policy panels:

  • Partnerships for Access to Information
  • Internationalized Domain Names
  • Patent Quality
  • Open Access Literature
  • Search Engines
  • Traditional Knowledge and Genetic Resources
  • Community Media & the Global Public Sphere.
  • Broadband Wireless in Developing Countries.
  • Agriculture & Intellectual Property
  • The Political Economy of Digital Archives
  • Education in the Digital Age.
  • Access to Scientific Knowledge

Technorati Tags: , , , , , ,

Google kauft DoubleClick

… und nun ist es soweit. Google kauft DoubleClick für 3,1 Milliarden Dollar, bietet seinen Werbekunden damit wesentlich breitere Targetingmöglichkeiten und baut seinen Vorrat an Nutzerdaten noch einmal beträchtlich aus.

Siehe dazu auch “Versteigerung von Werbeplätzen setzt sich durch”.

Die Entwicklungen im Detail bei Google Blogoscoped und Search Engine Land.

Pressemitteilung bei Google.

Technorati Tags: , , ,