Grafik User am Computer
BeitragBeitrag
Jeder Internetnutzer bewegt sich in einer Welt aus endlos vielen Informationen.
Big Data
Daten sind zur "Währung" im Internet geworden
"Big Data" bedeutet technologisch, Daten aus den unterschiedlichsten Quellen zusammenzuführen und auf ganz unterschiedliche Zusammenhänge hin zu untersuchen.
Dies könne auch dahin führen, "dass Big Data Antworten auf Fragen liefert, die man gar nicht explizit gestellt hat", sagt Sabine Bendiek, Deutschland-Chefin des Speicherunternehmens EMC (Egan Marino Connelly Curley): Weil die meisten anfallenden Daten in unstrukturierter Form gespeichert sind, also nicht mit eindeutig adressierbaren Datenfeldern wie Alter oder Postleitzahl, ist ihre automatisierte Auswertung schwierig.

In der weitgehend kostenlosen Internet-Welt sind Daten zu einer Art Währung geworden. Sie werden für die Online-Werbung analysiert, um die Zielgruppe genauer erreichen zu können. Im US-Wahlkampf wurden Daten aus Sozialen Netzwerken ausgewertet, um unschlüssige Wähler ausfindig zu machen. Bei der Wirtschaftsauskunftei Schufa gab es die Überlegung, ob Facebook-Daten für die Bewertung der Bonität von Kreditkunden genutzt werden könnten.

Das Netz ist voll von Datenspuren und persönlichen Informationen
BeitragBeitrag
Über Internetuser werden mehr Daten gespeichert, als sie selbst erzeugen
Auf seinen Wegen durchs Netz hinterlässt der Mensch tiefe Datenspuren. Über uns werden schon mehr Informationen gespeichert als wir selbst in Form von digitalen Texten oder Fotos erzeugen. So lautet eines von mehreren Ergebnissen einer Studie zum Datenaufkommen, die EMC Ende 2012 veröffentlicht hat. Die Menge aller digitalen Daten, die in einem Jahr erzeugt oder genutzt werden, erreichte 2012 demnach 2,8 Zettabyte oder 2,8 Billionen Gigabyte. Dieser Umfang verdoppelt sich alle zwei Jahren; bis 2020 sollen es 40 Zettabyte sein. Nach der Schätzung von EMC könnten heute 23 Prozent der insgesamt erzeugten Datenmenge für Big-Data-Analysen genutzt werden - tatsächlich aber geschieht dies nur mit 0,5 Prozent der Datenmenge. Dafür gebe es drei unterschiedliche Gründe, so Bendiek: "Erstens die Unsicherheit beim Datenschutz. Zweitens die fehlende Technik zur Auswertung dieser Daten. Und drittens die Mechanismen für die Entwicklung der richtigen Fragen."