Lässt sich aus der Vergangenheit die Zukunft vorhersagen? Das ist das große Thema von “Big Data“: Unternehmen weltweit versuchen, Muster in großen Datenmengen zu finden, um daraus Vorhersagen zu konstruieren.

Unsere Amazon-Top-1000 sammeln nun schon seit Monaten genau das: große Datenmengen; Informationen über Bücher, die sich zahlenmäßig erfassen lassen. Hier geht es nicht um die Qualität des Inhalts, des Covers oder der Klappentexte, sondern um all das, was der Computer erkennen und messen kann. Bei uns sind das natürlich die tagesaktuellen Rankings, aber auch Faktoren wie Preis, Kategorien, Autor, Verfügbarkeit in der Leihbücherei, Vorhandensein von DRM (Kopierschutz), Anzahl der Leser-Rezensionen und der Mittelwert der Bewertungen.

Insgesamt etwa 150.000 Datensätze sind auf diese Weise zusammengekommen, die wir nun mathematisch analysiert haben. Daraus ist ein Modell entstanden, das mit bemerkenswerter Genauigkeit künftige Platzierungen vorhersagen kann. Wir sind gerade dabei, das in die Top 1000 zu integrieren. Die Genauigkeit der Vorhersage für den kommenden Tag liegt dabei bei: