Wenn ein potenzieller Käufer den Online-Buchladen seiner Wahl durchstöbert, fällt sein Blick in der typischen Listen-Darstellung der Reihe nach auf Cover, Titel, Preis und Bewertung, letztere meist in Sternchenform. Während der Autor aber Cover, Titel und Preis selbst im Griff hat und optimieren kann, sieht es bei den Leser-Besprechungen (bei Amazon “Kundenrezensionen” genannt, wobei man über die Bezeichnung “Rezension” hier durchaus streiten kann) anders aus.

Die kommen nun einmal von den Lesern, jedenfalls in etwa 95 Prozent der Fälle – der Rest sind Verwandte des Autors und Irrläufer, die zum Beispiel eigentlich mit Amazon in Kontakt treten wollten.

Wie wichtig sind Kundenrezensionen?

Für den Verkauf eines Produkts sind gute Bewertungen enorm wichtig. Die Statistiken zeigen, dass es auf Anzahl und Mittelwert ankommt. Richtig ernst nimmt der Käufer die Bewertungen erst, wenn wenigstens zehn davon zusammengekommen sind. Titel mit weniger als zehn Bewertungen verkaufen sich jedenfalls in der Regel zögerlicher. Dabei sollte ein Mittelwert von 3,8 (im Amazon-System) nicht unterschritten werden – so lange zeigt Amazon nämlich noch 4 Sternchen an. Der Mittelwert in den Top 1000 liegt bei 4,4, das ist also der Maßstab, nach dem der Leser urteilt.

Lässt sich aus der Vergangenheit die Zukunft vorhersagen? Das ist das große Thema von “Big Data“: Unternehmen weltweit versuchen, Muster in großen Datenmengen zu finden, um daraus Vorhersagen zu konstruieren.

Unsere Amazon-Top-1000 sammeln nun schon seit Monaten genau das: große Datenmengen; Informationen über Bücher, die sich zahlenmäßig erfassen lassen. Hier geht es nicht um die Qualität des Inhalts, des Covers oder der Klappentexte, sondern um all das, was der Computer erkennen und messen kann. Bei uns sind das natürlich die tagesaktuellen Rankings, aber auch Faktoren wie Preis, Kategorien, Autor, Verfügbarkeit in der Leihbücherei, Vorhandensein von DRM (Kopierschutz), Anzahl der Leser-Rezensionen und der Mittelwert der Bewertungen.

Insgesamt etwa 150.000 Datensätze sind auf diese Weise zusammengekommen, die wir nun mathematisch analysiert haben. Daraus ist ein Modell entstanden, das mit bemerkenswerter Genauigkeit künftige Platzierungen vorhersagen kann. Wir sind gerade dabei, das in die Top 1000 zu integrieren. Die Genauigkeit der Vorhersage für den kommenden Tag liegt dabei bei: