Seit dem ersten Panda-Release in den USA wird kontrovers diskutiert, warum manche Seiten als Gewinner bzw. Verlier aus den Updates hervorgegangen sind. Auch wir bei Stylight haben fleissig gerätselt, seit letztem Freitag ist es soweit und die Ranking-Algorithmus-Änderung sind auch bei uns in Deutschland angekommen. So wie es bis jetzt aussieht, gehören wir immerhin nicht zu den Verlierern. Aber was hat uns beschützt?
Von Google hört man nur, das die Seite für den Nutzer sinnstiftend und informativ sein soll. Wir geben uns in dieser Richtung viel Mühe, aber ist das auch messbar? Vermutlich wird nicht jede Seite von einem Google Quality Rater ins Visier genommen und danach “abgestraft”. Bei seo-book.de gab es einen spannenden Gedanken, ob nicht Onsite KPIs wie die Bounce-Rate als Indikator für eine gute Seite dienen. Da ich vorallem Zahlen Vertrauen schenke und es in diesem Blog nunmal quantitativ zugehen soll, soll dieser Post quantitativ signifikante Indikatoren für eine Panda-Abstraffung untersuchen. Hierbei soll SEOmoz’s Search-Ranking-Factors als Vorbild für quantitative Aussagen dienen.
Methodik und Datenbasis
Als Ausgangsbasis nehmen wir eine Liste der Panda-Gewinner und Verlierer, in diesem Fall die Version von Searchmetrics. Damit haben wir zwei Cluster, zum einen den der Verlierer (n = 62), zum anderen den der Gewinner (n = 20). Daraus haben wir für Verlierer das Label “1” und für Gewinner das Label “-1” abgeleitet. Für die insgesamt 82 Domains haben wir die Alexa-Daten zusammengetragen. Im ersten Schritt haben uns hier besonders die Onsite KPIs interessiert:
- Alexa Traffic Rank (global)
- Daily Reach (in Prozent, global)
- Pageviews (in Prozent, global)
- Pageviews pro Nutzer
- Bouncerate (in Prozent)
- Aufenthaltsdauer
Um kurzfristige Effekte heraus zu filtern haben wir jeweils die 3-Monats-Durschschnitte verwendet. Hier haben wir nun jeweils die Korrelation zwischen der Variablen und der Zugehörigkeit zu Clustern berechnet. Das Ergebnis, der Korrelationskoeffizient ist folgendermassen zu lesen: je größer, desto stärker ist der Einfluss der Variablen auf das Abschneiden der Domain bei Panda. Zusätzlich haben wir das Signifikanz-Niveau mittels T-Test bestimmt (zweiseitiger Test, ungleiche Varianz). Allgemein wird ab einem Wert < 5% (1 – Signifikanz-Niveau) von einer zuverlässigen Aussage gesprochen.
Hohe Bouncerate als Indikator für Panda-Abstrafung
Vier der KPIs haben sich nach dem T-Test als signifikant heraus gestellt (alle Daten siehe Tabelle am Ende des Posts) und sind somit statistisch gesehen Faktoren für eine Panda-Abstrafung. Der Pfeil nach der KPI zeigt an, ob ein höherer Wert der KPI auf einen Verlierer deutet (Pfeil nach oben) oder eben eine kleinere KPI eher die Domain als Panda-Verlierer dastehen lässt (Pfeil nach unten). Unsere Ergebnisse decken sich mit den Erkenntissen von seo-book.de, wonach eine höhere Bouncerate ein Indikator für Panda-Abstrafung sein könnte. Dies ist auch der vergleichsweise stärkste Indikator, wobei die anderen Onpage-KPIs Pageviews pro User und Aufenthaltsdauer auch eine deutliche Auswirkung zu haben scheinen. Das der Traffic Rank auch einen Einfluss hat, erkläre ich mir damit, das Google zuerst versucht hat die großen Fische mit schlechten Content haben anzugehen (“Content Farms”). Wenn man wie hier Korrelationen betrachtet muss einem klar sein, dass diese nicht notwendigerweise einen Kausal-Zusammenhang darstellen (also “hohe Bouncerate führt immer zur Panda-Abstrafung”), das verdeutlicht folgender Plot:
Hier sind links die Bouncerates der Panda-Gewinner und rechts die Bouncerates der Panda-Verlierer geplottet. Man sieht, dass es auch Panda-Verlierer gibt, die eine niedrigere Bouncerate als so mancher Panda-Gewinner haben. Im Mittel aber sieht man, dass Panda-Verlierer schon eine deutlich größere Bouncerate haben. Das erscheint sinnvoll, wird doch gemeinhin vermutet das für eine Panda-Abstrafung viele Indikatoren zusammen kommen müssen und nicht eine einzige Größe als Maß dient.
Traffic-Quellen als weiterer Panda-Faktor
Als eine der Ranking-Faktoren für 2011 scheint sich ja Brand Queries heraus zu kristalisieren. Uns hat nun interessiert, ob auch dies ein Indikator für Panda-Abstrafungen sein könnte. Weiterhin verfügt Alexa über einige interessante Zahlen, welche die Trafficsources einer Seite betreffen. Dies sind zum einen der Anteil von Search am Gesamttraffic der Domain, zum anderen die vor und nach der Domain besuchten Seiten in der Surf-Session (Clickstream). Ob ein User nach dem Besuch des Angebots eine weitere Suche starten muss, hört sich auf jeden Fall logisch als Qualitätskriterium an. In den meisten Fällen würde dies bedeuteten, das Angebot war von geringer Qualität, sodass der User erneut zu Google zurück kehren muss.
Siehe da, Google als nachfolgend besuchte Seite (Downstream Google) weist eine starke Korrelation mit Panda-Abstürzen auf. Bemerkenswert ist, das viel Traffic von Google zu erhalten (Upstream Google) eine sogar noch höhere Korrelation besitzt. Eventuell ist Google der Ansicht, Seiten die vom Nutzer nicht von selbst angesteuert werden, sind von niedrigerer Qualität. Das der Anteil von Suchtraffic am Gesamttraffic eine niedrigere Korrelation als Suchtraffic von Google besitzt, lässt sich dadurch erklären, dass Google deutlich einfacherer den eigenen Search-Traffic als den aller Searchengines messen kann.
Um oben angesprochene Vermutung, dass Brand Queries ein Trust-Signal ist, zu bestätigen, haben wir uns das Monthly Search Volume auf den Domain-Namen via AdWords-Tool ausgeben lassen. Diesen haben wir wiederum in Korrelation zum Panda-Abscheiden gesetzt. Voila, es hat deutlichen Einfluss, sogar noch mehr als alle Onpage-Faktoren.
Wrap-Up
Zusammen genommen erkennt man das viele Faktoren zusammen kommen müssen, um eine Panda-Abstraffung zu erleiden. Als Gegenmassnahme ist sicher als erstes eine Bouncerate-Optimierung zu empfehlen, was durchaus mit einfachen Massnahmen realisierbar ist (passende Visuals wie Markenlogos haben bei uns viel geholfen). Eine Reduzierung des Suchtraffic-Anteils kann vermutlich durch einen Shift im Online-Marketing erreichen, beispielsweise in dem man günstigen Display-Traffic einkauft.
Eine Steigerung der Time-on-Site ohne graue Tricks hingegen dürfte schwerer sein. Wenn es einem allerdings gelingt ein cooles “Produkt” zu schaffen, dann muss man sich um Seitenverweildauer sowie Brand-Traffic keine Sorgen mehr machen. Natürlich ist es immer leichter gesagt, als getan ein cooles Produkt für Nutzer zu bauen. Wir jedenfalls haben werkeln seit längeren an etwas in diese Richtung, in zwei Wochen ist es soweit, wir freuen uns darauf!
Hoffentlich hat euch dieser erste Post gefallen! In Zukunft werden wir weitere interne Analysen wie diese hier posten und freuen uns über eine angeregte Diskussion. Also am Besten RSS-Feed abonieren oder auf Twitter / Google+ folgen.
Vielen Dank an Max und Nico für die Mithilfe und Max für das Logo!
Alle Zahlen auf einen Blick
Variable | Korrelationskoeffizient | T-Test |
---|---|---|
Alexa Traffic Rank (global) | 0.24 | 0.09 % |
Daily Reach (in Prozent, global) | -0.33 | 9.89 % |
Pageviews (in Prozent, global) | -0.26 | 19.79 % |
Pageviews pro Nutzer | -0.39 | 1.09 % |
Bouncerate (in Prozent) | 0.41 | 0.01 % |
Aufenthaltsdauer | -0.33 | 4.99 % |
Suchtraffic (in Prozent) | 0.46 | 0.07 % |
Upstream Google (in Prozent) | 0.59 | 0.00 % |
Downstream Google (in Prozent) | 0.51 | 0.00 % |
Brandtraffic | -0.50 | 0.94 % |