WDF*IDF

WDF*IDF steht für Within-Document-Frequency + Inverse-Document-Frequency. Damit ist die Keyword-Dichte in einem Text (WDF) und die Relation des Textes zu allen mit der Thematik befassten (und dementsprechend mit den adäquaten Keywords versehenen) Texten (IDF) gemeint. WDF*IDF soll von den Suchmaschinen algorithmisch eingesetzt werden und wäre damit bedeutsam für die SEO, allerdings ist dies wie alle Aussagen zu Suchmaschinenalgorithmen eine Hypothese.

Woher kommt WDF*IDF?

Zumindest die WDF-Formel entwickelte die Informations- und Sprachforscherin Donna Harman. IDF ist ein (wahrscheinlich) von den Suchmaschinen angewendeter Wert. Harman wollte der Keyword-Dichte in einem Dokument einen Wert verleihen, den die Informationswissenschaft quantifizieren und somit als Gewichtungswert nutzen kann.

Wenn aber aus der Keyword-Dichte ein Gewichtungswert des Wortes in betreffenden Dokument resultiert und wiederum dieses Dokument in Relation zu thematisch gleichen oder sehr ähnlichen Dokumenten mit einer gewissen Häufigkeit auftaucht (IDF), lässt sich aus den beiden Werten ermitteln, wie wichtig das Dokument und sein Hauptthema, benannt durch das Keyword, insgesamt ist. Hierfür gibt es eine sehr komplexe Formel, die wir vernachlässigen möchten. Sie zielt darauf, WDF und IDF zu einer Gewichtungsformel zusammenzufassen.

Die Formel ist so komplex, weil sie als WDF nicht allein die bloße Keyword-Density nennt, sondern einen logarithmisch gestauchten Wert angibt, der zu einer höheren Genauigkeit führen soll.

WDF*IDF im Kontex der SEO

Es ist möglich, dass Suchmaschinenalgorithmen Texte nach WDF*IDF bewerten. Donna Harmans Forschungen zielten eigentlich darauf ab, Texte in wissenschaftlichen Bibliotheken zu gewichten, damit ein Forschender oder Studierender nicht zahllose Quellen lesen muss, sondern eher das Dokument findet, das seiner Suchintention am nächsten kommt. Der WDF-Wert ist die allseits bekannte Keyword-Density mit ihrer bekannten Relevanz für die SEO.

Ob eine Suchmaschine allerdings alle Texte mit noch so banalem Inhalt (unter anderem bloße Verkaufsseiten, Modeseiten etc. pp.) nach WDF*IDF in das Ranking einsortiert, darf bezweifelt werden. SEO-Experten vermuten immerhin, dass

  • a) der WDF-Wert etwas mehr besagt als das bloße Zählen von Keywords und
  • b) die Relevanz von Texten in Relation zum Wettbewerb durchaus eine Rolle spielt.

Man könnte dies so in das Allgemeinverständnis übersetzen, dass ein gut optimierter Text mit optimaler Keyword-Density, der entweder ein Nischenthema behandelt oder ein häufig behandeltes Thema noch viel besser als die Konkurrenz behandelt, gute Chancen beim Ranking hat. Immerhin soll ja die WDF*IDF-Formel ergeben, dass das Gewicht eines Dokuments umso mehr steigt, je seltener sein Thema bislang behandelt wurde, weil es neue, nützliche Informationen hinzufügt.

Es muss aber immer ausreichend mit Keywords optimiert sein, um gefunden zu werden. Wenn jedoch ein Dokument zwar ausreichend optimiert ist, sein Thema aber schon hinlänglich abgehandelt wurde (was den IDF-Wert senkt), hat es weniger gute Chancen auf ein hohes Ranking.

Kritische Betrachtung von WDF*IDF

Erfahrene Optimierer und Autoren bezweifeln wahlweise die SEO-Relevanz von WDF*IDF oder auch das ganze Konstrukt an sich an, das ihnen wie eine skurille Kopfgeburt erscheint. Forderungen, Texte nach WDF*IDF zu schreiben, weisen Autoren, die für das Onlinemarketing tätig sind, meistens zurück. Das Einfügen von Keywords in einer ganz bestimmten Häufigkeit und damit Dichte ist hingegen gängige Praxis.

zurück zur Übersichtsseite