gelöschter Benutzer

Verh. Content zu Quelltext (Seite 4)



gelöschter Benutzer
am 22.06.2009, 21:32 Uhr schrieb

Ist ja der Hammer! lol Das ist doch nicht zu fassen. 69%! Hast du eine Erklärung für dieses Phänomen?


seitenreport
Avatar seitenreport
Inhaber
TYPO3 Senior Developer
Content Gott (1772 Beiträge)
am 22.06.2009, 21:41 Uhr schrieb seitenreport

28.82 % Content - 69% Bewertung - das kommt hin :wink:

Erklärung => noch nicht, ich suche noch


SEO Analyse und Website-Check mit Seitenreport

gerard
Content Gott (1271 Beiträge)
am 22.06.2009, 21:43 Uhr schrieb gerard

Yps schrieb:

Ist ja der Hammer! lol Das ist doch nicht zu fassen. 69%! Hast du eine Erklärung für dieses Phänomen?


Nun nicht übertreiben. Das Verhältnis ist \'nur\' 28,8%. Die 69% ist die Bewertung dieser 28,8%

Gérard
der sich fragt, warum das Ergebnis nun besser ist als seine Handzählmethode


http://bretagne-virtuell.de

seitenreport
Avatar seitenreport
Inhaber
TYPO3 Senior Developer
Content Gott (1772 Beiträge)
am 22.06.2009, 21:45 Uhr schrieb seitenreport

Gerard schrieb:

der sich fragt, warum das Ergebnis nun besser ist als seine Handzählmethode


Wie hast du die unzähligen nbsp; und #104; etc. gezählt? Vielleicht liegt hier die Differenz.


SEO Analyse und Website-Check mit Seitenreport

gerard
Content Gott (1271 Beiträge)
am 22.06.2009, 22:16 Uhr schrieb gerard

seitenreport schrieb:

Wie hast du die unzähligen nbsp; und #104; etc. gezählt? Vielleicht liegt hier die Differenz.


Die gibt es nicht mehr. Aber es gibt führende Leerzeichen durch Einrückungen. Die könnten es sein und der nun fehlende Kommentar.

Gérard


http://bretagne-virtuell.de

dbosen
Beginner (22 Beiträge)
am 23.06.2009, 15:47 Uhr schrieb dbosen

seitenreport schrieb:

So wirds gemacht bei Seitenreport:

// $html = Inhalt der Webseite, komplette HTML

// Pre-Filtern von Script-Blöcken
// da diese nicht durch strip_tags() entfernt werden
$pattern = \'#<script(.+)</script>#Usi\';
$content1 = preg_replace($pattern,"",$html);

// Pre-Filtern von Style Angaben im Head
// da diese nicht durch strip_tags() entfernt werden
$pattern = \'#<style(.+)</style>#Usi\';
$content1 = preg_replace($pattern,"",$content1);

// Länge von Content und Länge von HTML
$len_content = strlen(strip_tags($content1));
$len_html = strlen($html);

// Verhältnis des Contents
$v_content = round(($len_content/$len_html*100),2);

Die beiden Pre-Filter können natürlich auch in ein einziges preg_replace() gepackt werden.



Hat zwar nicht direkt mit dem Problem hier zu tun, aber ich glaube bei diesem Algorithmus werden zB. alle Tabulatoren, Spaces und Newlines die zum Strukturieren des Quellcodes gedacht sind, als content gezählt. Ich denke, das verfälscht das Ergebnis relativ stark, vor allem wenn mit Spaces eingerückt wird.




« zurück zu: Analyse-Ergebnisse

Das Seitenreport Forum hat aktuell 5275 Themen und 36110 Beiträge.
Insgesamt sind 48360 Mitglieder registriert.