gelöschter Benutzer

Verh. Content zu Quelltext:

am 20.05.2009, 16:55 Uhr eröffnete folgenden Thread
Feedback    1287 mal gelesen    6 Antwort(en).

Ich glaube das das angezeigte Ergebnis falsch ist.

Bei mir ist es 47% gezeigt wird 52.25, gerundet käme es hin wenn man 100 - 52.25 rechnet.


seitenreport
Avatar seitenreport
Inhaber
TYPO3 Senior Developer
Content Gott (1772 Beiträge)
am 20.05.2009, 17:00 Uhr schrieb seitenreport

Danke,

schaue ich mir in Kürze an (heute Abend) und bessere es ggf. aus.


SEO Analyse und Website-Check mit Seitenreport

seitenreport
Avatar seitenreport
Inhaber
TYPO3 Senior Developer
Content Gott (1772 Beiträge)
am 20.05.2009, 19:47 Uhr schrieb seitenreport

Die Funktion und Berechnung scheint in Ordnung. Anmerkung: Alles was nicht Text ist wird herausgefiltert, also alle <...>, auch script-Blöcke und Header-Angaben. Ãœbrig bleibt dann als Content nur der reine Text.


SEO Analyse und Website-Check mit Seitenreport


gelöschter Benutzer
am 20.05.2009, 19:53 Uhr schrieb

Ich mache das so,

html komplett

striptags(html)

mit der Differnez lässt es sich exakt rechnen.


seitenreport
Avatar seitenreport
Inhaber
TYPO3 Senior Developer
Content Gott (1772 Beiträge)
am 20.05.2009, 20:18 Uhr schrieb seitenreport

Mit strip_tags() erhält man tatsächlich ein anderes Ergebnis als mit meinem RegExp, der jedoch eine nahezu gleiche Ausgabe erzeugte. Per strip_tags() erhalte ich für deine Seite 46.46%

Ich habe die Routine gerade mal auf Entfernung per strip_tags() umgestellt, so ist sie vor allem etwas Ressourcen-schonender :wink: ).


SEO Analyse und Website-Check mit Seitenreport

seitenreport
Avatar seitenreport
Inhaber
TYPO3 Senior Developer
Content Gott (1772 Beiträge)
am 31.05.2009, 10:15 Uhr schrieb seitenreport

Wenn du nur strip_tags() zur Berechnung des Verhältnisses von Content zu Quellcode verwendest, sind die Ergebnisse fehlerhaft:

(1) CSS-Style-Angaben im Header werden nicht gefiltert: <style> <br />(2) Skript-Blöcke (z.B. JS) werden nicht gefiltert: &lt;script&gt; <br /> <br />Darum waren unsere Ergebnisse hier unterschiedlich. Um an den reinen Content zu gelangen, müssen vor dem strip_tags() per preg_replace() die <style>´s und &lt;script&gt;´s entfernt werden. <br /> <br />Beispiel: <br /> <br /><code> <br /> <br />$pattern = \'#&lt;style(.+)&lt;/style&gt;#Usi\'; <br />$content = preg_replace($pattern,&quot;&quot;,$html); <br /> <br /></code> <br /> <br />(Entfernt alle Style-Tags im Header). <br /></p></style>


SEO Analyse und Website-Check mit Seitenreport


gelöschter Benutzer
am 31.05.2009, 11:18 Uhr schrieb

Das ist richtig.

Man müsste auch Kommentare entfernen und vielleicht noch ein paar andere Dinge.


  • 1


« zurück zu: Feedback

Das Seitenreport Forum hat aktuell 5276 Themen und 36111 Beiträge.
Insgesamt sind 48364 Mitglieder registriert.