gelöschter Benutzer

Verh. Content zu Quelltext (Seite 3)



gelöschter Benutzer
am 22.06.2009, 19:18 Uhr schrieb

Es ist mein erstes eigenes selbstgebasteltes CMS. Ich habe eine index.tpl, der Rest wird dann über die Tabelle eingefügt. Ich würde schon gerne optimieren, weiss aber nicht wirklich wie. Die grössten Probleme habe ich bei SEO, da habe ich ganz schlechte Resultate.


seitenreport
Avatar seitenreport
Inhaber
TYPO3 Senior Developer
Content Gott (1772 Beiträge)
am 22.06.2009, 19:21 Uhr schrieb seitenreport

@Gerard: Dass 3% dennoch nicht stimmig sein kann, liegt auf der Hand (nachdem man sich die Seite etwas genauer angeschaut hat).

Dieser "Bug" oder auch nicht Bug (siehe unten) ist mir schon etwas länger bekannt, taucht aber nur bei äußerst wenigen Webseiten auf.

Die Ursache liegt darin, dass - schwer vorstellbar aber so ist es tatsächlich - der PHP-Befehl strip_tags() bei ganz wenigen Webseiten den Inhalt zusammen mit dem DIV-Container bzw. einem

wegfiltert. Probiere es mal selbst mit obiger Seite, mich hat es auch überrascht. :wink:

So wird zu obiger Webseite als Content nurmehr folgendes erkannt:

"Hundeerziehung: Willkommen zur Hundeerziehung Links Sinas Tagebuch Regeln Kommandos Aufzucht Ich will...! "

dazu Zitat von PHP.net:

"Warnung:
Da strip_tags() HTML nicht wirklich validiert, kann es passieren, dass bei unvollständigen oder unkorrekten Tags mehr Text/Daten gelöscht werden als erwartet."

Quelle: de2.php.net/manual/de/function.strip-tags.php



Wahrscheinlich wurde auf der Seite vergessen irgendwo einen der DIV-Container zu schließen. (Habe gerade auf die Schnelle allerdings keine Fehler entdecken können)


SEO Analyse und Website-Check mit Seitenreport


gelöschter Benutzer
am 22.06.2009, 20:01 Uhr schrieb

Das ist ja interessant, Matthias. Ich hab echt riesen Spass an dieser Detektivarbeit. 8) Nun, ich mach mich gleich auf die Suche nach diesem div-Tag. Ich glaube zwar nicht, dass ich was finde, denn W3C validiert die Seite komplett.


gerard
Content Gott (1271 Beiträge)
am 22.06.2009, 20:02 Uhr schrieb gerard

seitenreport schrieb:

Schau dir mal den Quellcode an

3% Content passt da aber zu 100%.


Ich habe gezählt (und sogar das css zum Quellcode gerechnet - weil ich nicht wußte wie es gemacht wird). Heraus kommen ca. 17.000 Zeichen Quellcode zu ca. 2.000 Zeichen Text (führende Leerzeichen jeweils mitgerechnet). Das läßt ein Ergebnis von > 11% erwarten.

Gérard


http://bretagne-virtuell.de

seitenreport
Avatar seitenreport
Inhaber
TYPO3 Senior Developer
Content Gott (1772 Beiträge)
am 22.06.2009, 20:09 Uhr schrieb seitenreport

Gerard schrieb:

Ich habe gezählt (und sogar das css zum Quellcode gerechnet - weil ich nicht wußte wie es gemacht wird). Heraus kommen ca. 17.000 Zeichen Quellcode zu ca. 2.000 Zeichen Text (führende Leerzeichen jeweils mitgerechnet). Das läßt ein Ergebnis von > 11% erwarten.


:o aber hoffentlich nicht per Hand bei 17.000 Zeichen.

So wirds gemacht bei Seitenreport:

// $html = Inhalt der Webseite, komplette HTML

// Pre-Filtern von Script-Blöcken
// da diese nicht durch strip_tags() entfernt werden
$pattern = \'#<script(.+)</script>#Usi\';
$content1 = preg_replace($pattern,"",$html);

// Pre-Filtern von Style Angaben im Head
// da diese nicht durch strip_tags() entfernt werden
$pattern = \'#<style(.+)</style>#Usi\';
$content1 = preg_replace($pattern,"",$content1);

// Länge von Content und Länge von HTML
$len_content = strlen(strip_tags($content1));
$len_html = strlen($html);

// Verhältnis des Contents
$v_content = round(($len_content/$len_html*100),2);

Die beiden Pre-Filter können natürlich auch in ein einziges preg_replace() gepackt werden.


SEO Analyse und Website-Check mit Seitenreport

gerard
Content Gott (1271 Beiträge)
am 22.06.2009, 20:13 Uhr schrieb gerard

seitenreport schrieb:

Wahrscheinlich wurde auf der Seite vergessen irgendwo einen der DIV-Container zu schließen. (Habe gerade auf die Schnelle allerdings keine Fehler entdecken können)


Die Seite selbst ist valide. Das Problem steckt möglicherweise im iframe (Javascript). Da ist Google mäßig alles Kraut und Rüben. Aber das ließe sich ja testen. Das script mal rausnehmen (evtl. reicht auskommentieren) und sehen was passiert.

Gérard


http://bretagne-virtuell.de

gerard
Content Gott (1271 Beiträge)
am 22.06.2009, 20:27 Uhr schrieb gerard

seitenreport schrieb:

:o aber hoffentlich nicht per Hand bei 17.000 Zeichen.


Na ja - ich hab zwar kein script genommen, aber 3 x copy + paste brachten auch ein Ergebnis. Für alle Nichtscripter:
1. Quelltext aufrufen und in einen Editor kopieren, der auch Zeichen zählt (Notepad++ in meinem Fall).
2. css ausschalten (ist aber nicht unbedingt erforderlich - nur übersichtlicher). Den Inhaltstext der Seite markieren, kopieren und als unformatierter Text in eine leeres Worddocument einfügen. Damit hat man den nackten Text.
3. Den nackten Text markieren, kopieren und in eine zweite Datei im Editor füllen.

Vergleichen

Sicherlich gibt es auch andere Wege um Seitenreport zu überprüfen ... lol

Gérard


http://bretagne-virtuell.de


gelöschter Benutzer
am 22.06.2009, 20:29 Uhr schrieb

Wenn das Google-Script auskommentiert ist, ist das Verhältnis trotzdem nur 7%.

Wenn das Google-Script ganz weg ist, ist das Verhältnis auch 7%. Momentan ist das Script weg, damit ihr auch gucken könnt.


gerard
Content Gott (1271 Beiträge)
am 22.06.2009, 20:39 Uhr schrieb gerard

Yps schrieb:

Wenn das Google-Script auskommentiert ist, ist das Verhältnis trotzdem nur 7%.

Wenn das Google-Script ganz weg ist, ist das Verhältnis auch 7%. Momentan ist das Script weg, damit ihr auch gucken könnt.


Bei mir steht im Ergebnis nun 3,88%. Das ist und bleibt falsch. Nach der von mir geschilderten Methode zu Fuß:
Quelltext: 8.754 Zeichen
Inhaltstext: 1.865 Zeichen
ergibt 21,3%

Gèrard


http://bretagne-virtuell.de

seitenreport
Avatar seitenreport
Inhaber
TYPO3 Senior Developer
Content Gott (1772 Beiträge)
am 22.06.2009, 21:07 Uhr schrieb seitenreport

Ich glaube ich habe die Ursache gefunden.

Nimm mal bitte diesen Abschnitt hier probeweise komplett raus:


SEO Analyse und Website-Check mit Seitenreport



« zurück zu: Analyse-Ergebnisse

Das Seitenreport Forum hat aktuell 5275 Themen und 36110 Beiträge.
Insgesamt sind 48360 Mitglieder registriert.