Zum Inhalt springen
ThreadPHP & MySQL

Reguläre Ausdrücke: Submuster gruppieren

Kategorie
PHP & MySQL
Gelesen
1571
Antworten
9
Erstellt von: gelöschter BenutzerDatum: 23.06.2011, 15:33 Uhr
Archiv-KommentarArchiviert, nicht priorisiertCMS & technische Umsetzung

Redaktionelle Einordnung

Diese archivierte Diskussion behandelt Reguläre Ausdrücke: Submuster gruppieren aus Sicht der Rubrik PHP & MySQL.

CMS- und Technikfragen sind heute besonders dann relevant, wenn sie Indexierung, Rendering, interne Verlinkung oder Relaunch-Risiken beeinflussen.

Sinnvoll nutzbar bleibt der Thread vor allem als historischer Kontext, für typische Fragestellungen und zur Einordnung älterer Empfehlungen.

Einige im historischen Thread genannte Tools, Dienste oder externe Links könnten heute nicht mehr verfügbar oder inhaltlich überholt sein. Nutzen Sie sie bitte nur mit zusätzlicher Prüfung.

Startbeitrag

Originaler Foreninhalt in modernisierter Darstellung.

Zur Kategorie
gelöschter Benutzer
Threadstart · PHP & MySQL 1571 mal gelesen · 23.06.2011, 15:33 Uhr

Folgendes Szenario: Ich will bestimmte Wörter (z.B. String oder System) fett markieren, aber dieser Wörter müssen sich innerhalb geschweifter Klammern befinden. Beispiel:


class HalloString {
public static void main(String[] args) {
System.out.println("Hallo, Welt!");
}
}


(Hallo + ) String sollte nicht fett markiert werden, aber String (+ []) schon. Ich habe es so versucht:


$reg = '/(\{)(.*)(String)(.*)(\})/';
$rep = '\$1\$2\$3\$4\$5';
$code = preg_replace($reg, $rep, $code);


aber es klappt nicht. Kennt jmd. eine Lösung? Vll. mit Hilfe von Submustern?

Antworten

9 Beiträge
gelöschter Benutzer
am 23.06.2011, 16:38 Uhr schrieb
Antwort

Hallo Behalx

So würde ich das abändern.

Zeilenwechsel werden durch die Option s mit berücksichtigt.
Nicht gierige Suche müsstest du mit der Option U noch aktivieren.

Und dann musst du noch abfangen das die Klammer zwischendrin nicht geschlossen wird.

Und dann habe ich den Ausdruck mal minimiert.


$code = \'class {}HalloString {
public static void main(String[] args) {
System.out.println("Hallo, Welt!");
}
{String}{}String{}
}\';

$reg = \'/({[^}]*)(String)(.*})/Us\';
$rep = \'\\$1\\$2\\$3\';
$code = preg_replace($reg, $rep, $code);

echo $code;

Wäre das keine Alternative?

php.net/manual/de/function.highlight-string.php



Gruß
Jörg
gelöschter Benutzer
am 23.06.2011, 18:02 Uhr schrieb
Antwort

Danke. Es klappt.

Gab es einen Grund für diesen Ausdruck "({[^}]*) ..." ? Mit Hilfe von "Us" klappt es auch so:


$reg = \'/(\\{)(.*)(System|String)(.*)(\\})/Us\';
$rep = \'\\$1\\$2\\$3\\$4\\$5\';
$code = preg_replace($reg, $rep, $code);


Jedoch wird immer nur System oder String fett markiert (in beiden Versionen). Gibt es eine Möglichkeit, wie beide (bzw. noch mehr) Alternativen ersetzt werden?

joerg schrieb:

Wäre das keine Alternative?

php.net/manual/de/function.highlight-string.php




Nein. Ich programmiere zur Zeit einen Syntaxhighlighter für Java.

gelöschter Benutzer
am 23.06.2011, 22:49 Uhr schrieb
Antwort

behalx schrieb:
Gab es einen Grund für diesen Ausdruck "({[^}]*) ..." ? Mit Hilfe von "Us" klappt es auch so:



Okay aber dann wird auch so was umgewandelt. {}String{}

behalx schrieb:

Jedoch wird immer nur System oder String fett markiert (in beiden Versionen). Gibt es eine Möglichkeit, wie beide (bzw. noch mehr) Alternativen ersetzt werden?



Ist die Frage welche Schreibweise dir jetzt eher zusagt.

$syntax = array(\'String\',\'System\');
foreach ($syntax as $var)
{
$reg = \'/({[^}]*)(\'.$var.\')(.*})/Us\';
$rep = \'\\$1\\$2\\$3\';
$code = preg_replace($reg, $rep, $code);
}

//oder

$reg = array(\'/({[^}]*)(String)(.*})/Us\',\'/({[^}]*)(System)(.*})/Us\');
$rep = array(\'\\$1\\$2\\$3\',\'\\$1\\$2\\$3\');
$code = preg_replace($reg, $rep, $code);


Die Problematik rührt daher wenn in einem Bereich schon ein Austausch stattgefunden hat, das dieser mit deiner Abfrage nicht noch mal durchsucht wird.

Ich weiss jetzt nicht ob {{}String} vorkommen könnte rein theorethisch.

Wenn ja müsste man das noch mit
$reg = \'/({[^}]*[{[^}]*}]*)(String)(.*})/Us\';

abdecken können durch einen zusätzlichen Lauf mit Ersetzen. Aber bei dem regulären Ausdruck bin ich mir jetzt nicht so sicher ob es nicht noch besser geht.

Gruß
Jörg

Foren Moderator Evil Genius Content Halbgott (973 Beiträge)
am 23.06.2011, 23:17 Uhr schrieb matthes
Antwort

An dieser Stelle möchte ich einmal eines meiner Lieblingstools empfehlen, es wäre wohl nirgendwo passender als hier:

gskinner.com/blog/archives/2008/03/regexr_free_onl.html



Mit diesem kleinen Helferlein wird das Level von Herumprobieren und Umstellen von "frustrierend" auf "ahso!" gehoben.
Make Seitenreport great again!
gelöschter Benutzer
am 24.06.2011, 00:00 Uhr schrieb
Antwort

Sieht interessant aus. Werde ich mir mal bei Gelegenheit anschauen.

@Jörg

Funktioniert auch nicht, da z.B. bei dem Array ("String", "System") genau ein System und ein String fett markiert werden, aber die anderen jedoch nicht. Ich habe aber jetzt eine billigere Lösung gefunden:


$reg = \'/([^\\w])(String|System)([^\\w])/\';
$rep = \'\\$1\\$2\\$3\';
$code = preg_replace($reg, $rep, $code);


Dadurch werden z.B. alle String\\w+ ignoriert, aber dafür z.B. String[] oder String nicht.

JDev Xer Content Gott (1224 Beiträge)
am 24.06.2011, 06:12 Uhr schrieb romacron
Antwort

Hallo Matthes.

Kurz und schmerzlos. Klasse Tool. Wurde soeben in die "must have" aufgenommen.
Vielen Dank

gelöschter Benutzer
am 26.06.2011, 22:04 Uhr schrieb
Antwort

Hallo,

warum baust du ihn dir selber? Nimm doch einfach den hier.

qbnz.com/highlighter/



Wenn du es trotzdem selber versuchen willst, google mal ein wenig nach Parsergeneratoren und Compilerbau. Denn das ist keine leichte Aufgabe die du da hast, Java ist doch schon recht komplex. Da die Syntax zu Validieren ... viel Spaß.

Schöne Grüße
gelöschter Benutzer
am 27.06.2011, 11:42 Uhr schrieb
Antwort

Wenn ich mal absolut nicht weiter weiß, werde ich mir das mal anschauen. Aber dann würde ich auch nichts mehr über reguläre Ausdrücke in PHP lernen.