behalx
Themenersteller
Fortgeschrittener (61 Beiträge)
Reguläre Ausdrücke: Submuster gruppieren
Folgendes Szenario: Ich will bestimmte Wörter (z.B. String oder System) fett markieren, aber dieser Wörter müssen sich innerhalb geschweifter Klammern befinden. Beispiel:
class HalloString {
public static void main(String[] args) {
System.out.println("Hallo, Welt!");
}
}
(Hallo + ) String sollte nicht fett markiert werden, aber String (+ []) schon. Ich habe es so versucht:
$reg = '/(\{)(.*)(String)(.*)(\})/';
$rep = '\$1\$2\$3\$4\$5';
$code = preg_replace($reg, $rep, $code);
aber es klappt nicht. Kennt jmd. eine Lösung? Vll. mit Hilfe von Submustern?
http://unics.bplaced.net/
joerg
Fachinformatiker Anwendungsentwicklung
Content Gott (1941 Beiträge)
Hallo Behalx
So würde ich das abändern.
Zeilenwechsel werden durch die Option s mit berücksichtigt.
Nicht gierige Suche müsstest du mit der Option U noch aktivieren.
Und dann musst du noch abfangen das die Klammer zwischendrin nicht geschlossen wird.
Und dann habe ich den Ausdruck mal minimiert.
$code = \'class {}HalloString {
public static void main(String[] args) {
System.out.println("Hallo, Welt!");
}
{String}{}String{}
}\';
$reg = \'/({[^}]*)(String)(.*})/Us\';
$rep = \'\\$1\\$2\\$3\';
$code = preg_replace($reg, $rep, $code);
echo $code;
Wäre das keine Alternative?
php.net/manual/de/function.highlight-string.php
Gruß
Jörg
Zufällige Umleitung zu der Startseite einer meiner Domains
Meine ungewöhnlichen Tools
behalx
Fortgeschrittener (61 Beiträge)
Danke. Es klappt.
Gab es einen Grund für diesen Ausdruck "({[^}]*) ..." ? Mit Hilfe von "Us" klappt es auch so:
$reg = \'/(\\{)(.*)(System|String)(.*)(\\})/Us\';
$rep = \'\\$1\\$2\\$3\\$4\\$5\';
$code = preg_replace($reg, $rep, $code);
Jedoch wird immer nur System oder String fett markiert (in beiden Versionen). Gibt es eine Möglichkeit, wie beide (bzw. noch mehr) Alternativen ersetzt werden?
joerg schrieb:
Wäre das keine Alternative?
php.net/manual/de/function.highlight-string.php
Nein. Ich programmiere zur Zeit einen Syntaxhighlighter für Java.
http://unics.bplaced.net/
joerg
Fachinformatiker Anwendungsentwicklung
Content Gott (1941 Beiträge)
behalx schrieb:
Gab es einen Grund für diesen Ausdruck "({[^}]*) ..." ? Mit Hilfe von "Us" klappt es auch so:
Okay aber dann wird auch so was umgewandelt. {}String{}
behalx schrieb:
Jedoch wird immer nur System oder String fett markiert (in beiden Versionen). Gibt es eine Möglichkeit, wie beide (bzw. noch mehr) Alternativen ersetzt werden?
Ist die Frage welche Schreibweise dir jetzt eher zusagt.
$syntax = array(\'String\',\'System\');
foreach ($syntax as $var)
{
$reg = \'/({[^}]*)(\'.$var.\')(.*})/Us\';
$rep = \'\\$1\\$2\\$3\';
$code = preg_replace($reg, $rep, $code);
}
//oder
$reg = array(\'/({[^}]*)(String)(.*})/Us\',\'/({[^}]*)(System)(.*})/Us\');
$rep = array(\'\\$1\\$2\\$3\',\'\\$1\\$2\\$3\');
$code = preg_replace($reg, $rep, $code);
Die Problematik rührt daher wenn in einem Bereich schon ein Austausch stattgefunden hat, das dieser mit deiner Abfrage nicht noch mal durchsucht wird.
Ich weiss jetzt nicht ob {{}String} vorkommen könnte rein theorethisch.
Wenn ja müsste man das noch mit
$reg = \'/({[^}]*[{[^}]*}]*)(String)(.*})/Us\';
abdecken können durch einen zusätzlichen Lauf mit Ersetzen. Aber bei dem regulären Ausdruck bin ich mir jetzt nicht so sicher ob es nicht noch besser geht.
Gruß
Jörg
Zufällige Umleitung zu der Startseite einer meiner Domains
Meine ungewöhnlichen Tools
matthes
Foren Moderator
Evil Genius
Content Halbgott (973 Beiträge)
An dieser Stelle möchte ich einmal eines meiner Lieblingstools empfehlen, es wäre wohl nirgendwo passender als hier:
gskinner.com/blog/archives/2008/03/regexr_free_onl.html
Mit diesem kleinen Helferlein wird das Level von Herumprobieren und Umstellen von "frustrierend" auf "ahso!" gehoben.
Make Seitenreport great again!
behalx
Fortgeschrittener (61 Beiträge)
Sieht interessant aus. Werde ich mir mal bei Gelegenheit anschauen.
@Jörg
Funktioniert auch nicht, da z.B. bei dem Array ("String", "System") genau ein System und ein String fett markiert werden, aber die anderen jedoch nicht. Ich habe aber jetzt eine billigere Lösung gefunden:
$reg = \'/([^\\w])(String|System)([^\\w])/\';
$rep = \'\\$1\\$2\\$3\';
$code = preg_replace($reg, $rep, $code);
Dadurch werden z.B. alle String\\w+ ignoriert, aber dafür z.B. String[] oder String nicht.
http://unics.bplaced.net/
romacron
JDev Xer
Content Gott (1224 Beiträge)
Hallo Matthes.
Kurz und schmerzlos. Klasse Tool. Wurde soeben in die "must have" aufgenommen.
Vielen Dank
gelöschter Benutzer
Hallo,
warum baust du ihn dir selber? Nimm doch einfach den hier.
qbnz.com/highlighter/
Wenn du es trotzdem selber versuchen willst, google mal ein wenig nach Parsergeneratoren und Compilerbau. Denn das ist keine leichte Aufgabe die du da hast, Java ist doch schon recht komplex. Da die Syntax zu Validieren ... viel Spaß.
Schöne Grüße
behalx
Fortgeschrittener (61 Beiträge)
Wenn ich mal absolut nicht weiter weiß, werde ich mir das mal anschauen. Aber dann würde ich auch nichts mehr über reguläre Ausdrücke in PHP lernen.
http://unics.bplaced.net/
Chance
Programmierer
Guru (173 Beiträge)
Das Seitenreport Forum hat aktuell 5275 Themen und 36110 Beiträge.
Insgesamt sind 48360 Mitglieder registriert.
Beitrag erstellen
EinloggenKostenlos registrieren