Oprettet tor. d. 02. september 2010 kl. 20:54:44

dennism
dennism (4.891 point. Point ude: 0)
www.dennismadsen.com

Fjern HTML-tag fra string

Jeg har forsøgt at lave en funktion i PHP, som kan fjerne den første forekomst af et HTML-tag fra en string samt dets korrekte end-tag'et i forhold til DOM træet.

Lad os f.eks. tage dette eksempel:
<p>
    <div>
        <p>test</p>
    </div>
</p>
<div>test</div>


Det skal efter det er kørt igennem funktionen, med fjernelse af første p-tag, blive til:
    <div>
        <p>test</p>
    </div>
<div>test</div>


Bemærk, at den ikke koncentrerer sig om indent.

Her er den funktion jeg har lavet:
function remove_first_tag($var, $tag) {
  $tagStart = '<'.$tag.'>';
  $tagEnd = '</'.$tag.'>';
 
  $pos = strpos($var,$tagStart);
  if(!($pos === FALSE)) {
    $posStartTag = $pos;
   
    $level = 0;
   
    for ($n=0;!isset($posEndTag) && $n-strlen($tagEnd)<strlen($var);$n++) {
      $tmp_var = substr($var, $n);
       
      if (substr($tmp_var, 0, strlen($tagStart))==$tagStart)
        $level++;
      if (substr($tmp_var, 0, strlen($tagEnd))==$tagEnd) {
        $level--;
        if ($level==0) {
          $posEndTag=$n;
        }
      }
    }
  }
 
  //removing start tag
  if (isset($posStartTag))
    $var = substr($var, 0, $posStartTag ).substr($var, $posStartTag+strlen($tagStart));
  //removing end tag
  if (isset($posEndTag))
    $var = substr($var, 0, $posEndTag-strlen($tagStart)).substr($var, $posEndTag-strlen($tagStart)+strlen($tagEnd));
 
  return $var;
}


Funktionen kan køres på denne måde:
$var = remove_first_tag($string,'p');


Mit spørgsmål går blot på, om der findes en bedre måde at løse denne problemstilling på?

Skrevet tor. d. 02. september 2010 kl. 20:58:33| #1

Øv, det gik helt galt med dette indlæg.

I kan læse en mere læsevenlig version her:
http://uploads.dennismadsen.com/ (...)

Skrevet tor. d. 02. september 2010 kl. 21:28:29| #2

Det er pænt langhåret/ambitiøst...
- ikke mindst, hvis du kan risikere at HTML'en ikke er 100% valid ?
(og de fleste tags har jo attributter tilknyttet som ikke gør det lettere)

Umiddelbart ville jeg anbefale at "køre det igennem" noget XML-validering.
- og så tage den dérfra, med XML-tool-classes (ikke et rigtigt ord)

Skrevet tor. d. 02. september 2010 kl. 21:32:32| #3

For ikke at tale om sider med javascript, som indeholder HTML i strenge...

Skrevet fre. d. 03. september 2010 kl. 11:18:11| #4

intenz
intenz (43.895 point)
underenplov.dk
Af ren nysgerrighed, hvorfor har du behov for det?

Skrevet fre. d. 03. september 2010 kl. 11:26:02| #5

Jeg sidder og arbejder i WordPress. Jeg har indsat et tag i et indlæg, for at vise en kontaktformular (Contact Form 7 - wpcf7). WordPress sætter først <p> og <br> tags på indlæg lige inden de udskrives i frontend. Desværre betyder det, at jeg i en bestemt situation ender med:
<p><div class="wpcf7">...</div></p>

Og det er ikke valid XHTML. Så er nødt til at fjerne det første <p>, hvis der findes en div med klassen wpcf7.

Håber det giver lidt mening. Ved godt det virker ret uanvendeligt, men jeg er meget bevidst omkring validaring.

Skrevet fre. d. 03. september 2010 kl. 14:28:25| #6

intenz
intenz (43.895 point)
underenplov.dk
Hvis det kun er det du skal bruge din funktion til, så brug bare den du selv har lavet (hvis den virker). Dit oprindelige spørgsmål var om der "findes en bedre måde at løse denne problemstilling på". Der findes nok mange måder at løse det på, men ingen nem måde, da det er 'problem' der bør løses inden det opstår (der bør aldrig sættes <p></p> på hvis det ikke skal bruges). Det vil være den 'rigtige' måde at løse det på, det du forsøger er symptom-behandling.

Nu hvor det er sat på, og det kun skal bruges i en så præcis sammenhæng, så er det du har lavet fint. Eller en hvilken som helst anden måde. Bare ikke forvent, at det _altid_ vil fungere, da der som #2 skriver kan være mange variationer af tags.

Skrevet fre. d. 03. september 2010 kl. 14:57:11| #7

intenz
intenz (43.895 point)
underenplov.dk
Hvis du vil ofre fleksibiliteten, og dine tags altid står først/sidst i din streng (hvilket måske er usandsynligt), er den nemmeste måde bare at substr dem ud:
http://php.net/ (...)

function removeFirstLastTag($str, $tag) {
  $firstTag = '<'+$tag+'>';
  $lastTag = '</'+$tag+'>';

  return substr($str, strlen($firstTag), (-1)*strlen($lastTag));
}

Hvis du kun har behov for at gøre det med <p></p> og evt. <br>, så lad være med at lave en generisk funktion der potentielt kan gøre det med alle typer tags i alle typer stregne. Det er ingen grund til at overkomplicere det hvis du aldrig får brug for det.

Skrevet fre. d. 17. september 2010 kl. 00:21:46| #8

Vil I begge smide et svar - så kan I dele point.

Skrevet fre. d. 17. september 2010 kl. 09:04:26| #9


Skriv et indlæg




Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] [img]link til billede[/img]
Web- og emailadresser omdannes automatisk til links

Log ind

   

   

Seneste spørgsmål

Procentregning

Oprettet den 11. februar 2012 kl. 11.26
sevinding giver 60 point for svar | Giv et svar »

Ville ikke tildele at upload det til database eller komme...

Oprettet den 10. februar 2012 kl. 21.23
tobrukDk giver 15 point for svar | Giv et svar »

HTTP Post XML og modtag svar

Oprettet den 10. februar 2012 kl. 17.55
mrkaynex giver 200 point for svar | Giv et svar »

Seneste guides

Installer win 7
Den gode bruger


   




Tips & Tricks fra PC World

Teaser billede

Her er fem sjove danske websider du skal kende

Trænger dine lattermuskler til en omgang fitness på dansk? Vi viser vej til fem websider fyldt med humor og vanvittig satire.


Anmeldelser fra PC World

Teaser billede

Test: Denne super-tablet er iPads hårdeste konkurrent

Eee Pad Transformer Prime er frygtindgydende med sin quadcore processor og evne til at trylle sig om til bærbar. Apple bør kigge i bagspejlet, for Asus' tablet-pc kommer buldrende - og gør det...


Seneste blogindlæg

Teaser billede

Tvangslukke spørgsmål: Hvad er den bedste løsning?

Hej Vi har mange åbne spørgsmål på Eksperten. Vi ville gerne tvangslukke dem - så et spørgsmål efter f.eks. 6 måneder lukkes. Men der er et par uklarheder som ville være gode at få lidt input til:...


Nyheder fra PC World

Teaser billede

Nu kan du snart hente Windows 8

Den nye offentlige betaversion af Windows 8 er klar i denne måned.


Nyheder fra Computerworld

Teaser billede

Måske snart slut med Androids helt store problem

Android-platformen har længe været plaget af et særligt problem. Men måske er problemet nu ved at være elimineret.


Kurser
Samarbejdspartnere

Udgiver · © 2012 IDG Danmark A/S · Hørkær 18 · 2730 Herlev · Tlf.: 77 300 300 · Fax: 77 300 301 · Brug af personoplysninger