Oprettet lør. d. 29. august 2009 kl. 23:34:00

thewizard
thewizard (11.195 point. Point ude: 3.560)

Regular expressions - alle chars?

Hej alle,

Jeg sidder med open xml dokumenter (f.eks. docx) og skal trække alle overskrifter fra dokumentet.

En overskrift ser typisk sådan ud:

<w:rPr><w:rStyle w:val="Heading1Char"/></w:rPr><w:t>Thisisaheadline</w:t></w:r></w:p>

eller

<w:pPr><w:pStyle w:val="Heading1"/></w:pPr><w:r><w:t>This is the second headline</w:t></w:r></w:p>

1. Jeg har INGEN anelse hvorfor overskrifter både kan være det ene og det andet..

2. Til at trække alle overskrifter ud, har jeg skrevet følgende regular expression..

preg_match_all('/<w:(r|p)Style w:val=\"Heading1(Char|)\"\/>([a-zA-Z0-9\<\>\/\:\n\r\t\! ]*)<\/w:r>/', $xml, $result);

foreach($result[3] as $headlines) {
  print $headlines."<br />";
}

Hiver alle overskrifter ud, som starter med <w:(r eller p)Style w:val="Heading1(Char eller blank)"/> frem til </w:r>

Desværre hiver den også alle <koder> med, frem til overskriften - hvordan undgår jeg det?

Men læg mærke til at jeg kun trækker bestemte symboler ud, f.eks. hvis brugeren laver en overskrift med $ eller % eller lign., så vil overskriften ikke blive trukket ud - hvordan kan jeg sørge for at det er ALLE overskrifter, lige meget hvilket symbol man bruger?

Mange spørgsmål ;) Håber nogen er frisk på at besvare.

Skrevet lør. d. 29. august 2009 kl. 23:51:23| #1

arne_v
arne_v (1.005.618 point)
Jeg tror ikke på regex som løsning til dit problem.

Parse filen som XML. Det vil give langt bedre kontrol over hvad du får ud.

Skrevet søn. d. 30. august 2009 kl. 01:57:57| #2

thewizard
thewizard (11.195 point)
How? :). Jeg er newbie med XML - det er ikke lige mit område :).

Skrevet søn. d. 30. august 2009 kl. 02:24:20| #3

thewizard
thewizard (11.195 point)
http://dk2.php.net/ (...) - Noget ala det du mener? Ville sættes pris, hvis du kunne give et peg, behøver ikke være kode - Jeg er ikke bange for at læse tutorials.

Skrevet søn. d. 30. august 2009 kl. 23:51:48| #4


Skrevet man. d. 31. august 2009 kl. 11:34:20| #5

thewizard
thewizard (11.195 point)
Okay arne, bare læg et svar, så kigger jeg på det senere. ;)

Skrevet man. d. 31. august 2009 kl. 14:47:21| #6


Skriv et indlæg




Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] [img]link til billede[/img]
Web- og emailadresser omdannes automatisk til links

Log ind

   

   

Seneste spørgsmål

HTTP Post XML og modtag svar

Oprettet den 10. februar 2012 kl. 17.55
mrkaynex giver 200 point for svar | Giv et svar »

Inspion Economy søger en dygtig programmør, som kan...

Oprettet den 10. februar 2012 kl. 16.09
Kathja giver 15 point for svar | Giv et svar »

Isolere specifik kode.

Oprettet den 10. februar 2012 kl. 13.16
mhaahr2 giver 200 point for svar | Giv et svar »

Seneste guides

Installer win 7
Den gode bruger


   




Tips & Tricks fra PC World

Teaser billede

Her er fem sjove danske websider du skal kende

Trænger dine lattermuskler til en omgang fitness på dansk? Vi viser vej til fem websider fyldt med humor og vanvittig satire.


Anmeldelser fra PC World

Teaser billede

Test: Denne super-tablet er iPads hårdeste konkurrent

Eee Pad Transformer Prime er frygtindgydende med sin quadcore processor og evne til at trylle sig om til bærbar. Apple bør kigge i bagspejlet, for Asus' tablet-pc kommer buldrende - og gør det...


Seneste blogindlæg

Teaser billede

Tvangslukke spørgsmål: Hvad er den bedste løsning?

Hej Vi har mange åbne spørgsmål på Eksperten. Vi ville gerne tvangslukke dem - så et spørgsmål efter f.eks. 6 måneder lukkes. Men der er et par uklarheder som ville være gode at få lidt input til:...


Nyheder fra PC World

Teaser billede

Nu kan du snart hente Windows 8

Den nye offentlige betaversion af Windows 8 er klar i denne måned.


Nyheder fra Computerworld

Teaser billede

Måske snart slut med Androids helt store problem

Android-platformen har længe været plaget af et særligt problem. Men måske er problemet nu ved at være elimineret.


Kurser
Samarbejdspartnere

Udgiver · © 2012 IDG Danmark A/S · Hørkær 18 · 2730 Herlev · Tlf.: 77 300 300 · Fax: 77 300 301 · Brug af personoplysninger