Oprettet tir. d. 03. marts 2009 kl. 17:48:13

kongfjong
kongfjong (6.585 point. Point ude: 360)

Mailheaders og specielle tegn

Hej, jeg roder lidt med mail-funktionaliteten i PHP. Jeg har bygget en klasse op, der kan sende multipart-mails, med boundary-strenge osv, men jeg undrer mig lidt over hvordan den opfører sig og viser tegn som æ, ø og å.

Jeg troede det var nok at sætte denne header Content-Type: text/html; charset="utf-8", når den data jeg hev ud fra db var netop UTF-8 format, og resten af teksten var hard-coded.

Men jeg var nødt til at sætte en klassisk html-header på også, som denne <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/ (...) xmlns="http://www.w3.org/ (...) xml:lang="en"><head><meta http-equiv="Content-Type" content="text/html; UTF-8" /></head>. Det overrasker mig naturligvis ikke med doctype osv. men mere at det skal "forklares" to gange til serveren at det er UTF-8 encoded data der sendes med i mailen.

Det sjove er, at tegn som bliver hardcoded, såvel æ, ø som å, vises korrekt i mailen, mens data der trækkes ud fra db'en, skal wrappes ind i htmlentities() med standard charset, altså ISO-8859-1, før de vises korrekt, på trods af at der altså er angivet UTF-8 to stedet i mailen.

Mail opbygningen ser således ud:

This is a multi-part message in MIME format. --==Multipart_Boundary_x002d71ae34b437bb29c76adee341e700x Content-Type: text/plain; charset="utf-8" Content-Transfer-Encoding: 7bit

<Plain Text>

--==Multipart_Boundary_x002d71ae34b437bb29c76adee341e700x Content-Type: text/html; charset="utf-8" Content-Transfer-Encoding: 7bit

<HTML'en>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/ (...) xmlns="http://www.w3.org/ (...) xml:lang="en"><head><meta http-equiv="Content-Type" content="text/html; UTF-8" /></head><body>
text osv
</body>

--==Multipart_Boundary_x002d71ae34b437bb29c76adee341e700x--
<br />Headers: Date: Tue, 3 Mar 2009 17:29:40 +0100
From: Navn<mail@domain.dk>

Headers: Date: Tue, 3 Mar 2009 17:29:40 +0100
From: <FRA>
MIME-Version: 1.0 Content-Type: multipart/alternative; boundary="==Multipart_Boundary_x002d71ae34b437bb29c76adee341e700x"

Kan nogen forklare mig, hvorfor i alverden det skal være sådan, og hvad der kan laves anderledes med henblik på f.eks. optimering?

Skrevet tir. d. 03. marts 2009 kl. 20:01:28| #1

andreas13_fam
andreas13_fam (3.790 point)
jeg ved ikke hvor meget det betyder når det er hardcode men har du også gemt filen i UTF-8, (nok uden BOM, da du har en PHP headder).

Skrevet tir. d. 03. marts 2009 kl. 20:23:14| #2

kongfjong
kongfjong (6.585 point)
Jeps, det har jeg :)

Skrevet tir. d. 03. marts 2009 kl. 20:24:30| #3

kongfjong
kongfjong (6.585 point)
Måske du hurtigt kan svare mig på, om der findes et program, eller en måde, hvorpå man kan se om en fil er gemt i ASCII, UTF-8 eller anden encoding, ud over at man selvfølgelig gør det i sin editor:)

Skrevet ons. d. 04. marts 2009 kl. 03:36:05| #4

arne_v
arne_v (1.005.623 point)
Egentligt ikke.

De samme N bytes kan nemlig være valide i flere forskellige encodings, men med forskelligt indhold.

Gem nogle kendte relevant tegn (f.eks. ÆØÅæøå) og kig på hex dump.

Men du skal have kendte tegn for at du kan sige det med sikkerhed.

Så er det muligt at lave et 95% sikkert gæt på ISO-8859-1 versus UTF-8 udfra fordelingen af byte værdier.

Jeg kan sikkert finde noget kode, hvis det er relevant.

Skrevet lør. d. 11. april 2009 kl. 16:20:14| #5

kongfjong
kongfjong (6.585 point)
Lig et svar arne;)

Skrevet lør. d. 11. april 2009 kl. 18:03:52| #6

arne_v
arne_v (1.005.623 point)
kommer her

Skriv et indlæg




Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] [img]link til billede[/img]
Web- og emailadresser omdannes automatisk til links

Log ind

   

   

Seneste spørgsmål

Ville ikke tildele at upload det til database eller komme...

Oprettet den 10. februar 2012 kl. 21.23
tobrukDk giver 15 point for svar | Giv et svar »

HTTP Post XML og modtag svar

Oprettet den 10. februar 2012 kl. 17.55
mrkaynex giver 200 point for svar | Giv et svar »

Inspion Economy søger en dygtig programmør, som kan...

Oprettet den 10. februar 2012 kl. 16.09
Kathja giver 15 point for svar | Giv et svar »

Seneste guides

Installer win 7
Den gode bruger


   




Tips & Tricks fra PC World

Teaser billede

Her er fem sjove danske websider du skal kende

Trænger dine lattermuskler til en omgang fitness på dansk? Vi viser vej til fem websider fyldt med humor og vanvittig satire.


Anmeldelser fra PC World

Teaser billede

Test: Denne super-tablet er iPads hårdeste konkurrent

Eee Pad Transformer Prime er frygtindgydende med sin quadcore processor og evne til at trylle sig om til bærbar. Apple bør kigge i bagspejlet, for Asus' tablet-pc kommer buldrende - og gør det...


Seneste blogindlæg

Teaser billede

Tvangslukke spørgsmål: Hvad er den bedste løsning?

Hej Vi har mange åbne spørgsmål på Eksperten. Vi ville gerne tvangslukke dem - så et spørgsmål efter f.eks. 6 måneder lukkes. Men der er et par uklarheder som ville være gode at få lidt input til:...


Nyheder fra PC World

Teaser billede

Nu kan du snart hente Windows 8

Den nye offentlige betaversion af Windows 8 er klar i denne måned.


Nyheder fra Computerworld

Teaser billede

Måske snart slut med Androids helt store problem

Android-platformen har længe været plaget af et særligt problem. Men måske er problemet nu ved at være elimineret.


Kurser
Samarbejdspartnere

Udgiver · © 2012 IDG Danmark A/S · Hørkær 18 · 2730 Herlev · Tlf.: 77 300 300 · Fax: 77 300 301 · Brug af personoplysninger