Oprettet man. d. 20. juli 2009 kl. 16:49:07

hkb-x
hkb-x (16.012 point. Point ude: 2.892)


HTTP request data til unicode i python

HTTP requests encoder unicode efter tabellem beskrevet her: http://jrgraphix.net/research/unicode_blocks.php?block=1 hvilket vil sige at æ representeres ved %E6 og å ved %E5 osv. Jeg vil gerne kunne konverteres sådanne ASCII strenge til unicode i python men hvordan gør jeg. Jeg kan ikke finde nogle python libs der kan oversætte fra den encoding hvilket jeg finder meget mærkeligt.

Skrevet man. d. 20. juli 2009 kl. 17:08:06| #1

Ikke helt som du beskriver. Hvis siden du kommer fra har tegnsæt iso8859-1, så kommer det som %E6 osv. Det har ikke noget med unicode at gøre. Hvis siden har tegnsæt utf-8 så kommer æ som %C3%A6

Ikke fordi det løser dit problem, selvfølgelig.

Skrevet man. d. 20. juli 2009 kl. 17:11:52| #2


Skrevet man. d. 20. juli 2009 kl. 17:34:16| #3

hkb-x
hkb-x (16.012 point)
Yes jeg fik løst det med urllib.unquote()  men den oversætter ret fuceked til unicode. tegn som er i ASCII bliver decodet til byteværdier langt over 1000 istedet for < 128 som de burde så nu kan jeg få input ind men kan så bare ikke vise det?!?

Skrevet man. d. 20. juli 2009 kl. 17:42:17| #4

hkb-x
hkb-x (16.012 point)
ahh, det er æøå den tyrer helt der op. det giver jo ingen mening

Skrevet man. d. 20. juli 2009 kl. 17:42:35| #5

hkb-x
hkb-x (16.012 point)
de burde jo ligge under 255

Skrevet man. d. 20. juli 2009 kl. 17:49:24| #6

hkb-x
hkb-x (16.012 point)
fandt løsningen. Den streng der bliver returneret af urllib indeholder bytes med en værdi over 128 mens dens encoding er ASCII. AV!

men det kan løses således:

urllib.unquote_plus(HTTP_VAR).decode('raw_unicode_escape')

hvor HTTP_VAR er den HTTP encodede variabel/input

Skrevet man. d. 20. juli 2009 kl. 18:37:39| #7

arne_v
arne_v (1.077.724 point)
Er det sådan et princip du har at bruge de forslag du får og selv tage point ??

Skriv et indlæg




Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] [img]link til billede[/img]
Web- og emailadresser omdannes automatisk til links

Log ind

   


Seneste spørgsmål

PowerShell script til integration af Teamviewer i Active...

Oprettet den 6. november 2014 kl. 13.10
john2010 giver 200 point for svar | Giv et svar »

Wordpress RokGallery Access denied for use

Oprettet den 5. november 2014 kl. 02.25
optur giver 60 point for svar | Giv et svar »

Wordpress Child theme - Twenty Ten - Sub menu indicator

Oprettet den 5. november 2014 kl. 01.25
optur giver 60 point for svar | Giv et svar »

Seneste guides

Malwarebytes version 2.0.3.1025
Find ejeren af et vilkårligt domæne
Undgå reklamerne på iPad





Computerworld

Teaser billede

Nu er det slut med Java til NemID: Her er den nye løsning

Om få dage er det helt slut med at benytte Java til NemID. Læs her, hvad der kommer til at erstatte Java-appletten.

Comon

Teaser billede

Fire lette trin: Få hastigheden tilbage i din iPhone eller iPad

Apples iOS 7 har masser af fine funktioner, men styresystemet har desværre også den uheldige sideeffekt, at det gør ældre iPhones og iPads sløve. Se her, hvordan du løser problemerne.

Channelworld

Teaser billede

Nye momsregler rammer danske it-forhandlere: Derfor bliver det noget værre bøvl

Der er ingen bagatelgrænser i de nye regler, som skal forebygge momskarruseller. En dansk it-forhandler, der sælger 50 pc'er om året, har nu fået besked på at rette ind.

White paper

Teaser billede

IP-telefoni: Fra buzz-ord til business

Firmaets telefonsystem er i dag en opgave for it-chefen. Denne Computerworld Guide om IP-telefoni giver også råd om unified communications.



Udgiver · © 2014 Computerworld A/S · Hørkær 18 · 2730 Herlev · Tlf.: 77 300 300 · Fax: 77 300 301 · Brug af personoplysninger