Oprettet man. d. 20. juli 2009 kl. 16:49:07

hkb-x
hkb-x (15.862 point. Point ude: 2.892)


HTTP request data til unicode i python

HTTP requests encoder unicode efter tabellem beskrevet her: http://jrgraphix.net/research/unicode_blocks.php?block=1 hvilket vil sige at æ representeres ved %E6 og å ved %E5 osv. Jeg vil gerne kunne konverteres sådanne ASCII strenge til unicode i python men hvordan gør jeg. Jeg kan ikke finde nogle python libs der kan oversætte fra den encoding hvilket jeg finder meget mærkeligt.

Skrevet man. d. 20. juli 2009 kl. 17:08:06| #1

Ikke helt som du beskriver. Hvis siden du kommer fra har tegnsæt iso8859-1, så kommer det som %E6 osv. Det har ikke noget med unicode at gøre. Hvis siden har tegnsæt utf-8 så kommer æ som %C3%A6

Ikke fordi det løser dit problem, selvfølgelig.

Skrevet man. d. 20. juli 2009 kl. 17:11:52| #2


Skrevet man. d. 20. juli 2009 kl. 17:34:16| #3

hkb-x
hkb-x (15.862 point)
Yes jeg fik løst det med urllib.unquote()  men den oversætter ret fuceked til unicode. tegn som er i ASCII bliver decodet til byteværdier langt over 1000 istedet for < 128 som de burde så nu kan jeg få input ind men kan så bare ikke vise det?!?

Skrevet man. d. 20. juli 2009 kl. 17:42:17| #4

hkb-x
hkb-x (15.862 point)
ahh, det er æøå den tyrer helt der op. det giver jo ingen mening

Skrevet man. d. 20. juli 2009 kl. 17:42:35| #5

hkb-x
hkb-x (15.862 point)
de burde jo ligge under 255

Skrevet man. d. 20. juli 2009 kl. 17:49:24| #6

hkb-x
hkb-x (15.862 point)
fandt løsningen. Den streng der bliver returneret af urllib indeholder bytes med en værdi over 128 mens dens encoding er ASCII. AV!

men det kan løses således:

urllib.unquote_plus(HTTP_VAR).decode('raw_unicode_escape')

hvor HTTP_VAR er den HTTP encodede variabel/input

Skrevet man. d. 20. juli 2009 kl. 18:37:39| #7

arne_v
arne_v (1.076.594 point)
Er det sådan et princip du har at bruge de forslag du får og selv tage point ??

Skriv et indlæg




Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] [img]link til billede[/img]
Web- og emailadresser omdannes automatisk til links

Log ind

   


Seneste spørgsmål

Prolog stabilt forhold :)

Oprettet den 24. oktober 2014 kl. 20.07
mjdigital giver 60 point for svar | Giv et svar »

uddannelse webudvikler modulrækkefølge?

Oprettet den 19. oktober 2014 kl. 13.48
tobi17 giver 30 point for svar | Giv et svar »

Kontakt form mail

Oprettet den 16. oktober 2014 kl. 04.27
aldin-dk giver 15 point for svar | Giv et svar »

Seneste guides

Find ejeren af et vilkårligt domæne
Undgå reklamerne på iPad
Opret BOOTBAR USB pen ...





Computerworld

Teaser billede

Android L: Disse telefoner får den nye version af Android

Den nyeste version af Android, Android Lollipop, er blevet præsenteret og er nu kommet ud i prøveversion til nogle enkelte enheder, men hvilke smartphones vil rent faktisk få det nye system?

CIO

Teaser billede

Microsoft: Adgang til Windows 10 vil kræve flere koder

I et forsøg på at appellere til de sikkerheds-bekymrede it-chefer indbygger Microsoft to-faktor-autentifikation direkte i Windows 10, som vil kræve to koder at få adgang til. Også en række andre...

Comon

Teaser billede

Test: Mini-computer fra Gigabyte har overraskende meget kraft

Gigabyte's Brix Pro (GB-BXi7-4770R) har overraskende meget kraft i så lille et chassis, men størrelsen giver også problemer.

Channelworld

Teaser billede

Printbranchen er ved at save benene af sig selv

Stenhård priskonkurrence undergraver den traditionelle forretningsmodel for salg af print-og kopimaskiner.

White paper

Teaser billede

Bliv værdistyret og fokusér på vigtigste

Seks nøglekoncepter lærer dig at fokusere på, hvad der har størst værdi for dine kunder og for de markeder, din virksomhed betjener.



Udgiver · © 2014 Computerworld A/S · Hørkær 18 · 2730 Herlev · Tlf.: 77 300 300 · Fax: 77 300 301 · Brug af personoplysninger