span selectors item extractfirst example drop python scrapy scrapy-shell

selectors - python convierte caracteres chinos en url



selectors scrapy (1)

Tengo una url como

href = "../ job / jobarea.asp? C_jobtype = 經營 管理 people y peoplenumber = 151" ,

esto se muestra en el elemento de inspección. Pero cuando se abre en una nueva pestaña, se muestra como

../job/jobarea.asp?C_jobtype=%B8g%C0%E7%BA%DE%B2z%A5D%BA%DE&peoplenumber=151

¿Cómo sé qué tipo de codificación usa el navegador para convertirla? Cuando trato de hacer scrapy, se muestra algún otro formato y se detiene como 500 error interno del servidor. ¿Podrías por favor explicarme?


Es tradicional chino, así que prueba cp950

#-*-coding:utf8 -*- import urllib s = ''經營管理主管''.decode(''utf-8'').encode(''cp950'') print urllib.quote(s) q =''%B8g%C0%E7%BA%DE%B2z%A5D%BA%DE'' print urllib.unquote(q).decode(''cp950'').encode(''utf-8'')

Resultado

%B8g%C0%E7%BA%DE%B2z%A5D%BA%DE 經營管理主管