how - install beautifulsoup python 3
Intenta usar bs4 para omitir un atributo si no hay datos (1)
En cuanto a los documentos BS4 , parece que "lxml" es en realidad un analizador HTML. Debería reemplazarlo por "lxml-xml", ya que está tratando de borrar una página XML. Eso debería estar funcionando.
Intento escribir un programa que obtenga datos de una URL y los formatee para que pueda copiarlos en otro programa. Tengo todo funcionando, excepto que no puedo evitar que se salte un elemento si no hay img src en la etiqueta de imagelink.
import requests, sys, webbrowser, bs4
res = requests.get(''http://hzws.selco.info/prototype.php?type=new-arrivals&lib=nor&collect=Bnewnf,Bnewmys,Bnewf,Bnewsf&days=14&key=7a8adfa9aydfa999997af'')
res.raise_for_status()
soup = bs4.BeautifulSoup(res.text, "lxml")
img = soup.select(''imagelink'') #why won''t this pull anything?!?!?!?!
link = soup.select(''cataloglink'')
length = min([14, len(img)])
for i in range(length):
img1 = img[i].getText()
link1 = link[i].getText()
print(''<div>'' + link1 + img1 + ''</a></div>'')
En este momento esto imprime todas las URL independientemente de si hay un enlace de imagen asociado o no. He intentado varias cosas diferentes para evitar que se salte un elemento si no hay img src. ¿Algunas ideas?