usuario useragent que google chrome agente r web-scraping rvest

useragent - ¿Cuál es mi agente de usuario cuando analizo el sitio web con el paquete de rvest en R?



user agent que es (2)

Usé https://httpbin.org/user-agent para descubrir:

library(rvest) se <- html_session( "https://httpbin.org/user-agent" ) se$response$request$options$useragent

Responder:

[1] "libcurl/7.37.1 r-curl/0.9.1 httr/1.0.0"

Vea este informe de error para una forma de anularlo.

Dado que es fácil en R, estoy usando el paquete rvest para analizar HTML para extraer información del sitio web.

Me pregunto cuál es mi User-Agent (si hay alguno) durante la solicitud, ya que User-Agent está asignado al navegador de Internet o hay alguna forma de configurarlo de alguna manera?

Mi código que abre sesión y extrae información de HTML está a continuación:

library(rvest) se <- html_session( "http://www.wp.pl" ) %>% html_nodes("[data-st-area=Glonews-mozaika] li:nth-child(7) a") %>% html_attr( name = "href" )


Encontré esto en algún lugar de un tutorial, parece una forma más fácil y rápida de hacerlo:

uastring <- "Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2228.0 Safari/537.36" session <- html_session("https://www.linkedin.com/job/", user_agent(uastring))