google search - programacion - ¿Enlace "real" al archivo en los resultados de búsqueda de Google?
manual de programacion android pdf (10)
A partir de un comment en la respuesta de @Blender, aprendí cómo instalar un script de usuario en Firefox y Chrome.
Ahora, al hacer clic derecho y copiar una URL en los resultados de búsqueda de Google, obtengo el enlace real en lugar de esa basura (lo siento, Google, sé que nos amas, pero no necesitamos ninguna URL de rastreo apestosa) .
Al principio, utilicé googlePrivacy como lo sugirió @naxa, pero está molestando hoy en día. La secuencia de comandos proporcionada en las aplicaciones web SE, desactivando los resultados de búsqueda de Google indirectamente , hace el trabajo. Tiene sabores de User Script and Extension:
- chrome.google.com/webstore/detail/dont-track-me-google/… en Chrome Web Store.
- "No me sigas Google" en Userscripts.org
A continuación la información sobre cómo proceder con el script de usuario.
Instalando el UserScript
En Chrome, lo instalé usando Tampermonkey .
Y Greasemonkey en Firefox.
Resultados
Antes del UserScript
Después
Publicación relacionada en aplicaciones web:
A menudo busco documentos (principalmente PDF) usando Google. Pero cuando hago clic derecho en el enlace, o simplemente cuelgo el cursor del mouse sobre él. Lo que obtengo NO es el vínculo real, pero algo largo y confuso como el siguiente:
http://www.google.com/url?sa=t&source=web&cd=1&ved=0CCUQFjAA&url=http%3A%2F%2Fwww.marxists.org%2Freference%2Farchive%2Feinstein%2Fworks%2F1910s%2Frelative%2Frelativity.pdf&ei=Fai1TZq-Acugtgenw6DqDg&usg=AFQjCNFzYOTqpf68rQnuwW9K7wp39WL6Rg&sig2=z4RqvOLEEJsPohBqr1ghxQ
No tengo idea de qué es esto, pero sé que estas tonterías no son lo que quiero, quiero el enlace real (para el anterior: http://www.marxists.org/reference/archive/einstein/works/1910s/relative/relativity.pdf
), no algo con la intervención de Google.
¿Cómo obtengo el enlace "Real" para archivar en los resultados de búsqueda de Google?
Creé un sitio web simple que limpia las URL de resultados de búsqueda de Google:
URL Clean
Las URL copiadas de los resultados de búsqueda de Google (como los enlaces a archivos PDF) son más complicadas de lo que deben ser. Esta herramienta elimina las partes innecesarias, dejando la URL original de la página.
Creo que leí una vez, aunque con la misma frustración, que enmascara las URLs SÓLO cuando inicias sesión en tu cuenta de Google y la configuración de tus cuentas está configurada para el seguimiento del historial web.
Si mi memoria me sirve correctamente, podría intentar: - realizar la búsqueda en otra ventana del navegador utilizando la función de navegación "privada" o "incógnita" nativa de su navegador - simplemente cierre sesión en su cuenta de google, obtenga sus resultados y vuelva a iniciar sesión - vaya a google.com/history y haga clic en "Pausa", que evita que se guarde actividad futura en la web, y luego regrese a la misma página luego de obtener los resultados y haga clic en "Reanudar" (si tiene la intención de utilizar el Historial web).
Si este tipo de actividad es algo en lo que rutinariamente querría tomar múltiples URL de los resultados y la técnica anterior no funciona como lo recuerdo, puede probar algo así como un complemento para Firefox, como Copy Link URL, que proporciona la capacidad de copiar las URL de los enlaces que seleccione, que luego puede pegar en un editor de texto y reemplazar los elementos codificados con Buscar y reemplazar.
O bien, podría hacer un poco de investigación para encontrar un sitio web que decodifique la URL por usted. Encontré URL Deobfuscator en webtoolhub.com que hace un buen trabajo al hacer que la URL principal / deseada esté disponible para copiar / pegar decodificando los caracteres codificados, eliminando cadenas de consulta, etc.
Aclamaciones.
Cuando busco esta búsqueda en Internet Explorer obtengo este enlace
Pero cuando uso Chrome, obtengo lo que quieres. Por lo tanto, parece ser una característica de IE, o al menos tener algo que ver con el navegador que está utilizando. Si está en posición de cambiar navegadores, consideraría usar Chrome (probado, da URL normal) u opera (probado, URL normal) pero no Firefox (probado, muestra la URL de funky)
Estoy usando una extensión de Firefox llamada corrección de enlace de búsqueda Google / Yandex , funciona muy bien y permite la copia directa del enlace objetivo
La URL está aquí:
&url=http%3A%2F%2Fwww.marxists.org%2Freference%2Farchive%2Feinstein%2Fworks%2F1910s%2Frelative%2Frelativity.pdf
Solo descárgalo con un poco de lenguaje, como Python:
>>> import urllib
>>> print urllib.unquote(''http%3A%2F%2Fwww.marxists.org%2Freference%2Farchive%2Feinstein%2Fworks%2F1910s%2Frelative%2Frelativity.pdf'')
http://www.marxists.org/reference/archive/einstein/works/1910s/relative/relativity.pdf
Entonces, para extraer la URL de una url de Google, aquí hay una secuencia de comandos para hacerlo:
import urllib
url = raw_input(''What is the Google url? '')
url = url[url.find(''&url='') + 5:]
url = url[:url.find(''&'')]
print urllib.unquote(url)
Realizando una pequeña búsqueda en Google y encontré el complemento de Firefox llamado LinkWalker .
La utilidad de menú contextual simple para los enlaces que descodifica las URL incrustadas y ocultas, quita los parámetros de la cadena de consulta y convierte las selecciones de texto en enlaces clicables.
Suena como que podría hacer el truco.
Tal vez esta no sea la mejor solución, pero esta es una manera que no requiere codificación o complementos para Chrome y Firefox. Supongamos que hay formas similares de hacer esto para IE y otros, aunque al menos IE por lo general abre archivos PDF en el navegador con el enlace en la barra de direcciones en la parte superior, que es lo suficientemente fácil de copiar.
Haga clic en el resultado de la búsqueda, que debe descargar el PDF.
Ahora en su navegador abra la lista de descargas recientes
- Chrome, Ctrl + J
- Firefox en Linux (?), Es Ctrl + Shift + Y
Ahora copia el enlace
- Chrome: haga clic con el botón derecho en la URL que figura debajo del nombre del archivo y seleccione "Copiar dirección de enlace"
- Firefox: haz clic con el botón derecho en el archivo y selecciona "Copiar enlace de descarga"
Ver esta herramienta
http://www.duvidasdeinformatica.com/blog/limpar-links-paginas-resultados-google/
Está en portugués, pero en la parte inferior tienes una caja donde puedes copiar / pegar la url, y se "convierte" a la real ...
es un enlace largo porque Google quiere hacer un seguimiento de quién encontró qué, y de hecho hizo clic en un resultado de búsqueda ...
si quieres el enlace real (¡lo anterior también es un enlace real!)
escribe esto en tu prompt linkx:
php -r "print urldecode(''http://www.google.com/url?sa=t&source=web&cd=1&ved=0CCUQFjAA&url=http%3A%2F%2Fwww.marxists.org%2Freference%2Farchive%2Feinstein%2Fworks%2F1910s%2Frelative%2Frelativity.pdf&ei=Fai1TZq-Acugtgenw6DqDg&usg=AFQjCNFzYOTqpf68rQnuwW9K7wp39WL6Rg&sig2=z4RqvOLEEJsPohBqr1ghxQ'');" | awk -F''&'' ''/url=/{ print $5 }''