marketing internet google engines engine definicion alternative search-engine

search engine - internet - ¿Hay un motor de búsqueda que soporte la búsqueda de expresiones regulares?



search engines list (5)

Primero, verifiqué esta question pero la answer refiere a un servicio obsoleto.

Entonces, ¿hay algún sitio web (o software, no me importa) que ofrezca búsquedas en contenido de Internet con expresiones regulares?


Aunque es poco probable que encuentre un sitio que utilice la búsqueda completa de expresiones regulares, Google tiene alguna capacidad para hacer coincidencias. Dependiendo de lo que estés tratando de lograr, esto podría ser suficiente.

GoogleGuide parece ser bastante profundo con algunas de las opciones disponibles. Quizás si da un ejemplo del tipo de consulta que desea buscar, ¿podemos encontrar una solución?


Dayyan es correcto, son índices inversos que hacen que los motores de búsqueda sean rápidos; no hay manera de acelerar la búsqueda de expresiones regulares en un petabyte de contenido si solo tiene 100 terabytes de disco flash. Búsquedas de palabras clave, índice inverso, no hay problema.

La web grep de blekko (https://blekko.com/ws/+/webgrep) admite expresiones regulares, pero la mayoría de las búsquedas que obtenemos son para cadenas constantes, generalmente las que se encuentran en el HTML, porque eso es lo interesante: quién usa microformatos ? ¿Quién usa varias bibliotecas javascript? ¿Quién usa varios sistemas de comentarios? Etcétera.

Si nos envía una expresión regular, estaremos encantados de ejecutarla por usted.

La ejecución de estas búsquedas consiste en un trabajo de MapReduce que se ejecuta en todo el código HTML de nuestro rastreo. Es por eso que toma un tiempo (uno o dos días) obtener una respuesta.


No hay una búsqueda instantánea por motor de expresiones regulares. Esto es probable debido a cómo se indexan las páginas. Permitir que uno grep la web tomaría una gran cantidad de potencia computacional.


Permítame escribir aquí una respuesta de la question superuser.com debido a mi completa solidaridad con el autor:

cita del Ask Metafilter :

La única forma posible de hacer que la búsqueda de palabras clave sea más eficiente en cientos de terabytes (o cualquiera que sea su índice hasta estos días) es calcular previamente un índice de palabras.

De hecho, un motor completo de expresiones regulares está completo, y puede escribir expresiones regulares arbitrarias que engullirán cerca de cantidades infinitas de tiempo de CPU y memoria. Por todas estas razones, sería una locura técnica para ellos ofrecer búsquedas de expresiones regulares al público en general.

Actualización: como se señaló, regexp no es Turing Complete. Estén atentos para la respuesta más detallada:

TBD ...