tag: parsing

Al parsear un RSS aparece una imagen "aggbug"

Algunos motores de RSS agregan al final de cada entrada una imagen de 1x1 de color transparente. Para qué? Sucede que los lectores RSS tradicionales ( realmente todos los que conozco ) No soportan Javascript, es decir no ejecutan ninguno de los scripts de la página, y resulta que estos script son utilizados en ocasiones para medir las visitas de la página y otros datos relevantes. Así que no hay muchos mecanismos de medición válidos para determinar cuando una entrada de un feed RSS ha sido visitada, menos aún cuando muchas entradas pueden aparecer en un solo request al RSS. Una forma…

leer más...

Cómo extraer información de un tag HTML con Regex? | C#

El contenido expuesto en Html es una increíble fuente de información para las aplicaciones modernas, en muchas ocasiones necesitamos extraer información de un tag en particular, en este artículo aprenderemos a hacerlo particularmente centrándonos en el tag <img>. Las expresiones regulares son una herramienta muy poderosa, aunque críptica, que podemos utilizar para simplificar esta titánica tarea. He implementado este método el cual extrae la lista de urls de las imágenes contenidas en los tag <img> de una cadena con contenido HTML. Pensemos en la expresión regular. Necesitamos hallar una cadena de texto que inicie con "<…

leer más...