Feed43 : transformez des pages web en flux RSS


Connaissez-vous Feed43 (« feed for free » : flux gratuits) ?

De plus en plus de sites diffusent leurs nouveautés en flux RSS. Mais comment faire si l’on veut surveiller les mises à jour de sites qui n’en sont pas équipés ? C’est là que des outils tels que Feed43 sont utiles pour transformer des contenus web (HTML ou XML) en flux RSS grâce à l’analyse de motifs de texte (patterns) récurrents qui permettent d’identifier une ligne de titre, un résumé et un lien par exemple et de les afficher selon un modèle (template) personnalisable.

Cette technique qui n’est pas nouvelle est aussi appelée « HTML scrapping ». Elle utilise un robot qui collecte les contenus web et les analyse en fonction des expressions régulières simplifiées définies par l’utilisateur.

La mise en oeuvre de Feed43 est gratuite et assez rapide dès que l’on a compris la façon de formuler la structure des motifs (patterns) à rechercher et que l’on comprend l’anglais technique 😉

> RDV sur www.feed43.com