Technologie - 🤖Français · 2 years ago

Creer des flux rss avec FreshRss et XPath

8

6

Creer des flux rss avec FreshRss et XPath

Technologie - 🤖Français · 2 years ago

8

Bonjour à tous,

Depuis la dernière mise à jour de FreshRss, il est possible de faire du scrapping de site web avec xpath afin de créer des flux rss pour les sites qui n’en n’ont pas.

Plus de détail ici : https://danq.me/2022/09/27/freshrss-xpath/

J’ai mis en place ce principe pour récupérer des infos sur le site de la mairie et celui de la com’com.

Je bloque sur un troisième, le site de l’office de tourisme (pour récupérer l’agenda culturel). J’aurais besoin d’aide afin de m’en dépatouiller. Je ne sais pas si je suis au bon endroit. Mais si vous savez vers quelle communauté je pourrais me tourner pour résoudre ce soucis, n’hésitez pas à me le dire.

Un peu de contexte.

Lors de son chargement, le site de l’office de tourisme charge dans un premier temps le html, mais sans les événements de l’agenda. Ces événements sont présents sur la page, mais dans une balise script sous forme d’un json stocké dans une variable item.

Une autre requête POST est ensuite effectuée avec en paramètre ce json pour le mettre en forme (html) puis l’insérer dans le corps de la page.

À partir de là, le scrapping se complexifie, auriez-vous une idée de comment récupérer ce json pour le transformer en quelque chose qui ressemblerais à un flux atom/rss/json ?

Je pensais faire un script bash, mais je suis un peu perdu avec xmlint, xisdel et jq.

C’est peu être un peu ambitieux, qu’en pensez-vous ?

Chat

ObercailOP
link
fedilink
Français
arrow-up
3·
2 years ago
Merci quand même ^^, j’essaie de trouver une autre source pour essayer de contourner le problème, mais c’est quand même dommage, toute les infos sont déjà regroupées au même endroit, il me manque juste un bon vieux flux rss (ca aurait été le top)

Technologie - 🤖

You are not logged in. However you can subscribe from another Fediverse account, for example Lemmy or Mastodon. To do this, paste the following into the search field of your instance: !technologie@jlai.lu

Ici concerne le champs de domaine large de la technologie : actualités sur l’informatique, partage de programme informatique et de code, montrer vos projets Arduino, ect.

Le pass BnF pour accéder à la presse : https://jlai.lu/post/4214444
https://archive.is/ pour accéder aux articles avec paywalls
!tipiak@anarchist.nexus pour les ISOs d’Ubuntu

Visibility: Public

This community can be federated to other instances and be posted/commented in by their users.

2 users / day
68 users / week
100 users / month
419 users / 6 months
386 local subscribers
1.1K subscribers
1.42K Posts
4.42K Comments
Modlog