Technologie - 🤖Français · 2 years ago

Creer des flux rss avec FreshRss et XPath

8

6

Creer des flux rss avec FreshRss et XPath

Technologie - 🤖Français · 2 years ago

8

Bonjour à tous,

Depuis la dernière mise à jour de FreshRss, il est possible de faire du scrapping de site web avec xpath afin de créer des flux rss pour les sites qui n’en n’ont pas.

Plus de détail ici : https://danq.me/2022/09/27/freshrss-xpath/

J’ai mis en place ce principe pour récupérer des infos sur le site de la mairie et celui de la com’com.

Je bloque sur un troisième, le site de l’office de tourisme (pour récupérer l’agenda culturel). J’aurais besoin d’aide afin de m’en dépatouiller. Je ne sais pas si je suis au bon endroit. Mais si vous savez vers quelle communauté je pourrais me tourner pour résoudre ce soucis, n’hésitez pas à me le dire.

Un peu de contexte.

Lors de son chargement, le site de l’office de tourisme charge dans un premier temps le html, mais sans les événements de l’agenda. Ces événements sont présents sur la page, mais dans une balise script sous forme d’un json stocké dans une variable item.

Une autre requête POST est ensuite effectuée avec en paramètre ce json pour le mettre en forme (html) puis l’insérer dans le corps de la page.

À partir de là, le scrapping se complexifie, auriez-vous une idée de comment récupérer ce json pour le transformer en quelque chose qui ressemblerais à un flux atom/rss/json ?

Je pensais faire un script bash, mais je suis un peu perdu avec xmlint, xisdel et jq.

C’est peu être un peu ambitieux, qu’en pensez-vous ?

Chat

Sushouane
link
fedilink
Français
arrow-up
3·
2 years ago
Si c’est bien ce que tu décris, c’est juste teubé je pense, les contraintes du dev web y sont pas pour grand chose. C’est con, ton Json dans le script ça doit être grosso merdo ce que tu voudrais dans ton flux RSS…

Technologie - 🤖

You are not logged in. However you can subscribe from another Fediverse account, for example Lemmy or Mastodon. To do this, paste the following into the search field of your instance: !technologie@jlai.lu

Ici concerne le champs de domaine large de la technologie : actualités sur l’informatique, partage de programme informatique et de code, montrer vos projets Arduino, ect.

Le pass BnF pour accéder à la presse : https://jlai.lu/post/4214444
https://archive.is/ pour accéder aux articles avec paywalls
!tipiak@anarchist.nexus pour les ISOs d’Ubuntu

Visibility: Public

This community can be federated to other instances and be posted/commented in by their users.

15 users / day
47 users / week
94 users / month
531 users / 6 months
372 local subscribers
1.06K subscribers
1.36K Posts
4.25K Comments
Modlog