Accueil > Boite à outils & tutoriels > Comment filtrer un flux RSS pour affiner sa veille ?

Comment filtrer un flux RSS pour affiner sa veille ?

La question du filtrage revient systématiquement lorsque du déploiement d’un projet de veille. Et pour cause : plus il sera précis, plus elle sera efficace. Pourtant, épurer le contenu d’un flux RSS n’est pas chose aisée puisque peu d’agrégateurs proposent nativement cette fonctionnalité. Découvrez comment surmonter ce problème.

filter-flux-rss

En éliminant le « bruit » (contenus inutiles) et en supprimant les éventuels doublons, la durée allouée à votre projet de veille sera considérablement réduite.

Ce gain de temps est l’objectif primordial à atteindre pour le pérenniser et obtenir un réel retour sur investissement. Plus vous serez rapide sur le traitement de l’information, plus vous pourrez vous concentrer sur les décisions à prendre.

J’avais déjà abordé cette question l’année dernière en vous apprenant comment éliminer les messages inutiles d’une liste Twitter. Cette fois, nous allons voir comment filtrer le contenu d’un flux RSS grâce à SiftRSS, un outil gratuit et accessible depuis un navigateur.

Si vous utilisez Inoreader en version premium, cette fonctionnalité (certes moins intuitive) est directement inclue dans l’outil.

Son utilisation est très simple :

  1. collez le lien URL du flux à filtrer ;
  2. choisissez si vous souhaitez inclure (« include » = garder des contenus) ou exclure (« exclude » = supprimer des contenus) ;
  3. entrez le terme sur lequel vous souhaitez effectuer le filtrage
  4. copiez-collez le lien filtré dans votre agrégateur de flux RSS

Je vous recommande d’effectuer un filtrage sur le titre. Voici par exemple le flux RSS de la Une du Monde en ne gardant que les articles à propos de « Fillon » :

filtrer-flux-rss-siftrss

Ce qui donne en sortie, le flux RSS suivant :

flux-rss-includeIl est aussi possible d’exclure les articles à propos de « Fillon » en utilisant l’option « exclude », ce qui nous donnera le flux suivant en sortie :

flux-rss-exclude

Comment choisir entre inclusion et exclusion ?

Tout dépend de votre objectif de veille :

  • l’inclusion est puissante mais très restrictive et nécessite de bien sélectionner son terme en amont (et donc de préciser ses besoins et le champ lexical associé) ;
  • l’exclusion est plus large et plus souple, elle vise surtout à éliminer le « bruit » autour de sujets dont vous êtes sûrs qu’ils ne vous intéressent pas.

Ce qu’il faut savoir sur siftRSS

Après plusieurs paramétrages pour des projets clients, voici les éléments utiles à connaître pour exploiter au mieux l’outil :

  • combiner l’option « include » et « does not contains » revient à exclure des articles (= « exclude » + « contains ») ;
  • combiner l’option « exclude » et « does not contains » revient à inclure des articles (= « include » + « contains ») ;
  • il n’est pas possible d’utiliser les opérateurs booléens (OR ou expression exacte) dans le champ où indiquer le terme à filtrer ;
  • il est cependant possible de filtrer un flux sur deux termes, peu importe leur ordre d’apparition (exemple : direct politique) ;
  • il est également possible de filtrer « en cascade » : cette méthode est assez utile pour exclure au fur et à mesure des sujets, sans le côté trop restrictif de l’inclusion dont je parlais plus haut.

Exemple d’un filtrage en cascade

Si vous souhaitez par exemple exclure du flux RSS du Monde tous les articles à propos de « Fillon » ET de « Trump », vous pouvez :

  1. effectuer un premier filtrage du flux RSS du Monde pour exclure les articles sur « Fillon ». Nous obtenons le flux filtré sur « Fillon » : https://siftrss.com/f/7459r4 ;
  2. filtrer ensuite le flux https://siftrss.com/f/7459r4 pour exclure les articles sur « Trump ».

Nous obtenons ainsi le flux https://siftrss.com/f/a2mXL4 :

flux-rss-filtrer-cascade

Ce lien est donc un flux filtré en 2 étapes, auquel nous avons d’abord exclu les articles sur Fillon, puis sur Trump. Par extension, il est possible de le filtrer en 3, 4, 5 étapes ou plus.

Pour utiliser cette méthode, un conseil : archivez la méthodologie de votre processus et la description des différents liens générés pour y retrouver à l’avenir.

Vous peinez à suivre le marché des outils de veille, l’actualité des réseaux sociaux ou les tendances digitales tant les innovations et les mutations sont rapides ? Inscrivez-vous pour recevoir gratuitement ma newsletter hebdomadaire ▶︎ Cliquez ici

Filtrer un flux RSS issu de plusieurs sources

Dans nos exemples précédents, nous avons vu comment filtrer un flux simple, i.e. issu d’un seul site. Mais il est possible de réaliser la même opération via un flux combiné, i.e. qui regroupe les RSS issus de plusieurs sites.

L’un des outils que je vous recommande d’utiliser est RSSmix (le plus stable) qui vous permettra d’assembler gratuitement jusqu’à 100 flux RSS.

Pour l’exemple, commençons par associer 3 flux RSS : celui du Monde, du Figaro et de Libération pour réaliser une mini-veille médias :

combiner-flux-rss

Le flux généré par RSSMix est alors : http://www.rssmix.com/u/8226572/rss.xml

Pour filtrer ce flux et ne garder que les articles à propos de « Fillon », nous allons réitérer les étapes vues précédemment :

filtrer-flux-rss-combine

Nous obtenons bien un flux filtré, reprenant les deux derniers articles sur le sujet, l’un de Libération, l’autre du Monde :resultats-filtre-flux-rss-combine

Conclusion

SiftRSS est un outil qui ravira les veilleurs amateurs et professionnels. Mais il met l’accent sur un point essentiel que j’ai abordé en septembre durant l’une de mes conférences : la nécessité de perdre du temps au démarrage (définition des besoins, paramétrage, consignations de votre processus) pour en gagner par la suite.

Par ailleurs, c’est un outil qui se nourrit exclusivement de flux RSS. Pour en saisir tout le potentiel, je vous invite à consulter la méthodologie complète pour générer des fils RSS sur le web 2.0.

Enfin, notons que si vous êtes équipé de l’agrégateur Inoreader (dont je parle en vidéo ici) en version premium, vous n’avez ni besoin d’utiliser RSSmix pour combiner vos fils, ni besoin d’utiliser siftRSS pour les filtrer. Si vous me lisez régulièrement, vous vous êtes probablement rendu compte que je parlais de plus en plus de cet agrégateur. La raison est simple : c’est selon moi (et je ne suis pas le seul !), l’outil le plus abouti pour se constituer une veille efficace et à moindre coût, compte tenu du temps économisé pour paramétrer votre veille sur internet.

Profitez d’une réduction de 30% sur votre abonnement Inoreader en utilisant le code promo Inoreader 2262E23E (soit 35$ par an pour la version professionnelle !). Offre réservée aux lecteurs de Keep It Simple et valable jusqu’au 13 décembre 2017.
About these ads
Vous avez aimé cet article ? Donnez lui une note !
1 étoile ? Mince, l’article ne vous a pas plu ?2 étoiles ? OK, je ferai mieux la prochaine fois !3 étoiles ? Ouf, j’ai la moyenne !4 étoiles ? Merci, c’est sympa :-)5 étoiles ? Au top, merci beaucoup ! (4 vote(s) pour une moyenne de 5,00 sur 5)
Loading...

8 commentaires

  1. Bonjour,
    Super article qui vient à point nommé pour moi.
    Seulement, j’utilise Feedspot comme agrégateur et il ne reconnait pas le lien créé avec Siftrss comme un flux RSS…
    Est-ce que vous savez pourquoi et si oui, comment peut-on contourner l’obstacle ?

    Merci et bravo pour ce site

    • Bonjour ,

      Je viens de regarder le lien URL que vous m’avez partagé (dans le commentaire @danmorgen). Chez moi, il s’affiche et se lit correctement : que ce soit en prévisualisation, ou dans Feedly & Inoreader.
      Je pense que le plus simple est de demander directement à Feedspot car je ne vois pas d’où vient le problème.

      Cordialement,
      Bryan

      • Bonjour, j’étais vraiment conquis par le sujet de cet article, malheureusement il me semble que SiftRSS soit HS pour mes essais, et même quand je prends comme exemple le flux du Monde qui est en image d’illustration. Panne temporaire, définitive. Peut-être avez-vous une solution de rechange en expliquant la manip dans Inoreader :)
        Agréable journée.
  2. Super article, mais ça ne fonctionne pas avec mon agrégateur Feedspot :((
    Quand je colle le lien siftrss (par exemple https://siftrss.com/f/QOQKn2), il m’indique
    Your search did not match any Feeds..
    -Make sure site name OR feed url is spelled correctly.
    -Try different keywords or more general keywords.
    -Look for one of these RSS icons on the site’s page and copy paste the link in the search box above.

    En gros, il ne considère pas l’URL comme un flux RSS.
    Si vous avez une idée …

  3. Merci pour l’article, c’est toujours bien de voir des solutions RSS innovantes et souples.

    Pour ma part j’utilise également l’excellentissime Inoreader mentionné dans l’article et je confirme que c’est le meilleur, tout en regrettant feu Google Reader.

  4. Bonjour.

    Pour ma part j’utilise encore Thunderbird, qui, malgré ses problèmes de développement (problème d’abandon par Mozilla), permet d’avoir gratuitement, et localement (donc stockage des informations), tout un système de veille, que ce soit par newsletter mail (ou simplement boite mail), mais aussi flux RSS (normal, facebook ou encore twitter, surtout avec l’aide de vos articles). Tout ceci avec la possibilité de pouvoir créer ce qu’ils appellent des dossiers virtuels, qui ont exactement la même fonctionnalité que les deux outils que vous citez ci-dessus.
    Je trouve cela très agréable car tout est géré par un seul et même outil, que je trouve aussi particulièrement puissant et très utile dans la vie de tous les jours.

    Pensez vous que ce soit encore une bonne alternative pour avoir une veille efficace ?

    • Bonsoir

      Vu la description que vous me faites de votre utilisation de Thunderbird, cela me semble une bonne alternative en effet. La véritable question est liée à la durabilité de votre système actuel, compte tenu de la situation de Thunderbird. Qu’en sera-t-il d’ici 1 an ?

      Les outils que je présente comporte un avantage majeur, recherché par la majorité de mes clients : bénéficier d’un système souple et en saas, accessible sur n’importe quel device pour répondre aux problématiques actuelles de nomadisme.

      Merci pour votre commentaire éclairant, je ne pensais pas que Thunderbird offrait ce type de possibilités. C’est donc très intéressant à connaitre.

      Bonne soirée,
      Bryan

Commenter

Votre adresse email ne sera pas publiée. Champs obligatoires *

*

``