La question du filtrage revient systĂ©matiquement lorsque du dĂ©ploiement d’un projet de veille. Et pour cause : plus il sera prĂ©cis, plus elle sera efficace. Pourtant, Ă©purer le contenu d’un flux RSS n’est pas chose aisĂ©e puisque peu d’agrĂ©gateurs proposent nativement cette fonctionnalitĂ©. DĂ©couvrez comment surmonter ce problème.
En éliminant le « bruit » (contenus inutiles) et en supprimant les éventuels doublons, la durée allouée à votre projet de veille sera considérablement réduite.
Ce gain de temps est l’objectif primordial Ă atteindre pour le pĂ©renniser et obtenir un rĂ©el retour sur investissement. Plus vous serez rapide sur le traitement de l’information, plus vous pourrez vous concentrer sur les dĂ©cisions Ă prendre.
J’avais dĂ©jĂ abordĂ© cette question l’annĂ©e dernière en vous apprenant comment Ă©liminer les messages inutiles d’une liste Twitter. Cette fois, nous allons voir comment filtrer le contenu d’un flux RSS grâce Ă Â SiftRSS, un outil gratuit et accessible depuis un navigateur.
Son utilisation est très simple :
- collez le lien URL du flux Ă filtrer ;
- choisissez si vous souhaitez inclure (« include » = garder des contenus) ou exclure (« exclude » = supprimer des contenus) ;
- entrez le terme sur lequel vous souhaitez effectuer le filtrage
- copiez-collez le lien filtré dans votre agrégateur de flux RSS
Je vous recommande d’effectuer un filtrage sur le titre. Voici par exemple le flux RSS de la Une du Monde en ne gardant que les articles Ă propos de « Fillon » :
Ce qui donne en sortie, le flux RSS suivant :
Il est aussi possible d’exclure les articles Ă propos de « Fillon » en utilisant l’option « exclude », ce qui nous donnera le flux suivant en sortie :
Comment choisir entre inclusion et exclusion ?
Tout dépend de votre objectif de veille :
- l’inclusion est puissante mais très restrictive et nĂ©cessite de bien sĂ©lectionner son terme en amont (et donc de prĂ©ciser ses besoins et le champ lexical associĂ©) ;
- l’exclusion est plus large et plus souple, elle vise surtout Ă Ă©liminer le « bruit » autour de sujets dont vous ĂŞtes sĂ»rs qu’ils ne vous intĂ©ressent pas.
Ce qu’il faut savoir sur siftRSS
Après plusieurs paramĂ©trages pour des projets clients, voici les Ă©lĂ©ments utiles Ă connaĂ®tre pour exploiter au mieux l’outil :
- combiner l’option « include » et « does not contains » revient Ă exclure des articles (= « exclude » + « contains ») ;
- combiner l’option « exclude » et « does not contains » revient Ă inclure des articles (= « include » + « contains ») ;
- il n’est pas possible d’utiliser les opérateurs booléens (OR ou expression exacte) dans le champ où indiquer le terme à filtrer ;
- il est cependant possible de filtrer un flux sur deux termes, peu importe leur ordre d’apparition (exemple : direct politique) ;
- il est Ă©galement possible de filtrer « en cascade » : cette mĂ©thode est assez utile pour exclure au fur et Ă mesure des sujets, sans le cĂ´tĂ© trop restrictif de l’inclusion dont je parlais plus haut.
Exemple d’un filtrage en cascade
Si vous souhaitez par exemple exclure du flux RSS du Monde tous les articles à propos de « Fillon » ET de « Trump », vous pouvez :
- effectuer un premier filtrage du flux RSS du Monde pour exclure les articles sur « Fillon ». Nous obtenons le flux filtré sur « Fillon » : https://siftrss.com/f/7459r4 ;
- filtrer ensuite le flux https://siftrss.com/f/7459r4 pour exclure les articles sur « Trump ».
Nous obtenons ainsi le flux https://siftrss.com/f/a2mXL4Â :
Ce lien est donc un flux filtrĂ© en 2 Ă©tapes, auquel nous avons d’abord exclu les articles sur Fillon, puis sur Trump. Par extension, il est possible de le filtrer en 3, 4, 5 Ă©tapes ou plus.
Pour utiliser cette mĂ©thode, un conseil : archivez la mĂ©thodologie de votre processus et la description des diffĂ©rents liens gĂ©nĂ©rĂ©s pour y retrouver Ă l’avenir.
Filtrer un flux RSS issu de plusieurs sources
Dans nos exemples prĂ©cĂ©dents, nous avons vu comment filtrer un flux simple, i.e. issu d’un seul site. Mais il est possible de rĂ©aliser la mĂŞme opĂ©ration via un flux combinĂ©, i.e. qui regroupe les RSS issus de plusieurs sites.
L’un des outils que je vous recommande d’utiliser est RSSmix (le plus stable) qui vous permettra d’assembler gratuitement jusqu’Ă 100 flux RSS.
Pour l’exemple, commençons par associer 3 flux RSS : celui du Monde, du Figaro et de LibĂ©ration pour rĂ©aliser une mini-veille mĂ©dias :
Le flux généré par RSSMix est alors : http://www.rssmix.com/u/8226572/rss.xml
Pour filtrer ce flux et ne garder que les articles à propos de « Fillon », nous allons réitérer les étapes vues précédemment :
Nous obtenons bien un flux filtrĂ©, reprenant les deux derniers articles sur le sujet, l’un de LibĂ©ration, l’autre du Monde :
Conclusion
SiftRSS est un outil qui ravira les veilleurs amateurs et professionnels. Mais il met l’accent sur un point essentiel que j’ai abordĂ© en septembre durant l’une de mes confĂ©rences : la nĂ©cessitĂ© de perdre du temps au dĂ©marrage (dĂ©finition des besoins, paramĂ©trage, consignations de votre processus) pour en gagner par la suite.
Par ailleurs, c’est un outil qui se nourrit exclusivement de flux RSS. Pour en saisir tout le potentiel, je vous invite Ă consulter la mĂ©thodologie complète pour gĂ©nĂ©rer des fils RSS sur le web 2.0.
Enfin, notons que si vous ĂŞtes Ă©quipĂ© de l’agrĂ©gateur Inoreader (dont je parle en vidĂ©o ici) en version premium, vous n’avez ni besoin d’utiliser RSSmix pour combiner vos fils, ni besoin d’utiliser siftRSS pour les filtrer. Si vous me lisez rĂ©gulièrement, vous vous ĂŞtes probablement rendu compte que je parlais de plus en plus de cet agrĂ©gateur. La raison est simple : c’est selon moi (et je ne suis pas le seul !), l’outil le plus abouti pour se constituer une veille efficace et Ă moindre coĂ»t, compte tenu du temps Ă©conomisĂ© pour paramĂ©trer votre veille sur internet.
Bonjour,
Merci pour cet article ! Je remarque depuis quelque temps une instabilitĂ© chez siftrss (filtrage qui casse, impossibilitĂ© de filtrer certains flux…) qui n’Ă©tait pas prĂ©sente auparavant !
Percevez-vous la même chose ? et dans cette optique auriez vous des outils similaires ou complémentaires à Siftrss !
Merci par avance !
Très bonne journée !
Philippe
Bonjour,
Super article qui vient à point nommé pour moi.
Seulement, j’utilise Feedspot comme agrĂ©gateur et il ne reconnait pas le lien crĂ©Ă© avec Siftrss comme un flux RSS…
Est-ce que vous savez pourquoi et si oui, comment peut-on contourner l’obstacle ?
Merci et bravo pour ce site
Bonjour @morgen,
Je viens de regarder le lien URL que vous m’avez partagĂ© (dans le commentaire @danmorgen). Chez moi, il s’affiche et se lit correctement : que ce soit en prĂ©visualisation, ou dans Feedly & Inoreader.
Je pense que le plus simple est de demander directement Ă Feedspot car je ne vois pas d’oĂą vient le problème.
Cordialement,
Bryan
Bonjour, j’Ă©tais vraiment conquis par le sujet de cet article, malheureusement il me semble que SiftRSS soit HS pour mes essais, et mĂŞme quand je prends comme exemple le flux du Monde qui est en image d’illustration. Panne temporaire, dĂ©finitive. Peut-ĂŞtre avez-vous une solution de rechange en expliquant la manip dans Inoreader 🙂
Agréable journée.
Super article, mais ça ne fonctionne pas avec mon agrégateur Feedspot :((
Quand je colle le lien siftrss (par exemple https://siftrss.com/f/QOQKn2), il m’indique
Your search did not match any Feeds..
-Make sure site name OR feed url is spelled correctly.
-Try different keywords or more general keywords.
-Look for one of these RSS icons on the site’s page and copy paste the link in the search box above.
En gros, il ne considère pas l’URL comme un flux RSS.
Si vous avez une idĂ©e …
Merci pour l’article, c’est toujours bien de voir des solutions RSS innovantes et souples.
Pour ma part j’utilise Ă©galement l’excellentissime Inoreader mentionnĂ© dans l’article et je confirme que c’est le meilleur, tout en regrettant feu Google Reader.
Bonjour @clo75,
J’utilise aussi Inoreader depuis 1 an et demi… Je ne peux plus m’en passer 🙂
Bonjour.
Pour ma part j’utilise encore Thunderbird, qui, malgrĂ© ses problèmes de dĂ©veloppement (problème d’abandon par Mozilla), permet d’avoir gratuitement, et localement (donc stockage des informations), tout un système de veille, que ce soit par newsletter mail (ou simplement boite mail), mais aussi flux RSS (normal, facebook ou encore twitter, surtout avec l’aide de vos articles). Tout ceci avec la possibilitĂ© de pouvoir crĂ©er ce qu’ils appellent des dossiers virtuels, qui ont exactement la mĂŞme fonctionnalitĂ© que les deux outils que vous citez ci-dessus.
Je trouve cela très agréable car tout est géré par un seul et même outil, que je trouve aussi particulièrement puissant et très utile dans la vie de tous les jours.
Pensez vous que ce soit encore une bonne alternative pour avoir une veille efficace ?
Bonsoir @vincent
Vu la description que vous me faites de votre utilisation de Thunderbird, cela me semble une bonne alternative en effet. La vĂ©ritable question est liĂ©e Ă la durabilitĂ© de votre système actuel, compte tenu de la situation de Thunderbird. Qu’en sera-t-il d’ici 1 an ?
Les outils que je prĂ©sente comporte un avantage majeur, recherchĂ© par la majoritĂ© de mes clients : bĂ©nĂ©ficier d’un système souple et en saas, accessible sur n’importe quel device pour rĂ©pondre aux problĂ©matiques actuelles de nomadisme.
Merci pour votre commentaire Ă©clairant, je ne pensais pas que Thunderbird offrait ce type de possibilitĂ©s. C’est donc très intĂ©ressant Ă connaitre.
Bonne soirée,
Bryan