La fonctionnalité a évolué, à lire dans le dernier paragraphe de l’article (janvier 2021)
Bonjour,
Nous vous proposons une nouvelle fonctionnalité dans ezPAARSE : le traitement ciblé de plateformes.
En quoi cela consiste ?
Par défaut, lors d’un traitement de logs dans ezPAARSE, l’ensemble des parseurs des plateformes éditeurs reconnues (308 à l’heure actuelle) est utilisé. Retrouvez la liste des parseurs dans le dépôt Github.
L’ajout de ce header dans les paramètres d’un traitement de logs va permettre de faire un filtrage sur une ou plusieurs plateformes ciblées. La durée du traitement en sera considérablement réduite, ainsi que la taille du fichier résultat.
Quelle est la procédure à suivre dans l’interface d’ezPAARSE ?
Tout d’abord, déposez un fichier de logs à traiter.
- Sélectionnez si nécessaire un paramétrage prédéfini (INIST-BIBCNRS dans l’exemple ci-dessus)
- Ensuite, dans la section « headers avancés » située plus bas, cliquez sur « + AJOUTER«
- Entrez « filter-platforms » dans le champ « Nom« . En tapant les premières lettres, une liste d’auto-complétion apparaît.
- Dans le champ « Valeur« , saisissez la forme abrégée du nom de(s) plateforme(s).
La liste des plateformes est au format abrégé
Dans cet exemple, nous souhaitons obtenir un résultat pour les plateformes Science Direct (sd) et Nature Publishing Group (npg).
Pour cela, nous devons saisir les deux noms abrégés, séparés par une virgule.
Cliquez ensuite sur « lancer le traitement« .
Sur le tableau de contrôle, on peut constater que le filtre a bien fonctionné. Le traitement s’est opéré sur 2 plateformes. La durée du traitement est réduite car par défaut, un traitement de logs se fait sur une moyenne de 190 parseurs.
Cliquer sur « Téléchargez le résultat« .
Le fichier résultat au format CSV contient uniquement les ECs de Science Direct et Nature Publishing Group.
Les avantages
- Un traitement ciblé est bien plus rapide qu’un traitement classique, car il ignore l’analyse et l’enrichissement d’un grand nombre d’ECs.
- Il est possible de choisir une ou plusieurs plateformes dans le champ de valeur du header « filter-platforms« .
- Le fichier résultat partiel obtenu peut être téléversé dans ezMESURE. Le champ log_id garantit une mise à jours des ECs déjà présents, sans créer de doublons.
Cette fonctionnalité est amenée à évoluer. Une saisie avec auto-complétion du nom des plateformes est d’ores et déjà prévue dans une prochaine version d’ezPAARSE.
Evolution par filtrage des plateformes dans Paramètres – en sortie
La fonctionnalité est simplifiée. Il n’est plus nécessaire d’utiliser le header « filter-platforms ».
Dans « Paramètres » – en sortie – filtrer les plateformes
en cliquant dans le champ, un menu déroulant vous propose toute la liste des plateformes dans ezPAARSE. Il suffit de cocher la case des plateformes que vous souhaitez filtrer.
Ensuite, lancez votre traitement.
cette vidéo vous montre la procédure simplifiée en détail.
N’hésitez pas à tester ce type de traitement et à faire part de vos retour à l’équipe ezTEAM.
Bonne journée.
Frédéric Truong pour ezTEAM.