Bonjour
Chaque mois Yannick Schurter, Steven Wilmouth et moi-même nous réunissons pendant une journée pour faire le point sur les plateformes qui sont listées dans le Trello « Suivi des plateformes ».
L’objectif de ces sessions est de recenser les dernières analyses réalisées par les contributeurs (plateformes en statut « 3 – Analyse des URLs terminée » dans le tableau Trello) et de procéder à la création ou à la mise à jour de leur parseur dans ezPAARSE.
Voici le bilan de cette dernière session :
La plateforme NEJM
Notre collègue Hélène Prost, de l’Inist-CNRS, travaille actuellement sur des comparaisons des rapports JR1 (COUNTER) des éditeurs Scientifiques avec les rapports d’usage produits par ezPAARSE pour les portails BibCNRS.
Elle nous a signalé une anomalie pour la consultation d’un article au format HTML décompté par ezPaarse en PDF, par exemple :
https://www-nejm-org.insb.bib.cnrs.fr/doi/full/10.1056/NEJM199501263320407
On peut voir dans le test avec ezLOGGER que le format (type MIME) est reconnu en PDF au lieu d’HTML.
Le parseur
Yannick Schurter, développeur de l’équipe ezTEAM, a procédé à un « refactoring » du parseur de la plateforme qui consiste à reprendre chaque expression régulière du programme et d’en vérifier la concordance avec les analyses des URLS dans analogIST .
Les tests
Nous avons testé toutes les URLs avec l’outil ezLOGGER pour vérifier que le parseur est bien conforme aux analyses présentes.
Toutes les consultations sont bien reconnues dans ezPAARSE avec les bons RTYPEs (types de ressources) et MIMEs (formats des ressources).
Cet éditeur était hébergé sur la plateforme HighWire jusqu’en 2019. Nos collègues du Service des Négociations à l’Inist-CNRS nous ont informé du changement d’agrégateur. C’est désormais Silverchair qui reprend la mise à en ligne des ressources électroniques pour l’American Society of Hematology.
Le domaine
Il existe un parseur pour la plateforme Silverchair. Il contient un fichier appelé « manifest.json » dans lequel sont listés les noms de domaines des éditeurs hébergés (et qui ont en commun une même forme d’URLs). En renseignant le champ ‘domains’ avec « ashpublications.org », l’ajout de ce nouvel éditeur est pris en compte par le parseur silverchair.
les tests
En testant avec ezLOGGER les consultations ARTICLE HTML et PDF, on peut constater que les URLs sont déjà prises en compte dans le parseur de la plateforme Silverchair.
Nous vous invitons à tester également ces deux plateformes mises à jour avec ezLOGGER , ou avec un jeu de logs dans votre instance locale mise à jour au préalable.
Bonne journée.
Frédéric Truong pour ezTEAM.