Analyses de plateformes : Journée parseurs pour les plateformes NEJM et ASH

journee parseurs

 

Bonjour

Chaque mois Yannick Schurter, Steven Wilmouth et moi-même nous réunissons pendant une journée pour faire le point sur les plateformes qui sont listées dans le Trello « Suivi des plateformes ».

L’objectif de ces sessions est de recenser les dernières analyses réalisées par les contributeurs (plateformes en statut « 3 – Analyse des URLs terminée » dans le tableau Trello) et de procéder à la création ou à la mise à jour de leur parseur dans ezPAARSE.

Voici le bilan de cette dernière session :

 

 

La plateforme NEJM

Notre collègue Hélène Prost, de l’Inist-CNRS, travaille actuellement sur des comparaisons des rapports JR1 (COUNTER) des éditeurs Scientifiques avec les rapports d’usage produits par ezPAARSE pour les portails BibCNRS.

Elle nous a signalé une anomalie pour la consultation d’un article au format HTML décompté par ezPaarse en PDF, par exemple :

https://www-nejm-org.insb.bib.cnrs.fr/doi/full/10.1056/NEJM199501263320407

On peut voir dans le test avec ezLOGGER que le format (type MIME) est reconnu en PDF au lieu d’HTML.

Le parseur

Yannick Schurter, développeur de l’équipe ezTEAM, a procédé à un « refactoring » du parseur de la plateforme qui consiste à reprendre chaque expression régulière du programme et d’en vérifier la concordance avec les analyses des URLS dans analogIST .

Les tests

Nous avons testé toutes les URLs avec l’outil ezLOGGER pour vérifier que le parseur est bien conforme aux analyses présentes.

 

Toutes les consultations sont bien reconnues dans ezPAARSE avec les bons RTYPEs (types de ressources) et MIMEs (formats des ressources).

 

Cet éditeur était hébergé sur la plateforme HighWire jusqu’en 2019. Nos collègues du Service des Négociations à l’Inist-CNRS nous ont informé du changement d’agrégateur. C’est désormais Silverchair qui reprend la mise à en ligne des ressources électroniques pour l’American Society of Hematology.

Le domaine

Il existe un parseur pour la plateforme Silverchair. Il contient un fichier appelé « manifest.json » dans lequel sont listés les noms de domaines des éditeurs hébergés (et qui ont en commun une même forme d’URLs). En renseignant le champ ‘domains’ avec « ashpublications.org », l’ajout de ce nouvel éditeur est pris en compte par le parseur silverchair.

les tests

En testant avec ezLOGGER les consultations ARTICLE HTML et PDF, on peut constater que les URLs sont déjà prises en compte dans le parseur de la plateforme Silverchair.

 

Nous vous invitons à tester également ces deux plateformes mises à jour avec ezLOGGER , ou avec un jeu de logs dans votre instance locale mise à jour au préalable.

Bonne journée.

Frédéric Truong pour ezTEAM.