Analyses de plateformes : Journée parseurs pour les plateformes ARC, Cairn, ACM, Portland Press et ASH

journee parseurs

Bonjour

Chaque mois Yannick Schurter, Steven Wilmouth et moi-même nous réunissons pendant une journée pour faire le point sur les plateformes qui sont listées dans le Trello « Suivi des plateformes ».

L’objectif de ces sessions est de recenser les dernières analyses réalisées par les contributeurs (plateformes en statut « 3 – Analyse des URLs terminée » dans le tableau Trello) et de procéder à la création ou à la mise-à-jour de leur parseur dans ezPAARSE.

Voici le bilan de cette dernière session :

 

Journée Parseurs sr 38

 

ARC

Pour cette plateforme, le parseur a été mis à jour pour reconnaître deux nouvelles URLs  de consultation d’un ARTICLE en HTML.

https://arc.aiaa.org/doi/full/10.2514/1.J057846

https://arc.aiaa.org/doi/10.2514/1.J057846

arc ezlogger 2020

Le test avec ezLOGGER montre que les deux URLs sont prises en charge dans ezPAARSE.

 

CAIRN

Nous avons mis à la jour les bases de connaissances (ou PKB, pour Publisher Knowledge Base) de la plateforme CAIRN.

Dans ezPAARSE, nous avons mis à jour un « scraper » qui va extraire les données directement par un appel à l’API Bacon pour générer les PKB qui nous intéressent.

Pour rappel, une PKB contient la liste des revues d’une plateforme dans un format tabulé (tel que le spécifie le standard KBART)  et contient aussi les informations bibliographiques de chaque revue (ISSN, Titre de publication, éditeur, etc.).

Elle contient en outre un « title_id » (identifiant de la revue). C’est cet identifiant qui permet au parseur embarqué dans ezPAARSE pour une plateforme particulière de faire le lien entre un identifiant propriétaire présent dans l’URL et une ressource donnée (en terme bibliographique) et qui permet ainsi l’enrichissement des ECs (Événements de Consultations) au moment d’un traitement de logs.

pkb cairn 2020

La mise à jour porte sur des listes de bouquets de l’année 2020 qui ont été ajoutées dans le fichier PKB de la plateforme.

 

ACM

Nous avons fait 3 nouvelles analyses pour la plateformes ACM.

A noter que l’identifiant d’une ressource consultée est maintenant le DOI. 

exemple d'URL : https://dl-acm-org/doi/fullHtml/10.1145/3359626

acm analyses

Nous obtenons des consultations de type ARTICLE aux formats HTML et PDF et ABS (résumé) en HTML.

acm ezlogger 2020

Le test avec ezLOGGER montre que ces 3 types de consultations sont bien reconnues dans ezPAARSE.

 

Portland Press et ASH

Ces deux éditeurs ont migré depuis l’agrégateur Highwire vers Silverchair.

Pour rappel, un agrégateur est une plateforme qui héberge les ressources de plusieurs éditeurs. En général, les URLs de consultations sont les mêmes pour tous les éditeurs. Ce qui les différencie, c’est leur nom de (sous-) domaine.

Par exemple :

Portland Press :  https://portlandpress.com/

ASH (american society of hematology)  : https://www.hematology.org/

Nous avons ajouté ces domaines dans le fichier manifest.json de la plateforme Silverchair.

portland press ash domain manifest silverchair

 

Nous vous invitons maintenant à tester ces plateformes avec ezLOGGER, ou avec vos logs traités dans votre instance locale ezPAARSE mise à jour au préalable.

 

Bonne journée.

Frédéric Truong pour ezTEAM.