Bonjour
La mise-à-jour des parseurs est nécessaire pour maintenir un niveau de reconnaissance des plateformes éditeurs qui soit le plus complet possible. C’est pourquoi nous détaillons aujourd’hui les dernières modifications apportées aux parseurs de Nature, Taylor & Francis, De Gruyter et Gale Cengage.
NATURE.COM
Nous avons détecté une nouvelle URL de consultation ARTICLE en PDF qui a été ajoutée au parseur actuel.
L’URL est bien reconnue dans ezPAARSE avec ezLOGGER.
A noter que l’URL de consultation ARTICLE en HTML n’a pas été modifiée car elle est déjà reconnue par le parseur :
https://www.nature.com/articles/d41586-018-06997-8
TAYLOR & FRANCIS
Notre collègue Annick Lagrange de L’école Centrale de Lyon a ajouté 2 URLs de consultation ARTICLE et ABS (résumé d’un article) dans analogIST.
La particularité de ces URLs, c’est de contenir un DOI, identifiant avec lequel l’API Crossref est interrogée au moment où ezPAARSE traite vos logs. Les métadonnées (Titre de publication , ISSN, Publication_date,..) récupérées depuis Crossref sont alors insérées dans les ECs (événements de consultations).
Après la mise à jour du parseur, les tests avec ezLOGGER montrent la bonne reconnaissance de ces requêtes dans ezPAARSE.
DeGruyter
Une correction dans l’expression régulière (regex) a été faite pour que la consultation ARTICLE en PDF prenne en compte l’identifiant DOI avec des caractères spéciaux comme « . »
Yannick, qui a corrigé le code, en a profité pour ré-écrire certaines expressions régulières (on appelle cela dans le jargon un refactoring, une mise au propre du parseur en quelque sorte).
Enfin, le test dans ezLOGGER montre que cette requête est bien reconnue quand le DOI est présent dans le format qui contient des « . »
A noter que le DOI est reconstitué avec le préfixe de la plateforme 10.1515 suivi du suffixe 9783110239423.121 présent dans l’URL.
Nous avons ajouté une URL de consultation BOOK dans le parseur, qui correspond à l’ouverture d’un EBOOK (quelque soit le nombre de pages visualisées) :
L’URL analysée est assez complexe, mais on a pu localiser un identifiant de type unit_id : GALE|CB0132160943 qui va permettre le dédoublonnage éventuel des accès.
Le test dans ezLOGGER montre que la consultation BOOK en HTML est bien reconnue.
Nous vous invitons maintenant à mettre à jour les parseurs de votre instance locale ezPAARSE et à tester dans votre établissement ces modifications de parseurs, avec ezLOGGER, ou en traitant un échantillon de logs.
Bonne journée.
Frédéric Truong pour ezTEAM.