Bonjour,
Nous avons développé un parseur pour l’éditeur Press Reader. Cette plateforme propose plusieurs milliers de revues internationales en ligne destinées au grand public. Notre collègue Timothee Rony de La Bibliothèque Sainte Geneviève a fait les analyses dans analoGIST.
Les analyses
Notre collègue a fait trois analyses de revues différentes. Mais il s’agit de la même structure d’URL, donc une seule expression régulière est nécessaire pour l’instant. L’identifiant title_id permet de distinguer assez clairement le nom de la revue. L’identifiant unit_id aussi présent dans l’URL permet de distinguer la date de publication. exemple :
http://www.pressreader.com/france/la-recherche/20171123/textview
title_id : la-recherche (identifiant de la revue)
publication_date : 20171123 format date AAAMMJJ (date de publication)
unit_id : la-recherche/20171123 (identifiant de la revue et du numéro consulté)
Le rtype est ISSUE car la consultation comptabilise un numéro consulté peu importe le nombre de pages vues et le mime est MISC (format indéterminé).
Le parseur
Voici le parseur que vous pouvez consulter sur github.
Les tests
L’URL analysée est bien reconnue dans ezPAARSE.
Vous pouvez tester ce parseur si vous êtes abonné à cette plateforme. Vous avez toujours la possibilité d’utiliser ezLOGGER ou en traitant les logs dans votre instance locale mise à jour au préalable.
Bonne journée.
Frédéric Truong pour ezTEAM.