Analyses de plateformes: Nouveau parseur de la plateforme Press Reader

pressreader logo

Bonjour,

 

Nous avons développé un parseur pour l’éditeur Press Reader. Cette plateforme propose plusieurs milliers de revues internationales en ligne destinées  au grand public. Notre collègue Timothee Rony de La Bibliothèque Sainte Geneviève a fait les analyses dans analoGIST.

pressreader homepage

 

Les analyses

pressreader analyse issue2

Notre collègue a fait trois analyses de revues différentes. Mais il s’agit de la même structure d’URL, donc une seule expression régulière est nécessaire pour l’instant. L’identifiant title_id permet de distinguer assez clairement le nom de la revue. L’identifiant unit_id aussi présent dans l’URL permet de distinguer la date de publication. exemple :

http://www.pressreader.com/france/la-recherche/20171123/textview

title_id : la-recherche  (identifiant de la revue)

publication_date : 20171123  format date AAAMMJJ  (date de publication)

unit_id : la-recherche/20171123  (identifiant de la revue et du numéro consulté)

Le rtype est ISSUE car la consultation comptabilise un numéro consulté peu importe le nombre de pages vues et le mime est MISC (format indéterminé).

Le parseur

pressreader parser

 

Voici le parseur que vous pouvez consulter sur github.

 

Les tests

pressreader ezlogger

 

L’URL analysée est bien reconnue dans ezPAARSE.

Vous pouvez tester ce parseur si vous êtes abonné à cette plateforme. Vous avez toujours la possibilité d’utiliser ezLOGGER ou en traitant les logs dans votre instance locale mise à jour au préalable.

 

Bonne journée.

 

Frédéric Truong pour ezTEAM.