Analyses de plateformes : Bilan des journées parseurs – année 2023

 

bilan journées parseurs 2023

Bonjour,

Une fois par mois Yannick Schurter, Léo Felix, Tom Sublet et moi-même nous nous réunissons pour faire le point sur les plateformes qui sont listées sur AnalogIST (et dans le Trello « Suivi des plateformes »).

L’objectif de ces sessions mensuelles est de recenser les dernières analyses réalisées par les contributeurs (plateformes en statut « 3 – Analyse des URLs terminée ») et de procéder à la création ou à la mise à jour des parseurs pour les rendre disponibles dans ezPAARSE.

Nous avons procédé à la création et à la mise à jours de parseurs pour les plateformes renseignées dans le tableau récapitulatif suivant :

 

ANNEE 2023

Date d’intégration

ezPAARSE

Plateforme Création / Révision

du parseur

RTYPE – type d’accès validés

(ARTICLE, ABS, BOOK,…)

formats validés

(HTML, PDF,…)

Présence du DOI dans

l’url (oui/non)

Commentaires
11/01/2023 CONTEXTE Création SEARCH HTML non
11/01/2023 CONTEXTE Création ARTICLE HTML non
11/01/2023 CONTEXTE Création ARTICLE HTML non Actualités
11/01/2023 OMEKA S Création RECORD_VIEW HTML non identifiant transformé en ARK par API OMEKA S
11/01/2023 OMEKA S Création RECORD_VIEW PDF non plus d’identifiant de ressource dans l’URL
11/03/2023 OMEKA S Création SANS RTYPE HTML non MIRADOR/ galerie d’images
11/03/2023 OMEKA S Création SEARCH HTML non Plateforme Animal Représentation tests
21/02/2023 LEXIS 360 INTELLIGENCE Création SEARCH HTML non
21/02/2023 LEXIS 360 INTELLIGENCE Création JURISPRUDENCE HTML non
21/02/2023 LEXIS 360 INTELLIGENCE Création JURISPRUDENCE PDF non
21/02/2023 Radiological Society of North America Revision TOC HTML non ancienne plateforme agrégée Highwire Vol , Issue
21/02/2023 Radiological Society of North America Revision ABS HTML oui ancienne plateforme agrégée Highwire modèle ATYPON
21/02/2023 Radiological Society of North America Revision ARTICLE HTML oui
21/02/2023 Radiological Society of North America Revision ARTICLE HTML oui avec paramètre « full »
21/02/2023 Radiological Society of North America Revision ARTICLE PDF oui
21/02/2023 OPUS Création TOC HTML non
2 domaines BOOK et Revue, 2 parseurs initiés, Les URL pour E. BOOK ne permettent pas la distinction entre BOOK et BOOK_SECTION
21/02/2023 Emerging-neurologist Création ARTICLE HTML non
21/02/2023 Emerging-neurologist Création ARTICLE PDF non
29/03/2023 Cambridge University Press Révision ARTICLE HTML non ABS/ARTICLE correction
29/03/2023 Quintessence Publishing Création ARTICLE PDF non
29/03/2023 Quintessence Publishing Création ABS HTML non
29/03/2023 Quintessence Publishing Création TOC HTML non
29/03/2023 Rockfeller University Press Révision ARTICLE HTML oui Reconstitution DOI
29/03/2023 Rockfeller University Press Révision ARTICLE PDF oui reconstitution DOI
29/03/2023 Rockfeller University Press Révision TOC HTML non
29/03/2023 Rockfeller University Press Révision TOC PDF non
29/03/2023 Thesaurus Linguae Latinae Création RECORD_VIEW HTML non
29/03/2023 Thesaurus Linguae Latinae Création RECORD_VIEW PDF non
29/03/2023 Thesaurus Linguae Latinae Création SEARCH HTML non
29/03/2023 Web of Science Révision TOUS LES ACCES non
Le premier appel à la page est reconnu (sûrement du SSR couplé avec une SPA), après le client passe par des websockets qui ne laisse pas de traces dans le proxy.
06/06/2023 Natura Sciences Création ARTICLE HTML non LA ¨PLATEFORME A LE STATUT ANALYSE INFAISABLE
31/07/2023 TAIR Révision RECORD HTML non Consultation de différents document (gene) affichage écran
31/07/2023 TAIR Révision RECORD MISC non Rubrique download différents documents au formats (pdf, gz, text)
17/10/2023 Oxford ArtOnline Révision ARTICLE HTML non /display/ non reconnu dans la consultation ARTICLE
18/10/2023 Prairial Edition Révision ARTICLE HTML oui Reconstitution DOI, middleware Crossref pour attribuer le Rtype manquant

Le tableau est mis à jour après chaque journées parseurs pour avoir une vision annuelle des développements opérés.

Chaque carte du Trello contient les informations d’une plateforme éditeur ainsi que l’avancée de son traitement. Une plateforme mise à jour atteint le statut « 5 parseur à tester avec de vrais logs ».

Vous pouvez retrouver toutes les informations, les commentaires et les échanges avec l’équipe de développement dans le Trello « Suivi des plateformes »

Nous vous invitons maintenant à tester ces plateformes avec ezLOGGER, ou directement avec vos logs que vous traiterez dans votre instance locale ezPAARSE elle même mise-à-jour.

trello analyses plateformes juillet 2021

RETRAITEMENT DES LOGS D’UNE ANNÉE COMPLÈTE :

Pour bénéficier de données d’usages à jour, obtenues par l’ensemble des intégrations des parseurs dans ezPAARSE renseignés dans le tableau , nous vous conseillons de retraiter vos logs d’une année complète au mois de janvier de l’année suivante. Vérifiez que votre instance ezPAARSE est à jour et effectuez un redémarrage de l’application avant le retraitement.

 

Frédéric Truong pour ezTEAM