Bertrand Calenge : carnet de notes

jeudi 4 mars 2010

Gérer concrètement une collection : une solution pratique

Filed under: Non classé — bcalenge @ jeudi 4 mars 2010
Tags: ,

C’est une plainte récurrente des bibliothécaires : les modules des SIGB sont trop souvent incapables de procurer des outils efficaces permettant de gérer non pas uniquement des documents individuels mais bien des collections. Outre leurs subtilités de syntaxe de requête, ils ont le plus grand mal à produire de façon fiable et ergonomique les états dont nous avons besoin. Par exemple :
– dresser une liste de tous les documents en libre accès d’un espace, ordonnée en fonction du nombre de prêts constatés l’année précédente ;
– établir la même liste ordonnée selon les cotes validées
–  produire l’état de tous les livres prêtables édités il y a plus de X années et n’ayant connu aucun prêt au cours de l’année précédente.
– etc.
Un collègue d’université m’écrivait encore récemment en déplorant cette déficience, et je me suis rendu compte que je ne vous avais jamais entretenu d’un « outil » que nous avons mis en place il y a 6 ans à la Bibliothèque de Lyon (quelque temps après mon arrivée… et à la suite de mes identiques fureurs – comme responsable de l’évaluation –  devant les insuffisances des outils autorisés par notre SIGB).

De quoi avons-nous besoin ?

Est-il vraiment indispensable de demander aux SIGB de répondre simultanément à toutes les exigences de la gestion bibliothécaire et à toutes les recherches hétéroclites de nos usagers ? Lorsqu’il s’agit de poser les contextes des recherches de ces usagers dans un cadre explicite, ou encore lorsqu’il s’agit de modifier une donnée ou un champ dans une notice ou un statut de document, c’est évidemment indispensable. Mais lorsqu’il s’agit de faire le point sur l’état à la fois global et détaillé de la collection et de son activité, et de pouvoir travailler sur cet état, la réponse peut être plus nuancée. Alors, si le lecteur est volontiers braconneur, le bibliothécaire peut aussi contourner les problèmes par des chemins de traverse…

Bien sûr, pour ces états sont nécessaires tous les éléments constituant les notices bibliographiques à laquelle sont rattachés chacun des exemplaires, mais également toutes les informations relatives à ces exemplaires particuliers (prêtables ou non, statuts – disponible en rayon, en cours de prêt, en commande, en reliure, compteur totaliseur des prêts, etc.), comme le comptage des prêts que ces ‘exemplaires ont connus au cours de l’année. Toutefois, en a-t-on besoin en permanence ? Doit-on impérativement contrôler cet état au jour le jour ? Thierry Giappiconi en a réalisé une version à Fresnes, et c’est une bonne chose, limitée à quelques items. Mais au fond, l’analyse de la collection est une opération ponctuelle, qui réclame un minimum de recul et tolère un décalage avec le ‘temps réel’.

C’est sur ce décalage, contraint par les rythmes d’activité de la bibliothèque autant qu’incitant à cadencer ces activités, que nous avons joué. Chaque début d’année, donc, les bibliothécaires reçoivent une matière brute et figée, mais riche, organisée et surtout malléable : l’état détaillé des collections (et de leur activité passée) proposées aux publics dans chacun de leurs espaces respectifs… Mais chaque année seulement (la tâche est lourde, et mobilise autant les ressources d’un informaticien que de la ressource machine), sauf exigence majeure subite.

De quel fichier disposent les bibliothécaires ?

Eh bien, ce fameux catalogue malléable est tout simplement un fichier Excel dont chaque ligne correspond à un exemplaire, les différentes colonnes proposant titre, auteur, éditeur, année d’édition, numéro de notice bibliographique, numéro de code-à-barres, statut au moment T de l’extraction (disponible, en prêt, en commande, en reliure, etc.), catégorie documentaire (livre prêtable ou non, DVD, disque…), nombre de prêts sur l’année écoulée, nombre de prêts depuis l’entrée de l’exemplaire dans la collection (en fait depuis l’implémentation du SIGB actuel, soit au plus loin mi 1999). Bien entendu on trouve aussi indice (et, par agglutination automatique d’indices, libellés de sujets, et par agglutination de sujets domaine de contenu), cote validée, etc.


Comment ces fichiers sont-ils produits ?

C’est évidemment l’étape la plus complexe. Elle procède de manipulations non propriétaires aux SIGB, mais exige une vraie compétence informatique. Je n’ai pas la prétention d’en pratiquer les arcanes, et c’est un informaticien attentif et expert qui en maîtrise le subtil et délicat  processus… Je ne suis ici qu’un perroquet qui retranscrit ce processus (Merci Christian !!) :

  • Tout d’abord, il faut pouvoir exporter la base de données bibliographique et la base des exemplaires en format ISO 2709. Ce fichier passe par une moulinette (j’adore ce récurrent raccourci informatique !smileys Forum) qui va transformer le fichier ISO en fichier ASCII. Sur ce dernier, on applique un script Awk pour sélectionner les champs pertinents, puis un second script Awk pour traduire les indices Dewey implémentés en sujets et domaines. Et voilà un premier fichier.
  • Deuxième opération : parmi les solutions possibles, si on dispose de Crystal Reports – parfois fourni avec le SIGB – ou d’un outil similaire, on peut opérer des requêtes SQL sur les tables d’exemplaires du SIGB pour extraire les données du  compteur des « prêts à vie » (total des prêts qu’a connu l’exemplaire). Et on a un deuxième fichier.
  • Troisième opération :  sur le même principe, on lance des requêtes SQL sur la table des prêts pour en extraire le nombre de prêts annuels. Et voilà un troisième fichier.
  • Les 3 fichiers ont en commun le numéro de code à barres de chaque exemplaire, et pour certains le numéro de séquence de chaque notice bibliographique. Cela va autoriser des requêtes MySQL croisées, pour produire des fichiers .txt exportés ensuite en Excel, puis mis en forme. Ces requêtes MySQL restreignent notamment l’étendue de la requête (ici une restriction par localisation des documents concernés). Attention : chaque sélection doit respecter les limites d’Excel : 65 536 lignes et 256 colonnes pour Excel 2003  (avec Excel 2007, on peut atteindre 1 048 576 lignes et 16 384 colonnes, mais alors le fichier, s’il est entièrement renseigné, risque de requérir la puissance d’un ordinateur de Météo-France pour pouvoir être simplement ouvert !smileys Forum), soit pas plus de 65 536 documents et pas plus de 256 champs, et que par ailleurs chaque cellule ne peut excéder 255 caractères (on oublie l’export des résumés… même avec Excel 2007 : la limite par cellule reste inchangée !). On va donc éventuellement  appliquer des requêtes restrictives par sous-localisation, support, sujet,  etc., (c’est là que le bibliothécaire doit signaler les segmentations pertinentes) jusqu’à obtenir des fichiers Excel manipulables.

Comment sont-ils utilisés ?

Comme j’ai pu le constater, ce « catalogue Excel » est accueilli comme le messie. Les bibliothécaires vont pouvoir trier, filtrer, établir des tableaux croisés dynamiques, copier des sélections, extraire des états partiels selon le statut ou le sujet, etc., bref gérer la réalité de leur collection, cette fois-ci sans nulle soumission aux contraintes des requêtes au SIGB smileys Forum. Par exemple  et pour me limiter aux opérations les plus couramment effectuées :

  • déterminer les titres candidats au désherbage (absences de prêts l’année écoulée et, pour les livres, date d’édition)
  • calculer pour les livres l’âge moyen ou médian dans chaque domaine
  • vérifier l’état de la collection pour chaque cote validée
  • même repérer les erreurs grossières de cotation ou de champs remplis mal à propos dans le catalogue ou les données d’exemplaires  (Excel est impitoyable de ce point de vue : un simple tri met en évidence les aberrations)
  • etc.

Un tel fichier peut également servir de base de travail pour l’analyse et le traitement prévisionnel de la collection d’une bibliothèque appelée à déménager en de nouveaux locaux et à renouveler ses fonds en libre accès. Vous avez un extrait d’un de ces catalogues ici.

Quelques astuces, accompagnements et contraintes…

L’intérêt majeur d’un tel fichier exporté au format Excel réside en sa plasticité qui, associée à la puissance des outils de calcul dudit Excel, met vraiment l’ensemble d’une partie du catalogue – celle qui intéresse le bibliothécaire à un moment T – sous la main du professionnel, et lui permet d’agir. Je sais qu’en l’occurrence je parle ici  d’un applicatif spécifique et propriétaire, Excel, mais j’imagine qu’on pourrait inventer des procédures similaires avec Open Office ou d’autres logiciels. A vous de dire…

(ouvrons une parenthèse) Pour ceux qui ne l’auraient pas remarqué, j’apprécie beaucoup Excel, pour quatre raisons :
1.  Le temps me manque pour explorer les arcanes de multiples outils alternatifs… et puis zut, je reconnais mes limitations technologiques !!
2.  Excel est installé nativement sur tous les postes professionnels de la bibliothèque où j’exerce (pack office) ;
3. Je crois indispensable que les agents soient maîtres de leurs outils, et qu’ils puissent manipuler les données de la façon la plus ergonomique ;
4. Enfin, raison majeure, Excel présente l’énorme atout d’être un couteau suisse du traitement des données : je parle ici du catalogue, mais j’ai évoqué ailleurs le traitement des réservations en cours, la gestion des plannings, les pointages de livraisons de libraire, comme j’aurais pu parler du suivi prévisionnel des acquisitions,des traitements statistiques, …

Un bon outil doit proposer une grande capacité de polyvalence de situations : dans les premières formations Excel organisées  auprès des agents, j’avais demandé qu’on commence par l’établissement de la feuille de paye de la nounou (maintenant, tous les outils sont en ligne)… Soyons maîtres de nos outils, mais plus la bibliothèque est grande et les compétences inégales ou diverses, et plus il faut proposer, pour autoriser l’exercice effectif de cette maîtrise, des couteaux suisses (pas si) rudimentaires mais (vraiment) polyvalents (fin de la parenthèse).

Toujours est-il qu’on ne balance pas des données brutes, fussent-elles sous Excel, à des collègues sans les accompagner. J’ai parlé de formation : c’est sans nul doute nécessaire, mais à condition de l’étayer abondamment par des accompagnements personnalisés, la mise en place de référents logiciels, et surtout de tutoriels les plus pédagogiques possible.
Ces tutoriels ne sont pas que techniques. Au contraire, ils doivent s’appuyer sur des situations appuyées sur des préoccupations professionnelles : par exemple, sur quels critères (et pourquoi) établit-on une sélection des titres de livres à désherber ? Que signifient un âge moyen et un âge médian dans le cas d’une collection d’imprimés ? Dans quel ordre procéder pour sélectionner les items adéquats ? Etc. L’outil n’est rien sans documentation professionnelle et accompagnements persistants.

Comment ce « catalogue Excel » s’articule-t-il avec les acquisitions régulières ?

L’avantage d’utiliser souvent Excel, c’est que ça permet de combiner plusieurs outils conçus avec   ce même Excel pour divers processus distincts. Les bibliothécaires disposent par ailleurs d’un fichier « tableau de bord des acquisitions », à la fois objectif annuel d’acquisitions et tableau de bord en temps réel du suivi de leurs acquisitions courantes. Ce fichier Excel comportant lui aussi une feuille avec une ligne par titre acquis, il n’est pas trop difficile, au prix de quelques copier-coller, d’établir un état par exemple à mi-parcours (en été) combinant la collection existante une fois désherbée et les acquisitions engagées, afin de vérifier les manques, les déséquilibres, etc., et donc de se mettre en mesure de les rectifier…

Est-ce une solution idéale ?

Non, bien sûr, ce n’est pas idéal, dans la mesure où, au fur et à mesure que l’année avance, l’absence de temps réel rend la gestion de ce ‘catalogue Excel’ – même combiné avec le fichier Excel des acquisitions – , plus hasardeux et moins pertinent. Mais c’est en tout cas bien plus efficace que l’attente millénariste du module de SIGB miraculeux qui viendrait résoudre toutes les angoisses, surtout si la production du fichier Excel est régulièrement regénérée.

Et puis, je crois que l’instantané que représente chacun de ces fichiers bruts est non seulement une excellente occasion offerte à tous les collègues de faire un temps d’arrêt sur ‘leur’ collection,  mais aussi une pédagogique opportunité de s’emparer de ses caractéristiques listées, de les trier, combiner, manipuler, etc. Certains d’entre eux vont jusqu’à vérifier l’évolution de leur fonds par juxtaposition de traitements successifs de leurs états annuels, pour réfléchir à l’évolution de l’offre qu’ils présentent à leurs visiteurs… Bref, on autorise ainsi ce dont nous manquons trop souvent : une mise en perspective, une prise de recul, un temps de réflexion au sein du flux pressant et continu des acquisitions, des emprunts, des questions des visiteurs, etc.

A souligner : trop peu de SIGB proposent nativement une exportation de requêtes MySQL des bases de données. A ma connaissance, seul Papyrus2000 propose nativement (donc sans toutes ces manip’, mais seulement pour petites et moyennes bibliothèques) à la fois export de la base et export de requêtes spécifiques via MySQL vers des fichiers Excel. Mais je ne suis pas expert en la matière… En connaissez-vous d’autres ? Et, si ça se trouve, vous êtes des centaines à pratiquer ce type d’export ?! Témoignez !!
Et sinon, chers collègues membres des clubs d’utilisateurs de SIGB, qu’attendez-vous pour imposer (proposer instamment ?) à vos fournisseurs l’ajout d’une telle procédure, ergonomique, indispensable à la gestion et à la maîtrise des données de vos établissements ?

Publicités

5 commentaires »

  1. Bonjour

    Comme il est si bien dit… on ne peut pas demander la Lune aux concepteurs de SIGB, ni de développer chaque particularité propre à toute bibliothèque, voire à tout bibliothécaire.

    Par contre, le minimum, c’est l’exportation des requêtes/recherches au format Excel, ou avec séparateur « ; » (CSV), afin de pouvoir travailler ces données par soi-même.

    Que l’on travaille sur Excel ou sur une base de données (ou Word pour trier les tableaux), c’est effectivement un minimum.

    Comme devrait être un minimum de proposer cette exportation aux lecteurs, afin de mieux préparer leur venue à la bibliothèque (sans avoir besoin de copier-coller et retravailler les données du catalogue 😦 )… mais c’est presque un autre sujet. Encore que… tout est lié.
    Ce que je veux obtenir, je peux l’offrir. Ce que je veux offrir, je l’obtiens.

    De toute façon, ces données étant déjà au format « base de données », elles devraient pouvoir être accessibles de manière claire et naturelle par d’autres outils.
    L’extraction n’est qu’un outil parmi d’autres.

    On ne peut pas demander la Lune aux concepteurs, mais l’intelligence du partage.

    Est-ce possible d’obtenir la même chose auprès des bibliothécaires ?
    Le partage de leurs données : les 100, les 1000 – suivant taille de la bibliothèque – meilleures sorties pour chaque année. (Par domaine ? Cote)

    Histoire de réfléchir, en petite/moyenne(/grosse ?) bibliothèque – ou en tant que lecteur -, les acquisitions « opportunes », ces documents que l’on n’a pas vus (quand on est seul), mais qui pourraient être intéressants pour nous-mêmes ou nos lecteurs.

    Car, si nous-mêmes sommes incapables de produire/offrir des documents pour nos publics, comment demander aux concepteurs de SIGB des modifications pertinentes.

    Comme celles de rendre public le nombre de prêts d’un document, le nombre de réservations placées dessus. Et combien d’autres qui ne sont pas nominatives. (dont les catégories socio-professionnelles, un tag parmi d’autres)

    L’intelligence du partage remonte beaucoup plus haut qu’il n’y paraît.

    Et reporter la faute sur les seuls concepteurs de SIGB me paraît aussi une défausse particulièrement récurrente en bibliothèque. 🙂

    A nous de savoir ce que nous voulons, et ce sera inscrit au cahier des charges !

    Bien cordialement
    B. Majour

    Commentaire par B. Majour — vendredi 5 mars 2010 @ vendredi 5 mars 2010

  2. Bonjour Bertrand,
    J’apprécie beaucoup ta présentation et j’espère qu’elle aidera nos collègues. Lors de mes stages Pol Doc, j’ai rencontré de nombreuses bibliothèques qui pratiquaient ce système d’extraction des données sur Excel. Avec toutes les difficultés qu’elles ont rencontrées au début (Surtout des BU : Montpelier sciences, Biusj, Paris 8…). je le préconise systématiquement mais je me heurte aux différences de niveaux des bibliothécaires à manipuler Excel ou d’autres logiciels de même type.
    Et puis ensuite viens le moment de l’analyse et de l’interprétation des résultats et là il y a une véritable incompétence (voir frayeur vis à vis des chiffres) d’un certains nombre de nos collègues. D’où l’intérêt de faire des formations à l’interprétation des statistiques et à continuer un accompagnement, un tutorat dans les établissements.
    Joëlle

    Commentaire par Joëlle Muller — jeudi 11 mars 2010 @ jeudi 11 mars 2010

  3. Un détail pour répondre à une observation qui m’a été faite – ailleurs – sur le processus de production de ce fichier Excel : pour les étapes 2 et 3 signalées plus haut, il s’agit de requêtes SQL au sein du SIGB ; pour la 4e étape, il s’agit bien de requêtes MySQL : on n’est plus dans le SIGB, mais avec des données extraites et ‘autonomes’.
    Sur un autre point, je ne sais pas si le SIGB Papyrus2000 que je signale est encore sur le marché : il n’apparait pas dans l’état annuel de Marc Maisonneuve (Tosca Consultants) : quelqu’un a des infos ?

    Commentaire par bcalenge — jeudi 11 mars 2010 @ jeudi 11 mars 2010

  4. […] Gérer concrètement une collection : une solution pratique […]

    Ping par Un rêve : un module informatisé d’évaluation des collections « Blog de veille bm — jeudi 18 mars 2010 @ jeudi 18 mars 2010

  5. Awk est un super outil, le vrai couteau suisse pour ceux qui comme nous travaillent sur des données textuelles.

    J’irais même plus loin sur l’accès aux bases de données, combien de fournisseurs de SIGB donnent le schéma relationnel de leur base ? A ma connaissance, pas des masses… Combien sommes nous à pratiquer une sorte de reverse-engineering pour comprendre comment ça marche et arriver à nos fins ?

    Commentaire par François Lemarchand — samedi 17 avril 2010 @ samedi 17 avril 2010


RSS feed for comments on this post. TrackBack URI

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s

Créez un site Web ou un blog gratuitement sur WordPress.com.

%d blogueurs aiment cette page :