28 novembre 2006

Google Book Search et numismatique : les associations de livres

Naïvement, j'écrivais dans un précédent billet : "je suppose qu'à terme, on peut s'attendre à ce que les ouvrages possédant les mêmes "mots et expressions clés" soient reliés entre eux d'une manière ou d'une autre."
Ce n'était pas le cas sur l'exemple pris dans le billet en question, sur le traité d'Engel et Serrure. Mais ça l'est en revanche (et peut-être depuis longtemps ?), par exemple, sur un article publié par la Société nationale des Antiquaires (retrouvé avec la recherche "Saint-Gilles Agnus Dei") : pour ce document trois autres "Livres sur des sujets connexes" sont proposés.
Et je suppose qu'ils sont en lien avec la liste des termes clés.
Je note d'ailleurs que la présentation est différente : cette liste de mots clés n'est pas cliquable, et ne se trouve pas au même endroit. Pour quelle raison ?

Par ailleurs, désormais, avec Zotero, déjà mentionné, il est possible de faire une recherche dans Google Book Search et de récupérer automatiquement les notices sur une liste de résultats.
Par exemple avec la recherche suivante apparaît dans la barre d'adresse une icône "Répertoire" :

Et si je clique sur l'icône en question, un encart s'ouvre, où je sélectionne les notices dont j'ai besoin.

Les catalogues comme Worldcat me permettent déjà cela pour les livres. Mais ainsi j'ai aussi la possibilité de récupérer des notices d'articles, et me constituer rapidement des bibliographies sur un sujet (évidemment, n'ayant pas toujours accès au texte, à charge ensuite de me procurer le document d'une manière ou d'une autre, soit en ligne sur Gallica ou Persée, soit en bibliothèque). Car en terme de bases de données en sciences humaines, tout le monde n'a pas accès à Francis (c'est payant!), qui n'est en soi pas suffisante. Et le catalogue de la bibliothèque de l'American Numismatic Society ne va pas très loin non plus (et ne permet pas cette récupération de notices).

Libellés : , , ,

26 novembre 2006

Une "introduction à la numismatique ancienne" : résultat mitigé

Découvert grâce à Wikio, moteur d'actualités, sur lequel j'ai récupéré le fil RSS de la recherche "numismatique" : les deux premières parties d'une introduction à la numismatique ancienne sur Citadelle, site consacré à l'histoire médiévale. La seconde partie, "Dénomination des monnaies", m'a paru très intéressante. En effet la pratique et l'habitude fait souvent oublier aux numismates qu'ils se servent souvent pour désigner leurs monnaies de termes souvent postérieurs à 1800, recréés par les premiers collectionneurs ou historiens intéressés par cette source.
L'article fait notamment appel à l'ouvrage d'Adrien Blanchet (dont je rappelle qu'il est désormais en ligne, sur Gallica), et je déplore d'ailleurs une utilisation des notes de bas de page qui n'exploite pas les possibilités de la mise en ligne : il faut faire glisser l'ascenseur vertical pour aller voir la référence, au lieu d'un lien hypertexte vers ce bas de page (et d'un autre lien dans la note, pour remonter), ou mieux encore, une info-bulle quand on passe la souris sur le numéro de note.
Mais là n'est pas la question.
La description des exemples donnés n'est pas très scientifique (description des types, puis description des légendes, avec transcription en français), mais comme la page ne s'adresse pas à des scientifiques, cela n'est pas gênant.
L'article a pour objectif d'éclairer des historiens (débutants ?) dépouillant des archives, et tombant sur des noms de monnaies. Je regrette d'ailleurs qu'il n'y ait pas un index, ou un sommaire, en début de page, donnant une liste rapide des monnaies décrites : ce procédé facilite grandement la navigation en donnant une "photographie" synthétique rapide. Par ailleurs, si la localisation des monnaies est systématiquement donnée (il me semble), la datation chronologique ne l'est pas autant.
Certaines monnaies sont illustrées (photos Bibliothèque nationale de France). Pour les autres, un lien vers une monnaie sur CoinArchive.com aurait sans doute été utile.
Pour certaines monnaies, on donne curieusement une estimation en francs, non pas de la valeur marchande actuelle, mais du pouvoir d'achat représenté à l'époque par la pièce. Ce procédé, davantage prisé à l'époque de Marc Bloch que chez les historiens contemporains, me paraît assez risqué : d'abord, nous sommes passés à l'euro ; ensuite, le pouvoir d'achat du franc, au temps de son existence, a lui-même considérablement varié. Si l'on tient à donner une notion de cette capacité d'achat, il me paraît plus prudent d'expliquer ce que cela permettait d'acheter (en fruits, en animaux, etc.). Même si, évidemment, les valeurs respectives des denrées et biens mobiliers ont elles-mêmes considérablement variées entre elles depuis cinq siècles...
Je note aussi, et je ne vois pas de raison à cela, que toutes les références bibliographiques données en bas de page sont antérieures à 1900. Or, justement sur la question de la dénomination des monnaies, la recherche a beaucoup progressé, et qu'il existe désormais plusieurs dictionnaires numismatiques plus à jour, ainsi que l'excellent Numismatique médiévale de Françoise Dumas et Marc Bompaire.
Bref, c'est une première bonne approche de cette question, mais je trouve dommage de sous-exploiter ainsi les possibilités d'internet, avec si peu de liens (par exemple d'une monnaie à l'autre : il est clair que les drielander et les vierlander vont ensemble, même si l'ordre alphabétique les sépare).
La question que cet article me pose, c'est : une telle page, dont le contenu reste intéressant, est-elle encore pertinente à l'heure actuelle ? A titre de comparaison, la Wikipédia permet de ranger tout article dans une ou plusieurs catégories. Le sequin, par exemple, listé dans cette page, est rangé sur la Wikipédia dans la catégorie "Monnaies médiévales", qui comprend 22 articles.
Pour une meilleure diffusion de l'information scientifique, ne vaudrait-il pas mieux enrichir ce genre de pages obtenues automatiquement, que l'article cité ici, statique mais qui relève 67 dénominations ?
L'article est rédigé au sein d'une revue en ligne, et il ne s'agit pas de remettre en question la légitimité de revues en ligne au profit des bases de données. Mais les pages web sont-elles faites pour éditer des listes, quand celles-ci peuvent être obtenues autrement ? La première partie de cette Introduction à la numismatique ancienne est un article plus linéaire, explicatif, méthodique, a (à mon sens) beaucoup plus d'utilité que la seconde.

Libellés : ,

25 novembre 2006

Première implémentation de Pleade pour les monnaies


Voilà la première adaptation/appropriation de Pleade, pour les monnaies. De nombreuses choses sont encore à revoir (ça se voit sur cette copie d'écran), mais c'est déjà un début.
Il me manque encore une connaissance réellement approfondie de Pleade pour obtenir tout ce que je souhaite, et éviter certains bugs (des écrans d'affichage vides, etc.). De toute façon, toute la documentation est en ligne, et je finirai bien par en venir à bout.
Parallèlement, je travaille au mode de conversion automatique Word --> EAD.
Pour Pleade, il faut reprendre
  • La recherche avancée, afin de disposer de formulaires appropriés.
  • L'affichage des listes de résultats, où actuellement la notion hiérarchique (ensemble > sous-ensemble > sous-sous-ensemble) est trop fortement visible et ne correspond pas aux pratiques propres aux collections monétaires.
  • L'affichage des résultats proprement dits. A terme, il faudra générer automatiquement des rebonds vers d'autres monnaies. Par exemple, pour ce "gigliat" d'Hélion de Villeneuve :
    • un rebond vers les autres monnaies de ce grand maître de Malte
    • un rebond vers l'ensemble des gigliats de la base
    • un rebond vers d'autres bases (une définition de ce qu'est un gigliat, si elle existe quelque part sur un dictionnaire en ligne, etc.)
    • un rebond vers les autres monnaies de la base ayant le même type au droit, ou le même type au revers
    • un rebond comportant la même légende au droit, ou au revers.
    • etc.
Pour le dernier exemple donné, ça implique que la légende soit explicité en mode non affiché, afin de ne pas être gêné par les abréviations et la ponctuation. Par exemple "Hospital Sancti Johannis" est un libellé plus intéressant que HOSPTAL SCI IOhIS (pour précision : les points d'interrogation dans la légende correspondent à des caractères spéciaux qui ne parviennent pas à être reconnus. Encore une question à traiter).

Libellés : , ,

24 novembre 2006

Google Book Search et numismatique

J'ai appris incidemment que Google Book Search avait rénové son interface. Je suis donc allé voir le résultat. Et il me semble que les évolutions du moteur tendent à le faire de plus en plus ressembler à une bibliothèque numérique.
Sommairement, les reproches des professionnels de la documentation concernant Google Book Search, étaient motivés par (outre la jalousie) le fait que c'était "une base de livres", mais non une bibliothèque, en ce sens qu'une bibliothèque numérique doit aussi proposer d'autres modes de navigation dans les collections que le seul moteur de recherche.
En bibliothèque (papier), il existe le catalogue, bien sûr, mais les études diverses montrent généralement que moins de 10 % des lecteurs s'en servent, voire connaissent leur existence. Et même ceux qui l'utilisent aiment aussi parcourir les rayons, à la recherche d'une idée fortuite et lumineuse.
Google avait déjà amorcé son évolution avec Google Literacy, porte d'entrée dans Google Book Search, orientée littérature.
Les fonctions de recherche (simple et avancée) n'ont semble-t-il pas été modifiée.
Les fonctions de consultation d'un document ont été enrichies :
  • Zoom : cliquez sur les boutons zoom in et zoom out pour adapter la taille du texte à votre vue, ou pour agrandir une image présente sur une page.
  • Lecture continue : arrivé à la fin d'une page, vous étiez obligés de cliquer sur le bouton "suivant" pour afficher la page suivante. Désormais les autres pages se chargent dynamiquement, vous n'avez plus qu'à utiliser l'ascenseur (ou barre de défilement) ou vous déplacer dans la page de la même manière que vous le faites sur Google Maps (cliquer-déplacer).
  • Mode double-page : un clic sur le bouton two page button suffit pour lire le livre... comme un vrai livre.
  • Plein écran : cliquez sur le bouton fullscreen button et le livre occupera une plus grande partie de l'écran. Très pratique pour la lecture !
  • Citations et références : découvrez quels livres font référence à un livre en particulier, et tous les livres qui abordent le même thème.
  • Publicité : et oui, la pub.. celle-ci est affichée dans un léger bandeau en bas de la page.
Si je cherche par exemple les livres d'Engel et Serrure (je pense surtout évidemment au Traité de numismatique du Moyen Age, non encore accessible sur Gallica), les premiers résultats sont les 3 tomes du Traité (en aperçu limité, d'ailleurs, ce qui me rend bien malheureux). Si je clique sur le premier (je note au passage que la page ne s'affiche pas avec Firefox -- un bug passager, j'espère), j'obtiens sans difficulté la page de titre et le sommaire. Je note au passage que l'ouvrage (papier) ne propose pas d'index, si bien que Google Book Search, qui me propose une recherche dans le texte, peut me servir d'index sur l'ouvrage (pour localiser l'usage d'une légende, etc. L'index global se trouve dans le tome 3).
La navigation dans les pages est facilitée par la colonne latérale droite permanente.

Ce qui m'intéresse ici, ce sont les fonctions de navigation dans la collection (si l'on considère qu'il y a une collection, notion qui, chez les "pros", nécessite une politique documentaire consciente). En effet en cliquant sur "A propos de ce livre", j'obtiens une description de l'ouvrage, qui contient comme avant des liens vers "Acheter ce livre", "Recherche de bibliothèques", "Rechercher dans ce livre" et les pages accessibles sans problème.
Surtout, on trouve bien en évidence une liste de mots-clés, une indexation du document.


Pour Engel et Serrure, voici cette liste :
monnaies, fig fig, monétaire, moyen âge, triens, deux lignes, monogramme, aujourd hui, deniers, légende circulaire, monnayage, première partie, revers, lignes séparées, numismatique.

Et ça, il me semble, ce n'était pas dans la version précédente. On voit dans par exemple dans cette liste le terme "aujourd'hui" (?). La liste est clairement automatisée, et part du contenu du document. D'ailleurs, si on clique sur l'un des mots -- contrairement à ce qui se passe pour un catalogue de bibliothèque -- on n'obtient pas d'autres ouvrages, mais des pages dans ce document. L'algorithme produisant cette liste fait donc ressortir les termes les plus employés.
En tant que tel, c'est donc un outil de consultation et non de navigation.
Mais je suppose qu'à terme, on peut s'attendre à ce que les ouvrages possédant les mêmes "mots et expressions clés" soient reliés entre eux d'une manière ou d'une autre. Alors on se rapprochera progressivement du concept de bibliothèque, d'une manière de ranger les livres cote à cote, non pas à la manière des bibliothécaires sur une étagère, mais comme un système de tagging.
Par ailleurs, pour accéder à une page à l'intérieur du document, j'ai été obligé de m'authentifier avec mon compte Gmail. Donc Google va sans doute garder trace de mes consultations. Et on obtiendra ainsi le service de suggestion "Ceux qui ont consulté ce document ont aussi consulté...".

Libellés : , ,

11 novembre 2006

Exemple de monnaie encodée en EAD

J'ai fait quelques tests, pas définitivement satisfaisants, pour encoder une description de monnaie en EAD. Une fois définie la destination, tout est obtenu automatiquement par conversion.
Ce n'est pas très satisfaisant pour la qualification des informations : manière d'indiquer que telle face est l'avers, et non le revers ; que telle information est une légende.
L'intérêt est différent pour la distinction avers/revers, et l'indication de légende.
Indiquer que c'est un avers ou un revers permet notamment de produire des affichages différents, si le besoin s'en fait sentir (pour permettre une lisibilité plus grande). En revanche la recherche d'un type se fera indifféremment sur l'avers ou le revers (sauf à définir clairement ce qu'est l'avers, ce qu'est le revers, or cela n'est pas toujours simple).
L'indication de légende permet de cibler une recherche uniquement sur le contenu des légendes. En outre, on peut en plus de la retranscription de la légende, fournir en texte caché une version "développée" de cette légende (MAX GALL serait développée en Maxima Galliarum, et l'internaute pourrait chercher "Maxima Galliarum").
Il faudrait repenser cette qualification de l'information (ce qui suit est un avers ; ce qui suit est la légende de cet avers) avec l'évolution de la DTD EAD d'une part, qui, devenue un schéma, permet l'insertion d'attributs non EAD.
En outre, je n'ai pas pensé à utiliser l'attribut autorisé pour tout document XML : xml:type, qui pourrait rendre également de grands services.
Le plus important serait certainement de mener une réflexion au niveau international, pour éviter des choix différents.
[j'ajoute qu'évidemment une telle notice est comprise dans un ensemble plus vaste contenant l'intégralité de l'inventaire. Mais les informations qui chapeautent la description d'une monnaie posent beaucoup moins de problèmes d'encodage]
<c level="item">
<did>
<unitid>De Voguë 1096.</unitid>
<unittitle>Gros d’argent. 1305-1319.</unittitle>
<unitdate>1305-1319.</unitdate>
<physdesc>
<physfacet type="metal">AR.</physfacet>
<dimensions type="weight">4,03 g.</dimensions>
<dimensions type="angle">5 h.</dimensions>
</physdesc>
</did>
<bibliography>
<bibref>S., IX, 16 ; M. 19, p. 296.</bibref>
</bibliography>
<c level="otherlevel" otherlevel="avers">
<did>
<abstract/>
</did>
<scopecontent>
<p>+ FR [.] FVLChO [.] D [.] VILLRTO [.] DI
[.] GRA<expan>...</expan>
</p>
<p>Le Grand Maître à g.,
agenouillé devant une croix haute à double
traverse posée sur trois degrés et accostée
de A et ω ; sous le piédestal, le crâne d’Adam ;
[.] IRL [.] dans le champ.</p>
</scopecontent>
</c>
<c level="otherlevel" otherlevel="revers">
<did>
<abstract/>
</did>
<scopecontent>
<p>+ IhERIL’[.] RODI En légende extérieure :
+ MRO [.] hOPITAL’I 9VET SCI [.]
IOhIS<expan>...</expan>
</p>
<p>Croix pattée.</p>
</scopecontent>
</c>
</c>

Les informations s'affichent selon les exigences de l'EAD, et non dans l'ordre dans lequel elles apparaissent pour un inventaire de monnaies : par exemple la cote (ici : Voguë 1096) apparaît en premier. C'est la logique archivistique. Mais cela n'a aucune conséquence sur le mode d'affichage à l'écran.
Avec une feuille de style appropriée, cet encodage pourrait s'afficher sur Internet par exemple comme ceci :

Gros d’argent. 1305-1319.

+ FR [.] FVLChO [.] D [.] VILLRTO [.] DI [.] GRA
Le Grand Maître à g., agenouillé devant une croix haute à double traverse posée sur trois degrés et accostée de A et ω ; sous le piédestal, le crâne d’Adam ; [.] IRL [.] dans le champ.

Rev : + IhERIL’[.] RODI En légende extérieure : + MRO [.] hOPITAL’I 9VET SCI [.] IOhIS
Croix pattée.
AR. 5 h. 4,03 g. De Voguë 1096.
S., IX, 16 ; M. 19, p. 296.

Je n'ai malheureusement pas la reproduction d'une telle monnaie. Mais vous la trouvez sur CoinArchives.com

Gros d'argent de Foulques de Villaret, grand maître de l'ordre de Saint Jean de Jérusalem

Libellés : ,

08 novembre 2006

Gallica et les 10.000 nouveautés

Je reviens un peu sur ce que j'ai dit : si j'ai bien compris, dans les 10.000 nouveautés listées pour septembre et octobre 2006 ne contiennent que des titres de journaux.

Auquel cas cette liste redevient pertinente, puisque ça constitue des séries dans lesquelles on peut rapidement voir si le journal paru le jour de la naissance de son grand-père a été numérisé.

Mais de deux choses l'une : soit cette liste contient aussi quelques monographies, perdues au milieu, et qui sont alors in-repérables (irrepérables ?) ; soit elle ne contient que des journaux, et ce serait bien de le dire.

Je n'avais pas remarqué une chose : les listes ainsi produites le sont dynamiquement (j'étais un peu inquiet là-dessus, me voilà rassuré) : l'URL derrière ces pages interroge directement le catalogue de Gallica, sur la base de la date : http://gallica.bnf.fr/catalog?QueryForm=/scripts/nouveautes.php&MAJ=200609* pour septembre. Donc aucun effort à faire pour les gestionnaires du site. Du coup, l'effort serait peut-être à porter sur la clarté de l'information.

Libellés : , ,

07 novembre 2006

Gallica : comment voir ce qui s'y passe ?

Comment savoir ce qui vient d'être numérisé ? Clairement : je n'ai pas la réponse.

C'est tout de même dingue que Gallica soit une des bibliothèques numériques les plus riches au monde, entièrement accessible et téléchargeable, et que l'on soit obligé de revenir régulièrement voir si le livre tant désiré a été enfin numérisé.

Aujourd'hui, Gallica propose à de grosses bases de données de récupérer ses notices (comme OAIster, auquel j'ai fait allusion ici), qui viennent les chercher périodiquement. Ce qui signifie

  1. Que les notices sont caractérisées par une date (ce serait dommage de venir toujours chercher les mêmes : les moteurs viennent récupérer les plus récentes depuis leur dernier passage).
  2. Que les notices sont caractérisées par un domaine de connaissance (ce serait dommage qu'une base de données en histoire des sciences se retrouve avec tout Victor Hugo).

Avec une date et une indexation, qu'est-ce qui empêcherait Gallica de se doter de fils RSS disciplinaires :

Je m'abonne au fil "Histoire" (ou mieux : "Numismatique", ou "Sciences auxiliaires de l'histoire"), et je n'ai pas à penser à vérifier tous les mois la liste des titres récemment numérisés (franchement, j'ai mieux à faire).

Tiens, par exemple : pour le mois d'octobre 2006, il y a 10000 titres, sur 100 pages. Sachant qu'un numéro du Figaro compte pour un et qu'il y a une vaste campagne de numérisation de la presse. N'empêche que les "grands classiques" de la numismatique que j'attends avidemment, seront peut-être perdus au milieu.

Pour rendre compte de leur activité mensuelle, Gallica a pris l'habitude de publier la liste des titres. Il y a un an, c'était 350 documents. Avec la masse numérisée aujourd'hui, cette liste n'a plus aucun sens (qui pourrait la parcourir ?). Cela prouve bien qu'il faudrait d'autres outils !

Donc, périodiquement, je relance les mêmes requêtes dans le moteur de Gallica. Pour rien, souvent.


Libellés : , ,

04 novembre 2006

J'ai installé Pleade sur mon PC ! Au fait, pourquoi ?

[Si les détails concernant l'installation de Pleade ne vous intéressent pas, voyez plus bas le pourquoi de la chose]
[Rappel : Pleade, c'est, pour simplifier, un outil permettant de gérer une base de documents en EAD, format XML permettant surtout de diffuser des inventaires d'archives]
Je suis très fier de moi. Pour rien, étant donné que d'autres, j'en suis sûr, n'ont eu aucun problème pour installer Pleade. Mais j'y passé plusieurs heures, et il s'est bien écoulé 24 h (ponctuées de pauses) entre la première seconde où je m'y suis mis, et le moment où tout est validé.
En effet le mode d'emploi qu'on trouve sur le site officiel semble dater un peu : il décrit plusieurs manipulations qui seront jugées plus ou moins complexes par les uns et les autres :
  1. Installation d'un Java Development Kit (JDK pour les intimes).
  2. Installation d'un serveur Tomcat
  3. Installation de SDX, moteur de recherche
  4. Installation de Pleade, application de SDX pour les documents EAD
Les problèmes que j'ai eus :
  • Sur le point 1 : il existe un nombre invraisemblable de produits proposés par Sun pour des environnements Java, machines virtuelles Java, etc. J'ai mis du temps à trouver le bon (en l'occurrence, le fichier téléchargé qui s'est avéré le bon s'appelait "j2sdk1.4.2_13").
  • Ensuite, SDX était plus ou moins reconnu par Tomcat, et Pleade pas du tout par SDX, pour des raisons Java que je n'ai toujours pas comprises (des messages d'erreurs à la pelle, plus désagréables à lire et aussi évocateurs que des injures dans une bande dessinée). Bref, ça n'allait pas. Jusqu'à ce que, au bout de plusieurs heures (comme ci-dessus mentionné), j'ai découvert qu'il existait un fichier Pleade.exe (à la place des fichiers zippés de Tomcat, SDX et Pleade), qui proposait, tout seul, d'installer au choix:
    • Pleade seul
    • Pleade avec SDX (donc en supposant que l'on a déjà installé Tomcat)
    • Pleade + SDX + Tomcat
La dernière solution était évidemment la bonne : je n'avais plus qu'à me laisser guider ensuite.
Donc voilà : c'est fait.

Au fait, pourquoi ?
En fait, depuis plusieurs années je suis convaincu que l'EAD est LA bonne solution pour proposer des bases de données de monnaies sur Internet. Deux raisons essentielles à cela :
  1. Faciliter pour générer les inventaires
  2. Affichage de séries.
En effet il y a deux choses qui me chagrinent dans les bases de données en ligne :
  1. les constituer représente un travail très long, d'autant plus que lorsqu'on veut publier parallèlement un catalogue il faut faire le travail deux fois : une fois dans le document texte (Word), une fois dans la base de données, avec un formulaire et des champs à remplir.
  2. Chaque notice est indépendante des autres, et il est impossible, sauf à refaire des requêtes dans le moteur de recherche, de naviguer dans une série de monnaies, une succession d'émissions.
Il me semble évident (mais de plus expérimentés peuvent me contredire) qu'on retrouve dans les collections monétaires une structure complètement similaire à celle des archives :
Dans les archives : Fonds > Série > Sous-série > Cote (carton) > Liasse > Pièce
(je ne connais pas grand chose aux archives, mais il me semble que c'est à peu près ce lexique)
Dans les médaillers : Fonds > Autorité (institution) > Autorité (personne physique) > Métal > Monnaie > Emission > Exemplaire
Par exemple, pour mon inventaire des monnaies de l'Ordre de Malte, on trouve (pour la première monnaie)
Orient Latin > Ordre de Malte > Rhodes > Foulques de Villaret (1305-1319) > Monnaies d'argent > Gros d'argent > Ex. 1.
On pourrait se servir de la référence comme indication d'émission (si plusieurs types de gros d'argent se succèdent) et de la cote pour identifier l'exemplaire.
Mettre ce fichier en EAD le rend interrogeable par le moteur de recherche de Pleade, en restituant la structure de l'ensemble, ce qui permet, une fois la monnaie trouvée, de naviguer dans l'ensemble des gros de ce Grand Maître, ou l'ensemble de ses monnaies d'argent, ou l'ensemble des monnaies des Grands Maître ayant vécu à Rhodes, etc. On peut remonter ou redescendre dans l'arborescence, de façon plus maniable que dans Poey d'Avant.

Quand à la facilité pour produire ce genre de fichiers EAD, c'est un gros problème, car peu en sont convaincus.
A l'heure actuelle, les institutions utilisant l'encodage XML le font avec des outils extrêmement lours à gérer (pour ce que j'en sais), qui finiront par faire regretter Intermarc.
Les logiciels permettant d'éditer de l'EAD montrent généralement les balises en clair, et un des meilleurs outils existant, ATES (appliqué sur un logiciel gratuit, XML Mind Editor), fournit tout de même un affichage complexe.
Or, pour les catalogues de monnaies, les fichiers sont généralement bien structurés, et il est beaucoup plus intéressant de partir d'un fichier Word stylé (ce que j'ai fait) pour travailler ensuite sur l'outil de conversion vers l'EAD.
Ainsi la personne qui catalogue ses monnaies ne passe pas plus de temps à le faire (sauf à apprendre ce qu'est une feuille de style Word ou OpenOffice), et c'est le technicien qui a la charge de produire le fichier XML.
Travailler sur la conversion et non sur la production, ça signifie notamment que plus il y a de monnaies, plus c'est rentable et plus on gagne du temps.

Cet inventaire de Malte, il m'a fallu une demi-heure pour le convertir en EAD propre, avec un script Perl imparfait. J'ai commencé à étudier l'export vers XML avec OpenOffice, et je suis déjà certain que les résultats seront beaucoup plus probants. A terme, il faudra sans doute 5 minutes pour partir d'un fichier Word (bien stylé, j'insiste -- mais savoir styler un document, c'est gagner du temps aussi) et obtenir un beau document EAD à mettre en ligne.

A mon sens, tous les outils d'édition de fichiers XML, comme Ates, ou PiXML (utilisé au Département des Manuscrits de la BnF, que je n'ai pas vu fonctionner), ne devraient servir qu'à la reprise des documents générés automatiquement. Saisir du XML au clavier d'ordinateur, c'est une perte de temps ENORME. Franchement, les responsables de collections monétaires et de fonds d'archives ont mieux à faire !

02 novembre 2006

Adrien Blanchet dans Gallica

Depuis des mois, je me demande qui, chez Gallica (la bibliothèque numérique de la BnF), choisit les titres à numériser pour la numismatique. Poey d'Avant n'y est toujours pas.
En revanche, grâce à OAIster et au fait que les notices de documents dans Gallica sont interrogeables par d'autres moteurs de recherches que celui de la BnF, j'ai découvert incidemment qu'Adrien Blanchet et son Manuel de numismatique du Moyen âge et moderne sont enfin accessibles en ligne !
Personnellement, j'aurais un tas d'autres suggestions. Mais il paraît que la BnF n'en sollicite pas. Alors attendons...

Libellés : , ,

La base bibliographique d'OpenOffice

Mon projet de communiquer ma bibliographie de thèse sur la numismatique médiévale française, au moyen d'OpenOffice, est un peu retardée, car j'ai découvert après quelques tentatives qu'actuellement, OpenOffice ne permet pas d'export des notices entrées dans sa base. C'est-à-dire qu'une fois rentrées, on peut les exploiter pour soi, dans son traitement de texte. Mais quant à les échanger !
Faut que je réfléchisse encore un peu à la manière de procéder la plus économique en temps et en énergie.
Il paraît que dans les développements à venir, ce sera une fonctionnalité proposée.

Un léger mécontentement

Rappelons que les fils RSS servent à transmettre les derniers nouveautés d'un site en temps réel, c'est-à-dire que le fichier XML est censé être enrichi automatiquement dès la création d'un nouvel article, afin de réduire l'écart de temps entre la création d'une information et l'alerte de cette info auprès des personnes intéressées.
Ce matin, j'ouvre naïvement mon agrégateur Bloglines et je découvre de nouveaux articles dans le fil RSS de la revue Histoire & Mesure. Le titre le plus récent en est : "Recent Sasanian Coin Findings on the Territory of Georgia".
Et je constate que les autres concernent également la numismatique -- et je suis ravi. Je vais sur le site, et découvre assez rapidement que le numéro signalé ainsi dans le fil RSS est le XVII, 3/4, datant de 2002 ; qu'il y a eu quatre numéros depuis ; et que le plus récent date du début 2006. Mais que le fil n'a pas été enrichi.
On dirait qu'ils font de la rétroconversion de fils RSS. Le truc qui ne sert à rien...
Garderai-je cet abonnement ou non ? J'attends de voir s'ils rattrapent le temps perdu... Juste pour rigoler un peu.

Mentions légales

MonnaieCe n'est pas un blog de collectionneur.
Je suis historien, un peu informaticien (j'adore les métadonnées !). D'où ce que vous pouvez lire ici.
Comme vous pouvez le constater, même si je le laisse en ligne, il n'est plus alimenté depuis longtemps.

Recherche sur le web numismate

Recherche dans les livres de numismatique de Google Book Search[...]

 

 

Généré par Blogger

Site Meter