Préliminaire
Dans le texte suivant comme dans l’interface du logiciel :
{TAB} désigne le caractère de tabulation (ou '\t')
{NL} désigne le passage à la ligne ; comme le passage à la ligne est traité différemment suivant les systèmes Windows, UNIX ou MAc, le saut de ligne désigne tout aussi bien les caractères '\n' (Unix), '\r' (Mac) que la succession '\r\n' (Windows).
Principe général
La saisie en masse permet de modifier la base de fiches à partir de données sous forme tabulaire (par exemple des données issues d’une base SQL classique ou d’un tableur). Comme tout outil qui permet de modifier une grande masse d’information en moins de trois clics, il est réservé aux administrateurs et à manier avec précaution : dans le cas de modifications importantes, il est conseillé de le tester sur une copie de la base et l’administrateur veillera à intervenir alors qu’il est le seul connecté. Ces précautions seront récompensées par l’énorme gain de temps que peut apporter la saisie en masse.
Le principe directeur de la saisie en masse est le suivant : travail des données hors ligne sous OpenOffice, copier-coller des données du classeur vers une zone texte d’un formulaire, ultime vérification et validation des modifications. OpenOffice est pris comme référence mais le travail peut se faire avec d’autres logiciels.
La page d’accueil de la saisie en masse (accessible via Administration > Saisie en masse) propose une série de saisie en masse pour des corpus ou des thésaurus : création de mots-clés, modification de champs, fusion, etc. Chaque saisie en masse a des options particulières cependant le cheminement est toujours le même :
1) Page d’accueil : choix du principal corpus ou thésaurus concerné et choix de la saisie en masse à effectuer
2) Page du formulaire de saisie en masse : configuration des paramètres propres à la saisie, « collage » des données tabulaires copiées à partir d’OpenOffice dans la grande zone de texte appelée « Texte »
3) Page de confirmation : affichage d’éventuels messages d’erreur, affichage des modifications qui vont être effectuées (avec le cas échéant le rappel des valeurs actuelles et la possibilité de faire d’ultimes modifications)
Séparateur des données
Hormis les cas de créations de fiches et de mots-clés qui sont traités à part, la saisie en masse traitent deux types de données :
les séries d’identifiants : c’est à dire la suite des numéros de fiches, de mots-clés ou d’identifiants alphanumériques de mots-clés concernés par la saisie en masse ; les séries d’identifiants sont utilisés dans le cas des suppressions ou des déplacements,
les séries de couples : un couple est constitué d’un idenfitiant (numéro de fiches, de mots-clés, identifiant alphanumérique d’un mot-clé) et d’une valeur dont la nature dépend du type de saisie en masse (cela peut être la valeur d’un champ, une liste de numéros de fiches, etc.) ; les séries de couples sont utilisées dans tous les cas où il y a un changement de valeurs d’un champ ou une fusion.
Dans les séries d’identifiants (cas de la suppression des mots-clés), les identifiants doivent être séparés entre eux par un des caractères suivants : ; , | {TAB} {NL}. Il est possible de mélanger ces différents séparateurs. Lorsque l’identifiant est forcément un nombre (numéro de fiche ou numéro de mots-clés dans le cas des thésaurus non alphanumérique), l’espace est également traité comme un séparateur. Cette diversité de séparateurs permet de gérer tous les cas de figure (copier-coller à partir d’OpenOffice, saisie directe, etc.).
1345; 789,89 987;,;98
34
est équivalent de
1345;789;89;987;98;34
Dans les séries de couples, il est d’abord nécessaire de définir le caractère qui va servir de séparateur des couples de données. Par défaut, ce séparateur est le passage à la ligne. Autrement dit, à chaque nouvelle ligne, le logiciel va considérer qu’il a affaire à un couple de données différents. Le passage à la ligne est le séparateur le plus naturel. C’est celui qui est utilisé dans un copier-coller à partir d’OpenOffice.
Cependant, la valeur du couple de données peut-elle même contenir des sauts de ligne, par exemple si cela correspond à un champ de type texte. Il peut être alors utile d’utiliser un caractère très peu usité pour indiquer le changement de couple de données.
Le choix du séparateur des couples de données se fait à l’aide d’une liste déroulante qui propose les séparateurs suivants : {NL} § ¶ $.
Quelque soit le caractère retenu, le caractère d’échappement \ placé avant ce caractère permet d’éviter qu’il soit pris en compte comme séparateur de couple de données.
Exemple avec le caractère ¶
123, test@exemole.fr¶56essai@basedefiches.net¶98;exemple@mapeadores.net¶
78=\¶¶
est équivalent à
123;test@exemole.fr
56;essai@basedefiches.net
98;exemple@mapeadores.net
78;¶
avec le saut de ligne comme séparateur
Une fois le couple de données extrait, le logiciel doit distinguer l’identifiant de la valeur. L’identifiant est toujours placé en début de chaîne (sachant que les éventuels espaces blancs en début de chaîne sont ignorés).
Lorsque l’identifiant attendu est un nombre (numéro de fiches et de mot-clé), le principe est simple : l’identifiant s’arrête au premier caractère qui n’est pas un chiffre. Si le caractère est un des séparateurs classiques : ; , | {TAB} {NL} ou le signe égale =, il est considéré comme étant un séparateur et est donc ignoré. Les éventuels espaces blancs sont également ignorés.
Les trois expressions suivantes ont le même résultat : l'association de l'adresse test@exemole.fr à la fiche 123
123test@exemole.fr
123 ; test@exemole.fr
123=test@exemole.fr
123 test@exemole.fr
Lorsque l’identifiant attendu est l’identifiant alphanumérique d’un mot-clé, le principe est identifique : l’identifiant s’arrête au premier caractère qui n’est pas valide pour un identifiant alphanumérique. Rappelons qu’un espace est valide à l’intérieur d’un identifiant alphanumérique sauf au début et à la fin et qu’il ne peut pas y avoir deux espaces consécutifs.
Fusion des doublons
Par défaut, lorsque plusieurs couples de données ont le même identifiant, seul le premier couple est traité et un message d’erreur signale le numéro de lignes des doublons qui sont ignorés.
Pour certaines saisies, l’option Fusion des doublons permet de demander que les valeurs des données en double soient ajoutées à la première valeur trouvée et non ignorées comme le montre l’exemple suivant :
Dans le cas de la modification du champ Rédacteurs
Avec l'option de fusion des doublons :
2 Jean Martin
2 Jacques Dupont
est équivalent à :
2 Jean Martin; Jacques Dupont
L’option de fusion n’est pertinente que pour les valeurs qui sont elles-mêmes des suites d’éléments distincts : par exemple, les mots-clés indexant une fiche, les fiches liées, les valeurs des champs Information, du champ Rédacteur et les champs de type texte (où le texte du doublon est collé à la suite du premier texte). L’option de fusion n’est pas disponible pour les créations de fiches ou de mots-clés, les fusions ou les suppressions de mots-clés et sera inopérante pour les champs à valeur unique (titre, sous- titre, propriété).
Mode d’ajout
Les saisies en masse qui concernent l’indexation ou le liage propose un paramètre supplémentaire qui est le mode d’ajout, à savoir si les données de la saisie en masse doivent être ajoutée aux données existantes ou les écraser.
Il y a quatre modes d’ajout :
Remplacer l’existant : les fiches ou mots-clés indiqués dans la saisie en masse remplacent les fiches ou mots-clés existants ; si aucune fiche ou aucun mot-clé n’est indiqué, cela revient à supprimer tout liage ou toute indexation pour le corpus ou le thésaurus en question ;
Ajouter à l’existant, en remplaçant les poids le cas échéant : les fiches ou les mots-clés déjà présents dans le liage ou l’indexation sont conservés, si une fiche ou un mot-clé de la saisie en masse est déjà présent, le poids indiqué dans la saisie en masse remplace le poids actuel,
Ajouter à l’existant, en conservant le poids maximum : les fiches ou les mots-clés déjà présents dans le liage ou l’indexation sont conservés, si une fiche ou un mot-clé de la saisie en masse est déjà présent, le poids attribué au final est le maximum du poids indiqué dans la saisie et le poids actuel
Ajouter à l’existant, en remplaçant les poids le cas échéant : les fiches ou les mots-clés déjà présents dans le liage ou l’indexation sont conservés, si une fiche ou un mot-clé de la saisie en masse est déjà présent, aucune modification n’est apportée au poids
Saisie sur les fiches
Modification de la valeur d’un champ
Permet de modifier la valeur d’un champ donné pour des fiches existantes. Une liste déroulante propose la liste des champs du champ du corpus. Les autres paramètres font partie de ceux décrits plus haut.
Le texte à traiter doit être composé de couples de données avec comme identifiant le numéro de la fiche et comme valeur, la nouvelle valeur du champ. Cette nouvelle valeur doit suivre la même syntaxe que celle du formulaire de saisie d’une fiche.
156 : VIC;Dupont*Martin
189,YL[auteurs]
Exemple d’une modification d’un champ rédacteur
Modification de l’indexation par des mots-clés
Permet de modifier l’indexation de fiches par des mots-clés pour un thésaurus donné.
Une liste déroulante propose la liste des différents thésaurus de la base. Les autres paramètres font partie de ceux décrits plus haut.
Le texte à traiter doit être composé de couples de données avec comme identifiant le numéro de la fiche et, comme valeur, la liste des mots-clés suivant la même syntaxe que celle du formulaire de saisie d’une fiche.
156 = A67; B07+3
189;Démocratie+1; 15; Développement durable;Environnement
Exemple d’une modification de l’indexation
Modification du liage avec des fiches
Permet de modifier les liens avec des fiches du même corpus ou d’un corpus différent. Une liste déroulante propose la liste des différents corpus de la base. Les autres paramètres font partie de ceux décrits plus haut.
Le texte à traiter doit être composé de couples de données avec comme identifiant le numéro de la fiche et, comme valeur, la liste des mots-clés suivant la même syntaxe que celle du formulaire de saisie d’une fiche, à savoir le numéro plus une éventuelle pondération.
156 32+6 ; 76
189 = 34+;12
Exemple d’une modification du liage