Saisie en masse

Préliminaire

Dans le texte suivant comme dans l’interface du logiciel :

Principe général

La saisie en masse permet de modifier la base de fiches à partir de données sous forme tabulaire (par exemple des données issues d’une base SQL classique ou d’un tableur). Comme tout outil qui permet de modifier une grande masse d’information en moins de trois clics, il est réservé aux administrateurs et à manier avec précaution : dans le cas de modifications importantes, il est conseillé de le tester sur une copie de la base et l’administrateur veillera à intervenir alors qu’il est le seul connecté. Ces précautions seront récompensées par l’énorme gain de temps que peut apporter la saisie en masse.

Le principe directeur de la saisie en masse est le suivant : travail des données hors ligne sous OpenOffice, copier-coller des données du classeur vers une zone texte d’un formulaire, ultime vérification et validation des modifications. OpenOffice est pris comme référence mais le travail peut se faire avec d’autres logiciels.

La page d’accueil de la saisie en masse (accessible via Administration > Saisie en masse) propose une série de saisie en masse pour des corpus ou des thésaurus : création de mots-clés, modification de champs, fusion, etc. Chaque saisie en masse a des options particulières cependant le cheminement est toujours le même :

Séparateur des données

Hormis les cas de créations de fiches et de mots-clés qui sont traités à part, la saisie en masse traitent deux types de données :

Dans les séries d’identifiants (cas de la suppression des mots-clés), les identifiants doivent être séparés entre eux par un des caractères suivants : ; , | {TAB} {NL}. Il est possible de mélanger ces différents séparateurs. Lorsque l’identifiant est forcément un nombre (numéro de fiche ou numéro de mots-clés dans le cas des thésaurus non alphanumérique), l’espace est également traité comme un séparateur. Cette diversité de séparateurs permet de gérer tous les cas de figure (copier-coller à partir d’OpenOffice, saisie directe, etc.).

1345; 789,89 987;,;98
34
est équivalent de
1345;789;89;987;98;34

Dans les séries de couples, il est d’abord nécessaire de définir le caractère qui va servir de séparateur des couples de données. Par défaut, ce séparateur est le passage à la ligne. Autrement dit, à chaque nouvelle ligne, le logiciel va considérer qu’il a affaire à un couple de données différents. Le passage à la ligne est le séparateur le plus naturel. C’est celui qui est utilisé dans un copier-coller à partir d’OpenOffice.

Cependant, la valeur du couple de données peut-elle même contenir des sauts de ligne, par exemple si cela correspond à un champ de type texte. Il peut être alors utile d’utiliser un caractère très peu usité pour indiquer le changement de couple de données.

Le choix du séparateur des couples de données se fait à l’aide d’une liste déroulante qui propose les séparateurs suivants : {NL} § ¶ $.

Quelque soit le caractère retenu, le caractère d’échappement \ placé avant ce caractère permet d’éviter qu’il soit pris en compte comme séparateur de couple de données.

Exemple avec le caractère ¶

123, test@exemole.fr¶56essai@basedefiches.net¶98;exemple@mapeadores.net¶
78=\¶¶


est équivalent à

123;test@exemole.fr
56;essai@basedefiches.net
98;exemple@mapeadores.net
78;¶

avec le saut de ligne comme séparateur

Une fois le couple de données extrait, le logiciel doit distinguer l’identifiant de la valeur. L’identifiant est toujours placé en début de chaîne (sachant que les éventuels espaces blancs en début de chaîne sont ignorés).

Lorsque l’identifiant attendu est un nombre (numéro de fiches et de mot-clé), le principe est simple : l’identifiant s’arrête au premier caractère qui n’est pas un chiffre. Si le caractère est un des séparateurs classiques : ; , | {TAB} {NL} ou le signe égale =, il est considéré comme étant un séparateur et est donc ignoré. Les éventuels espaces blancs sont également ignorés.

Les trois expressions suivantes ont le même résultat : l'association de l'adresse test@exemole.fr à la fiche 123

123test@exemole.fr
123 ; test@exemole.fr
123=test@exemole.fr
123 test@exemole.fr

Lorsque l’identifiant attendu est l’identifiant alphanumérique d’un mot-clé, le principe est identifique : l’identifiant s’arrête au premier caractère qui n’est pas valide pour un identifiant alphanumérique. Rappelons qu’un espace est valide à l’intérieur d’un identifiant alphanumérique sauf au début et à la fin et qu’il ne peut pas y avoir deux espaces consécutifs.

Fusion des doublons

Par défaut, lorsque plusieurs couples de données ont le même identifiant, seul le premier couple est traité et un message d’erreur signale le numéro de lignes des doublons qui sont ignorés.

Pour certaines saisies, l’option Fusion des doublons permet de demander que les valeurs des données en double soient ajoutées à la première valeur trouvée et non ignorées comme le montre l’exemple suivant :

Dans le cas de la modification du champ Rédacteurs

Avec l'option de fusion des doublons :
2 Jean Martin
2 Jacques Dupont

est équivalent à :
2 Jean Martin; Jacques Dupont

L’option de fusion n’est pertinente que pour les valeurs qui sont elles-mêmes des suites d’éléments distincts : par exemple, les mots-clés indexant une fiche, les fiches liées, les valeurs des champs Information, du champ Rédacteur et les champs de type texte (où le texte du doublon est collé à la suite du premier texte). L’option de fusion n’est pas disponible pour les créations de fiches ou de mots-clés, les fusions ou les suppressions de mots-clés et sera inopérante pour les champs à valeur unique (titre, sous- titre, propriété).

Mode d’ajout

Les saisies en masse qui concernent l’indexation ou le liage propose un paramètre supplémentaire qui est le mode d’ajout, à savoir si les données de la saisie en masse doivent être ajoutée aux données existantes ou les écraser.

Il y a quatre modes d’ajout :

Saisie sur les fiches

Modification de la valeur d’un champ

Permet de modifier la valeur d’un champ donné pour des fiches existantes. Une liste déroulante propose la liste des champs du champ du corpus. Les autres paramètres font partie de ceux décrits plus haut.

Le texte à traiter doit être composé de couples de données avec comme identifiant le numéro de la fiche et comme valeur, la nouvelle valeur du champ. Cette nouvelle valeur doit suivre la même syntaxe que celle du formulaire de saisie d’une fiche.

156 : VIC;Dupont*Martin
189,YL[auteurs]

Exemple d’une modification d’un champ rédacteur

Modification de l’indexation par des mots-clés

Permet de modifier l’indexation de fiches par des mots-clés pour un thésaurus donné.

Une liste déroulante propose la liste des différents thésaurus de la base. Les autres paramètres font partie de ceux décrits plus haut.

Le texte à traiter doit être composé de couples de données avec comme identifiant le numéro de la fiche et, comme valeur, la liste des mots-clés suivant la même syntaxe que celle du formulaire de saisie d’une fiche.

156 = A67; B07+3
189;Démocratie+1; 15; Développement durable;Environnement

Exemple d’une modification de l’indexation

Modification du liage avec des fiches

Permet de modifier les liens avec des fiches du même corpus ou d’un corpus différent. Une liste déroulante propose la liste des différents corpus de la base. Les autres paramètres font partie de ceux décrits plus haut.

Le texte à traiter doit être composé de couples de données avec comme identifiant le numéro de la fiche et, comme valeur, la liste des mots-clés suivant la même syntaxe que celle du formulaire de saisie d’une fiche, à savoir le numéro plus une éventuelle pondération.

156 32+6 ; 76
189 = 34+;12

Exemple d’une modification du liage