La numérisation et la gestion de documents

numérisation

La transition numérique est une révolution technologique et méthodologique qu’une entreprise ou collectivité se doit de réussir. Celle-ci nécessite notamment la numérisation des archives et documents afin de les intégrer dans une gestion documentaire informatisée.
Ce  site est dédié à cette tâche indispensable pour la transformation numérique de votre activité, vecteur de nombreux gains de productivité.

La numérisation est l’action de créer un fichier numérique à partir d’une source physique, analogique.  Il peut s’agir d’archives papier, mais également de documents audiovisuels (film,  vidéo, bande sonore), de livres, de photographies, ou tout autre support contenant une information.

Scanner un document papier revient à en faire une image, mais celle-ci ne sera exploitable qu’en lecture directe. C’est une forme de numérisation, dans sa définition la plus stricte (car l’image générée est bien un fichier numérique), mais un simple scan ne constitue pas une solution suffisante pour la gestion documentaire d’une entreprise : celle-ci doit pouvoir rechercher une information dans le texte du document. Ce contenu doit donc être traduit en texte qui pourra être indexé, tagué et donc retrouvé facilement pour un usage pratique. C’est à ce niveau qu’intervient La reconnaissance optique de caractères (ou OCR pour l’acronyme anglais), qui retranscrit l’image de la page en fichier numérique textuel.

Numériser un document papier nécessite des techniques particulières, dont voici l’explication :

Les techniques de numérisation

RAD – Reconnaissance automatique de documents

La RAD, ou reconnaissance automatique de documents, vise à identifier automatiquement le type de document à partir de son image numérisée. Elle permet un premier tri des documents fournis au scanner. Elle évite ainsi d’avoir à effectuer ce tri en amont de la numérisation.
La reconnaissance automatique de documents s’appuie sur les éléments graphiques du document :

  • fond de page,
  • logos,
  • codes à barres,
  • marquages distinctifs

LAD – Lecture automatique de documents

La LAD, ou lecture automatique de documents, s’applique aux documents structurés, par exemple des formulaires. Les caractères individuels, souvent en capitales d’imprimerie, sont reconnus. Les éléments détectés peuvent être précisés grâce aux types de données attendus. Ainsi, un numéro de téléphone contient plus probablement un zéro qu’un O majuscule, et vice-versa pour un nom de famille.
La sémantique du formulaire est utilisée pour valider les données. On peut, par exemple, vérifier que le total détecté de plusieurs éléments numériques correspond bien à la somme des éléments individuels détectés.

OCR – Optical character recognition

OCR signifie « Optical character recognition » ou reconnaissance optique de caractères. L’OCR est la technologie la plus utilisée pour obtenir un fichier de type texte à partir d’un document papier numérisé.
Les caractères du document sont d’abord isolés. Ils sont ensuite comparés à des formes de caractères connus. Les caractères les plus probables sont retenus.
Enfin, l’OCR utilise des outils statistiques et linguistiques pour reconstituer un texte statistiquement probable.
Certains systèmes d’OCR permettent de reconstituer une partie de la mise en forme (gras, italique) et de la mise en page (tableaux) d’un document.

ICR – Intelligent character recognition

ICR signifie « Intelligent character recognition » ou reconnaissance intelligente de caractères. Par rapport à l’OCR, l’ICR dispose d’un mécanisme d’apprentissage. Ce mécanisme lui permet d’ajouter des formes de caractères à la base de caractères connus.
Les techniques de reconnaissance d’écriture manuscrite reposent sur l’ICR.

sécurisation documents

Services de qualité

Le centre de numérisation de Numalire est à même de traiter vos documents avec soin, expertise, et ceci en toute confidentialité. Chaque prestation est encadrée par un chef de projet, et fait l’objet d’un contrôle qualité. Nous nous déplaçons également chez nos clients avec notre matériel afin d’effectuer une reprise de masse de vos documents.

Nous scannons des documents tels que : simples feuilles, documents, livres, plans, dossiers, photographies, négatifs, microfilms entre autres, qu’ils soient destinés aux archives, à une diffusion sur Internet, ou à vos propres applications.

Les livres éligibles à la réédition sont les livres appartenant au domaine public (libres de droits).

La règle générale de durée des droits d’auteur est en France de 70 ans à compter du décès de l’auteur. Ce régime général s’accompagne cependant d’un certain nombre de règles spécifiques qui peuvent en faire varier la durée. Mais seule une vérification réalisée par nos soins avec la participation de la bibliothèque lors de votre demande de devis permettra de nous en assurer et de vous en informer.

Nous pouvons effectuer une reconnaissance optique de caractères (OCR) sur les images obtenues par la numérisation. Ceci permet de retrouver vos documents en fonction de leur contenu, par une recherche de texte.

Ces documents numériques sont restitués sous différents formats et supports : Word, Excel, PDF, TIFF, JPG, base de données, etc…sur CD, DVD, Internet (accès sécurisé), Intranet, intégration dans vos applications… et possibilité de cryptage.

Notre implantation en France permet une courte immobilisation de vos documents. Ceux-ci ne sortent pas du territoire.

Exemples d’applications au sein de différents services :

  • Dossiers clients
  • Documentation
  • Correspondances
  • Financiers et juridiques
  • Documents comptables
  • Documents juridiques et légaux
  • Affaires judiciaires
  • Achats
  • Factures
  • Contrats
  • Offres et documentations fournisseurs
  • Ressources Humaines
  • Dossiers du personnel
  • Dossiers de candidatures
  • Documents administratifs
  • Fonds documentaire
  • Livres et revues de presse
  • Enquêtes et statistiques

La sauvegarde sécurisée des données.

Une fois les documents numérisés, toute entreprise s’impose des contraintes particulières afin de garantir la qualité de ses sauvegardes informatiques, ainsi que leur conservation. Celles-ci ne remplissent pleinement leur rôle que si elles assurent :

  • La remise en marche complète du système, d’où la sauvegarde de l’architecture à chaque modification de celle-ci.
  • La restitution intégrale des données acquises quotidiennement. Cette sauvegarde est à effectuer au moins une fois par jour.
  • L’accès du contrôle fiscal des comptabilités informatisées (article L 102 B)

Les risques de perte des sauvegardes peuvent être les conséquences de négligence, de malveillance ou de sinistre.

Outre la désorganisation qu’elle génère, la perte des données du système d’information engage le plus souvent le pronostique vital de l’entreprise.

La délocalisation des sauvegardes informatiques chez les collaborateurs ou sur site extérieur appartenant à l’entreprise ne remplit pas la mission de réelle protection pour les raisons citées précédemment.

Le tiers-archiveur implante dans ses centres des salles de conservation iso climatiques dédiées exclusivement à la conservation des supports de sauvegarde informatique (SSI) dont les caractéristiques principales sont :

  • Accès contrôlé
  • Température constante : 19°
  • Hydrométrie constante : 55 %
  • Système de télésurveillance permanent en prévention des risques d’incendie et d’intrusion
  • Système d’extinction automatique par gaz inerte

Le tiers-archiveur propose des solutions pour opérer le transfert des SSI des services informatiques vers les salles de conservation.

Numalire a élaboré un process original permettant la rotation des SSI entre le service émetteur et Numalire , intégrant plusieurs niveaux de contrôle. Les SSI restent à la disposition du service émetteur 24/24h.

Audit

La pérennité de l’information dans l’entreprise implique une étude préalable menée sur le site de production du demandeur.

Cette étude préalable comprend notamment :

• l’identification des règles de gestion documentaire et/ou d’archivages existantes
• l’analyse des besoins en gestion d’Archivages Physiques ou GED
• la validation d’un thésaurus et d’une charte d’archivage existants ou à créer

L’expertise de Numalire en matière de gestion documentaire est issue de son expérience acquise ces quinze dernières années dans de multiples secteurs d’activité.

Enrichie par sa maîtrise des nouvelles technologies en gestion documentaire, elle favorise l’adaptation constante des réponses proposées aux besoins identifiés.

Gestion des sécurités

Dans le domaine de la gestion du document, l’aspect sécuritaire se décline en quatre domaines, certains prenant une importance croissante avec la globalisation du processus numérique.

Sécurité de conservation

La préservation physique des objets documentaires,

    Qu’ils soient de forme traditionnelle analogique : images argentiques, documents papier, bandes magnétiques vidéo ou audio

    Ou numérique : disquettes, bandes, CD-Rom, mémoires statiques …

Sécurité de diffusion

    Opérabilité des fichiers mises à disposition

    Maîtrise de la diffusion à des populations différenciées et accréditées par le contrôle des droits d’utilisation : accès à tout ou partie des documents et des informations documentaires et des fonctionnalités; limites territoriales et temporaires

Sécurité documentaire

    Validité des versions publiées

    Garantie d’identification par une fiche documentaire fiable et structurée

Sécurité informatique

    Autorisation de mise en ligne d’un document

    Gestion droits utilisateurs

    Gestion des statistiques

    Gestion des sauvegardes