Jump to: navigation, search

Workshop:Memory Learning

(Redirected from Memory Learning)

Memory learning-cover.jpg

Description

Mise en relation d'une base de données d'archives image avec des algorithmes de traitement (machine learning).

La recherche constiste à produire de nouvelles images et des informations textuelles nouvelles en utilisant des algorithmes de reconnaissance d'objets et de segmentation d'images.

Le session de travail se terminera par la production d'une série de documents mis en page automatiquement.

Les tâches seront distribuées aux étudiants en fonction de leur section:

  • AN: traitement des données, adaptation du script de génération et des algorithmes de traitement
  • CV: création d'un fichier template dans indesign et importation des données


Il est évident que ces tâches seront basées sur une collaboration active et constante entre les étudiants, qui devront prendre en compte les possibilités, spécialités et limitations des outils.

Horaire

Semaine blanche, du 24 au 26/10/2016

Workflow

File:Memory learning workflow schema.pdf

Memory learning workflow schema.gif

Images

ARC-MUND-AFF-R1-002, Vote Conservative , Collections de la Fédération Wallonie-Bruxelles, en dépôt au Mundaneum à Mons.

ARC-MUND-AFF-R1-002, Vote Conservative , Collections de la Fédération Wallonie-Bruxelles, en dépôt au Mundaneum à Mons. - exemple d'affiche de la base de données du mundaneum


Résultat d'une segmentation d'image

exemple de segmentation d'image


résultat de ofxDeepBeliefSDK

résultat de ofxDeepBeliefSDK - voir tools


UberNet demo

UberNet demo - exemple des différents algorithmes applicables à une image - voir tools

Resources

Python

Code source et scripts développés pour et pendant le workshop: Memory Learning sur bitbucket.

Le script reader.py génère un xml sur base du fichier excell fournit par la mundaneum. L'xml contient tous les champs correctement emballés dans des balises + les chemins vers les images à importer. Il permettra d'automatiser la mise en page d'un document.

Chaque ligne du fichier excell devient une entry. Le nom des tags dans fields dépend du nom de la colonne dans le fichier excell.

Memory learning-DB affiches-screencshot.jpg

screenshot du fichier fournit par le mundaneum.

Extrait du xml généré par le script.

<?xml version="1.0" encoding="UTF-8"?>
<mundaneum>
	<entries>
		<entry id="ARC-MUND-AFF-R1-001">
		<fields>
				<id_num name="ID NUM. ">
<![CDATA[ARC-MUND-AFF-R1-001]]>
	 			</id_num>
				<sujets name="sujet(s)">
<![CDATA[Affiche: élections: 1900-1939
Affiche: Angleterre: 1900-1939
Politique: élection : Campagne électorale: Angleterre: 1900-1939
Parti conservateur: Angleterre: 1900-1939
Politics : elections: Conservative & Unionist Party: England: 1900-1939]]>
				</sujets>
				<type_de_ressource name="type de ressource">
<![CDATA[Affiche]]>
				</type_de_ressource>
				<ressources_associes name="ressource(s) associée(s)"/>
				<auteurs_crateurs name="auteur(s) -créateur(s)"/>
				<localisation name="Localisation">
<![CDATA[AFF2-R1]]>
				</localisation>
				<droits name="droits"/>
				<titre name="titre">
<![CDATA[Vote Conservative  ]]>
				</titre>
				<dates name="date(s)"/>
				<purl name="purl">
<![CDATA[I:\AFFICHES POLITIQUES\Affiches politiques anglaises]]>
				</purl>
				<remarques name="Remarques"/>
				<description name="description">
<![CDATA[Socialism doesn't pay... you do!
For a return to sound finance]]>
				</description>
				<format name="format">
<![CDATA[20 x 25]]>
				</format>
				<ref_dem name="REF. DEM.">
<![CDATA[DEM-2011-07]]>
				</ref_dem>
				<diteurs name="éditeur(s)">
<![CDATA[Conservative & Unionist Central Office (London)]]>
				</diteurs>
				<id name="ID">
<![CDATA[ARC-MUND-AFF-R1-001]]>
				</id>
				<langues name="langue(s)">
 <![CDATA[en]]>
				</langues>
				<format_num name="format NUM.">
<![CDATA[TIFF ## JPEG]]>
				</format_num>
				<couverture_spatiale name="couverture spatiale"/>
				<droits name="droits ">
<![CDATA[Collections de la Fédération Wallonie-Bruxelles, en dépôt au Mundaneum à Mons.]]>
				</droits>
				<contributeurs name="contributeur(s) ">
<![CDATA[The Press at Colombelands, Ltd. (Addlestone)]]>
				</contributeurs>
				<dossier_duvre name="DOSSIER D'ŒUVRE"/>
		</fields>
		<files>
			<file path="data/ARC-MUND-AFF-R1-001_72.jpg" width="3378" height="4410"/>
			<file path="data/ARC-MUND-AFF-R1-001_72_vecto.jpg" width="1001" height="1306"/>
			<file path="data/ARC-MUND-AFF-R1-001_72_small.jpg" width="1000" height="1306"/>
		</files>
	</entry>

Les fichiers images sont récupérer automatiquement par le script. Le chemin est relatif (à valider dans indesign).

Le choix des champs à importer dans la mise en page sera fait lors du workshop par les étudiants.

Les algorithmes de traitement des images ne sont pas encore liés à ce script. D'autres champs seront donc disponibles dans la version finale du script.

Indesign

Pour pouvoir mettre en forme le contenu du xml (facilement), il est nécessaire que les différents champs soient repris dans des tags dont le nom varie. L'outil d'importation ne permet pas d'utiliser les attributs des tags! Ce comportement implique une modification du script de génération. Voir ce commit.

Bookmarks

related

tutorials

tools