Cocher les cases des lignes modifiées
===============================
usage :
retirerTabs.bat a.html > a0.txt
mettreEnDefinition.bat a0.txt > a1.txt
tu trouveras une partie du travail faite il faut continuer à épurer le
fichier.
a.html est le résultat de la copie depuis le fichier pdf puis collé dans
abiword et exporté en html.
Le mise en définition consiste a détecter un mot et isoler sa définition.
En principe le début d'un mot est :
«<span style="font-weight:bold;font-size:9.5pt">»
la fin est :
«:»
mais il faut au préalable retirer les tabulations en debut de ligne.
<p .....> .......... </p>
Bonne analyse.