-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathimportWord.xsl
119 lines (110 loc) · 5.51 KB
/
importWord.xsl
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
<?xml version="1.0" encoding="UTF-8"?>
<!--
@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@
@Name : importWord01.xsl
@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@
@version : 005
@creaDate : 2013/05/31
@modifDate
@vXslt: 2.0
@autor : Emmanuel Château [email protected]
@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@
@use : Cette feuille de style assure l'importation à partir des textes pré-encodés sous Microsoft Word et passés dans Oxgarage pour le projet ANR Desgodets.
@knownBugs :
@todo :
@historique : La transformation Oxgarage ne reconnaît pas les titres Desgodets.
Le mode équation avait été utilisé pour traiter certains caractères (1/8, etc.) à l'origine d'un problème de validité..
Il a fallu manuellement retirer les liens hypertextes dans certains documents Word car ils créaient un document résultat inexploitable pour la transformation.
Intégrer les règles ci-dessous dans une personnalisation du framework de transformation TEI pourrait permettre de régler une partie des problèmes mentionnés ci-dessus
Pour supprimer de manière spécifique les attributs rend="normal" et rend="Notedebasdepage" de p, avons rencontré un problème de logique pour le test (et/ou)
@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@
@inspired :
@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@
-->
<xsl:stylesheet
xmlns:xsl="http://www.w3.org/1999/XSL/Transform" version="2.0"
xpath-default-namespace="http://www.tei-c.org/ns/1.0"
xmlns="http://www.tei-c.org/ns/1.0">
<!-- xpath-default-namespace slmt en XSLT2.0 -->
<xsl:output indent="yes" method="xml" encoding="UTF-8" />
<xsl:strip-space elements="*" />
<!-- Copie à l'identique du fichier -->
<xsl:template match="node()|@*">
<xsl:copy>
<xsl:apply-templates select="node()|@*"/>
</xsl:copy>
</xsl:template>
<!-- supprime les attributs rend="normal" et rend="Notesdebasdepage" des éléments p -->
<xsl:template match="p/@rend[@rend='footnote text']">
</xsl:template>
<!-- mettre le contenu de hi[@rend='Desgodets_IndexLocorum'] dans placeName -->
<xsl:template match="hi[@rend='Desgodets_IndexLocorum']">
<xsl:element name="placeName">
<xsl:apply-templates/>
</xsl:element>
</xsl:template>
<!-- mettre le contenu de hi[rend='Desgodets_IndexNominum'] dans persName -->
<xsl:template match="hi[@rend='Desgodets_IndexNominum']">
<xsl:element name="persName">
<xsl:apply-templates/>
</xsl:element>
</xsl:template>
<!-- Factoriser avec une règle nommée et un paramètre -->
<!-- mettre le contenu de hi[rend='Desgodets_IndexRerum'] dans ? -->
<xsl:template match="hi[@rend='Desgodets_IndexRerum']">
<xsl:element name="term" namespace="http://www.tei-c.org/ns/1.0">
<xsl:attribute name="type">glossariumTechnicae</xsl:attribute>
<xsl:choose>
<xsl:when test="contains(., '[')">
<xsl:element name="orig" namespace="http://www.tei-c.org/ns/1.0">
<xsl:copy-of select="substring-before(.,'[')" />
</xsl:element>
<xsl:element name="reg" namespace="http://www.tei-c.org/ns/1.0">
<xsl:copy-of select="substring-before(substring-after(., '['),']')" />
</xsl:element>
</xsl:when>
<xsl:otherwise>
<xsl:apply-templates/>
</xsl:otherwise>
</xsl:choose>
</xsl:element>
</xsl:template>
<!-- mettre le contenu de hi[rend='Desgodets_GlossaireTechnique'] dans ? -->
<xsl:template match="hi[@rend='Desgodets_GlossaireTechnique']">
<xsl:element name="term">
<xsl:attribute name="type">glossariumTechnicae</xsl:attribute>
<xsl:choose>
<xsl:when test="contains(., '[')">
<xsl:element name="orig">
<xsl:copy-of select="substring-before(.,'[')" />
</xsl:element>
<xsl:element name="reg">
<xsl:copy-of select="substring-before(substring-after(., '['),']')" />
</xsl:element>
</xsl:when>
<xsl:otherwise>
<xsl:apply-templates/>
</xsl:otherwise>
</xsl:choose>
</xsl:element>
</xsl:template>
<!-- mettre le contenu de hi[rend='Desgodets_GlossaireJuridique'] dans ? -->
<xsl:template match="hi[@rend='Desgodets_GlossaireJuridique']">
<xsl:element name="term">
<xsl:attribute name="type">glossariumJuris</xsl:attribute>
<xsl:choose>
<xsl:when test="contains(., '[')">
<xsl:element name="orig">
<xsl:copy-of select="substring-before(.,'[')" />
</xsl:element>
<xsl:element name="reg">
<xsl:copy-of select="substring-before(substring-after(., '['),']')" />
</xsl:element>
</xsl:when>
<xsl:otherwise>
<xsl:apply-templates/>
</xsl:otherwise>
</xsl:choose>
</xsl:element>
</xsl:template>
</xsl:stylesheet>