Skip to content
GitLab
Projects
Groups
Snippets
/
Help
Help
Support
Community forum
Keyboard shortcuts
?
Submit feedback
Sign in
Toggle navigation
Menu
9.2.2023: Due to updates GitLab will be unavailable for some minutes between 9:00 and 11:00.
Open sidebar
badw-it
DHParser
Commits
74b39df2
Commit
74b39df2
authored
May 10, 2017
by
di68kap
Browse files
- MLW changes
parent
329d937c
Changes
6
Expand all
Hide whitespace changes
Inline
Side-by-side
dhparser.py
View file @
74b39df2
...
...
@@ -18,7 +18,7 @@ implied. See the License for the specific language governing
permissions and limitations under the License.
"""
#TODO: This is still a stub...
#
TODO: This is still a stub...
import
os
import
sys
...
...
examples/MLW/MLW.ebnf
View file @
74b39df2
...
...
@@ -18,34 +18,37 @@ Artikel = [LEER]
LemmaPosition = "LEMMA" §Lemma [LemmaVarianten] §GrammatikPosition
Lemma = [_tll] WORT_KLEIN [LEER]
_tll = "*"
Lemma = [klassisch] [gesichert] WORT_KLEIN [LEER]
klassisch = "*"
gesichert = "$"
LemmaVarianten = "VARIANTEN" [LEER]
§LVariante { TRENNER LVariante }
[TRENNER LVZusatz] [TRENNER]
LVariante = ~/(?:[a-z]|-)+/~ # Buchstabenfolge mit Trennzeichen "-"
LVZusatz = "ZUSATZ" "sim."
LVZusatz = "ZUSATZ" zs_typ
zs_typ = "sim."
#### GRAMMATIK-POSITION ######################################################
GrammatikPosition = "GRAMMATIK" [LEER] §
_
wortart §TRENNER §Flexion
en
[
_
genus]
{GrammatikVariante
n
} [TRENNER]
GrammatikPosition = "GRAMMATIK" [LEER] §wortart §TRENNER §Flexion [genus]
{GrammatikVariante} [TRENNER]
_
wortart = "nomen" | "n." |
wortart
= "nomen" | "n." |
"verb" | "v." |
"adverb" | "adv." |
"adjektiv" | "adj."
GrammatikVariante
n
= TRENNER GVariante
GVariante = Flexionen [
_
genus] ":" Beleg
GrammatikVariante = TRENNER GVariante
GVariante = Flexionen [genus] ":" Beleg
Flexion
en
= Flexion { "," §Flexion }
Flexion
= Flexion { "," §Flexion }
Flexion = /-?[a-z]+/~
_
genus = "maskulinum" | "m." |
genus
= "maskulinum" | "m." |
"femininum" | "f." |
"neutrum" | "n."
...
...
examples/MLW/XML/Schema_gen_MLW_2017-04-25.xsd
0 → 100644
View file @
74b39df2
<?xml version="1.0" encoding="UTF-8"?>
<xs:schema
xmlns:xs=
"http://www.w3.org/2001/XMLSchema"
elementFormDefault=
"qualified"
>
<xs:import
namespace=
"http://www.w3.org/XML/1998/namespace"
schemaLocation=
"xml.xsd"
/>
<xs:element
name=
"MLW-test"
>
<xs:complexType>
<xs:sequence>
<xs:element
ref=
"einfach-artikel"
/>
<xs:element
maxOccurs=
"unbounded"
ref=
"mehrfach-artikel"
/>
</xs:sequence>
</xs:complexType>
</xs:element>
<xs:element
name=
"einfach-artikel"
>
<xs:complexType>
<xs:sequence>
<xs:element
ref=
"lemma-position"
/>
<xs:element
ref=
"artikelkopf"
/>
<xs:element
ref=
"bedeutung-position"
/>
<xs:element
ref=
"artikel-verfasser"
/>
</xs:sequence>
<xs:attribute
name=
"type"
use=
"required"
type=
"xs:NCName"
/>
<xs:attribute
ref=
"xml:id"
use=
"required"
/>
</xs:complexType>
</xs:element>
<xs:element
name=
"artikel-verfasser"
type=
"xs:string"
/>
<xs:element
name=
"mehrfach-artikel"
>
<xs:complexType>
<xs:sequence>
<xs:choice
maxOccurs=
"unbounded"
>
<xs:element
ref=
"lemma-position"
/>
<xs:element
ref=
"zusatz"
/>
</xs:choice>
<xs:sequence
minOccurs=
"0"
>
<xs:element
ref=
"artikelkopf"
/>
<xs:element
ref=
"bedeutung-position"
/>
<xs:element
ref=
"verfasser-artikel"
/>
</xs:sequence>
</xs:sequence>
<xs:attribute
name=
"type"
type=
"xs:NCName"
/>
<xs:attribute
ref=
"xml:id"
/>
</xs:complexType>
</xs:element>
<xs:element
name=
"verfasser-artikel"
type=
"xs:NCName"
/>
<xs:element
name=
"lemma-position"
>
<xs:complexType>
<xs:sequence>
<xs:element
ref=
"lemma"
/>
<xs:element
minOccurs=
"0"
ref=
"lemma-varianten"
/>
<xs:element
minOccurs=
"0"
ref=
"grammatik-position"
/>
</xs:sequence>
</xs:complexType>
</xs:element>
<xs:element
name=
"lemma-varianten"
>
<xs:complexType>
<xs:sequence>
<xs:element
maxOccurs=
"unbounded"
ref=
"lemma"
/>
<xs:element
ref=
"sim"
/>
<xs:element
ref=
"zusatz"
/>
</xs:sequence>
</xs:complexType>
</xs:element>
<xs:element
name=
"sim"
>
<xs:complexType/>
</xs:element>
<xs:element
name=
"grammatik-position"
>
<xs:complexType>
<xs:sequence>
<xs:element
ref=
"grammatik"
/>
<xs:element
minOccurs=
"0"
ref=
"grammatik-varianten"
/>
</xs:sequence>
</xs:complexType>
</xs:element>
<xs:element
name=
"grammatik-varianten"
>
<xs:complexType>
<xs:sequence>
<xs:element
maxOccurs=
"unbounded"
ref=
"variante"
/>
</xs:sequence>
</xs:complexType>
</xs:element>
<xs:element
name=
"variante"
>
<xs:complexType>
<xs:sequence>
<xs:element
ref=
"grammatik"
/>
<xs:element
ref=
"beleg"
/>
</xs:sequence>
</xs:complexType>
</xs:element>
<xs:element
name=
"artikelkopf"
>
<xs:complexType>
<xs:sequence>
<xs:element
ref=
"schreibweisen-position"
/>
<xs:element
minOccurs=
"0"
ref=
"etymologie-position"
/>
</xs:sequence>
</xs:complexType>
</xs:element>
<xs:element
name=
"schreibweisen-position"
>
<xs:complexType>
<xs:sequence>
<xs:element
maxOccurs=
"unbounded"
ref=
"schreibweisen-variante"
/>
</xs:sequence>
</xs:complexType>
</xs:element>
<xs:element
name=
"schreibweisen-variante"
>
<xs:complexType>
<xs:sequence>
<xs:choice
maxOccurs=
"unbounded"
>
<xs:element
ref=
"zusatz"
/>
<xs:element
ref=
"schreibweise"
/>
</xs:choice>
<xs:element
ref=
"beleg"
/>
</xs:sequence>
</xs:complexType>
</xs:element>
<xs:element
name=
"schreibweise"
>
<xs:complexType
mixed=
"true"
>
<xs:attribute
name=
"typ"
type=
"xs:NCName"
/>
</xs:complexType>
</xs:element>
<xs:element
name=
"etymologie-position"
>
<xs:complexType>
<xs:sequence>
<xs:element
ref=
"grundwort"
/>
<xs:element
ref=
"uebersetzung"
/>
</xs:sequence>
</xs:complexType>
</xs:element>
<xs:element
name=
"grundwort"
>
<xs:complexType>
<xs:simpleContent>
<xs:extension
base=
"xs:NCName"
>
<xs:attribute
ref=
"xml:lang"
use=
"required"
/>
</xs:extension>
</xs:simpleContent>
</xs:complexType>
</xs:element>
<xs:element
name=
"uebersetzung"
type=
"xs:NCName"
/>
<xs:element
name=
"bedeutung-position"
>
<xs:complexType>
<xs:sequence>
<xs:element
maxOccurs=
"unbounded"
ref=
"bedeutung"
/>
</xs:sequence>
</xs:complexType>
</xs:element>
<xs:element
name=
"zusatz"
>
<xs:complexType
mixed=
"true"
>
<xs:attribute
name=
"typ"
use=
"required"
/>
</xs:complexType>
</xs:element>
<xs:element
name=
"lemma"
>
<xs:complexType
mixed=
"true"
>
<xs:attribute
name=
"gesichert"
type=
"xs:NCName"
/>
<xs:attribute
name=
"klassisch"
type=
"xs:NCName"
/>
<xs:attribute
name=
"kurz"
type=
"xs:NMTOKEN"
/>
</xs:complexType>
</xs:element>
<xs:element
name=
"grammatik"
>
<xs:complexType
mixed=
"true"
>
<xs:attribute
name=
"genus"
use=
"required"
type=
"xs:NCName"
/>
<xs:attribute
name=
"klasse"
use=
"required"
type=
"xs:NCName"
/>
<xs:attribute
name=
"wortart"
use=
"required"
type=
"xs:NCName"
/>
</xs:complexType>
</xs:element>
<xs:element
name=
"beleg"
>
<xs:complexType>
<xs:choice>
<xs:element
maxOccurs=
"unbounded"
ref=
"verweis"
/>
<xs:sequence>
<xs:element
ref=
"beleg-quelle"
/>
<xs:element
ref=
"beleg-text"
/>
</xs:sequence>
</xs:choice>
<xs:attribute
name=
"id"
type=
"xs:NCName"
/>
<xs:attribute
name=
"name"
type=
"xs:NCName"
/>
</xs:complexType>
</xs:element>
<xs:element
name=
"beleg-quelle"
>
<xs:complexType>
<xs:sequence>
<xs:element
ref=
"autor"
/>
<xs:element
ref=
"werk"
/>
<xs:element
ref=
"stelle"
/>
<xs:element
minOccurs=
"0"
ref=
"datierung"
/>
</xs:sequence>
</xs:complexType>
</xs:element>
<xs:element
name=
"autor"
type=
"xs:NCName"
/>
<xs:element
name=
"werk"
type=
"xs:string"
/>
<xs:element
name=
"stelle"
>
<xs:complexType
mixed=
"true"
>
<xs:sequence>
<xs:element
minOccurs=
"0"
maxOccurs=
"unbounded"
ref=
"hoch"
/>
</xs:sequence>
</xs:complexType>
</xs:element>
<xs:element
name=
"hoch"
type=
"xs:NCName"
/>
<xs:element
name=
"datierung"
type=
"xs:string"
/>
<xs:element
name=
"beleg-text"
>
<xs:complexType
mixed=
"true"
>
<xs:choice
minOccurs=
"0"
maxOccurs=
"unbounded"
>
<xs:element
ref=
"lemma"
/>
<xs:element
ref=
"zusatz"
/>
<xs:element
ref=
"redaktion-ergaenzung"
/>
</xs:choice>
</xs:complexType>
</xs:element>
<xs:element
name=
"redaktion-ergaenzung"
type=
"xs:string"
/>
<xs:element
name=
"bedeutung"
>
<xs:complexType>
<xs:sequence>
<xs:sequence
minOccurs=
"0"
>
<xs:element
ref=
"interpretament-latein"
/>
<xs:element
ref=
"interpretament-deutsch"
/>
</xs:sequence>
<xs:choice
minOccurs=
"0"
maxOccurs=
"unbounded"
>
<xs:element
ref=
"bedeutung"
/>
<xs:element
ref=
"zusatz"
/>
<xs:element
ref=
"beleg-position"
/>
<xs:element
ref=
"zusatz-interpretament"
/>
</xs:choice>
</xs:sequence>
<xs:attribute
name=
"nr"
use=
"required"
type=
"xs:NMTOKEN"
/>
</xs:complexType>
</xs:element>
<xs:element
name=
"interpretament-latein"
type=
"xs:string"
/>
<xs:element
name=
"interpretament-deutsch"
type=
"xs:string"
/>
<xs:element
name=
"beleg-position"
>
<xs:complexType>
<xs:sequence>
<xs:element
maxOccurs=
"unbounded"
ref=
"beleg"
/>
<xs:sequence
minOccurs=
"0"
>
<xs:element
ref=
"saepe"
/>
<xs:element
ref=
"zusatz"
/>
</xs:sequence>
</xs:sequence>
</xs:complexType>
</xs:element>
<xs:element
name=
"saepe"
>
<xs:complexType/>
</xs:element>
<xs:element
name=
"zusatz-interpretament"
>
<xs:complexType
mixed=
"true"
>
<xs:choice
minOccurs=
"0"
maxOccurs=
"unbounded"
>
<xs:element
ref=
"verweis"
/>
<xs:element
ref=
"zusatz"
/>
</xs:choice>
</xs:complexType>
</xs:element>
<xs:element
name=
"verweis"
>
<xs:complexType
mixed=
"true"
>
<xs:attribute
name=
"typ"
/>
<xs:attribute
name=
"ziel"
/>
</xs:complexType>
</xs:element>
</xs:schema>
examples/MLW/XML/XML-Test_wohlgeformt_2017-04-26.xml
0 → 100644
View file @
74b39df2
This diff is collapsed.
Click to expand it.
examples/MLW/samples/XML-Test_wohlgeformt_2017-01-31.xml
deleted
100644 → 0
View file @
329d937c
<?xml version="1.0" encoding="UTF-8"?>
<MLW-test>
<artikel
type=
"einLemma"
>
<lemma-position>
<lemma
klassisch=
"nein"
gesichert=
"nein"
>
facitergula
</lemma>
<lemma-varianten>
<lemma
kurz=
"fasc-"
>
fascitergula
</lemma>
<lemma
kurz=
"-iet-"
>
facietergula
</lemma>
<lemma
kurz=
"-ist-"
>
facistergula
</lemma>
<lemma
kurz=
"-rcu-"
>
facitercula
</lemma>
<sim></sim>
<!--oder: -->
<zusatz
typ=
"sim"
></zusatz>
</lemma-varianten>
<grammatik-position>
<grammatik
wortart=
"n"
genus=
"f"
klasse=
"a-ae"
>
-ae
</grammatik>
<grammatik-varianten>
<variante>
<grammatik
wortart=
"n"
genus=
"m"
klasse=
"us-i"
>
-us, -i
</grammatik>
<beleg><verweis
typ=
"intern/Zeile"
ziel=
"facitergula_003"
>
<!-- l. 8 -->
</verweis></beleg>
</variante>
<variante>
<grammatik
wortart=
"n"
genus=
"n"
klasse=
"um-i"
>
-um, -i
</grammatik>
<beleg>
<verweis
typ=
"intern/Zeile"
ziel=
"facitergula_002"
>
<!-- l. 6.11 = Mehrfachverweis -->
</verweis>
<verweis
typ=
"intern/Zeile"
ziel=
"facitergula_008"
>
<!-- l. 6.11 = Mehrfachverweis -->
</verweis>
</beleg>
</variante>
</grammatik-varianten>
</grammatik-position>
</lemma-position>
<artikelkopf>
<schreibweisen-position>
<schreibweisen-variante>
<schreibweise
typ=
"script"
>
vizreg-
</schreibweise>
<beleg><verweis
typ=
"intern/Zeile"
ziel=
"facitergula_013"
></verweis></beleg>
</schreibweisen-variante>
<schreibweisen-variante>
<schreibweise
typ=
"script"
>
festregel(a)
</schreibweise>
<beleg><verweis
typ=
"intern/Zeile"
ziel=
"facitergula_010"
></verweis></beleg>
</schreibweisen-variante>
<schreibweisen-variante>
<schreibweise
typ=
"script"
>
fezdregl(a)
</schreibweise>
<beleg><verweis
typ=
"intern/Zeile"
ziel=
"facitergula_008"
></verweis></beleg>
</schreibweisen-variante>
</schreibweisen-position>
</artikelkopf>
<bedeutung-position>
<bedeutung
nr=
"1"
>
<interpretament-latein>
pannus, faciale, sudarium
</interpretament-latein>
<interpretament-deutsch>
(Gesichts-, Schweiß-)Tuch
</interpretament-deutsch>
<zusatz-interpretament>
usu liturg.
</zusatz-interpretament>
<zusatz-interpretament>
de re v.
<verweis>
p. 32,63
</verweis></zusatz-interpretament>
<verwendung-position>
<!-- besser: beleg-position??-->
<verwendung
name=
"facitergula-facitergulum"
id=
"facitergula_001"
>
<!-- besser: beleg???-->
<autor>
Catal.
</autor>
<werk>
thes. Germ.
</werk>
<stelle>
28,11
</stelle>
<datierung>
Post 851
</datierung>
<belegtext><lemma
kurz=
"-um"
>
facitergulum
</lemma>
Ill.
</belegtext>
</verwendung>
<verwendung
name=
"facitergula-facitergulas"
id=
"facitergula_002"
>
<autor>
Form.
</autor>
<werk>
Sangall.
</werk>
<stelle>
39 p. 421,16
</stelle>
<belegtext>
munuscula ... direximus, hoc est palliolum ...,
<lemma
kurz=
"-as"
>
facitergulas
</lemma>
duas.
</belegtext>
</verwendung>
<verwendung
name=
"facitergula-faciterculi"
id=
"facitergula_003"
>
<autor>
Catal.
</autor>
<werk>
thes. Germ.
</werk>
<stelle>
18,7
</stelle>
<belegtext><lemma
kurz=
"-eterculi"
>
faciterculi
</lemma>
viginti quatuor.
</belegtext>
</verwendung>
<verwendung
name=
"facitergula-facitergula"
id=
"facitergula_004"
>
<autor>
Libri
</autor>
<werk>
confrat. I
</werk>
<stelle>
app. A 6 p. 137,30
</stelle>
<belegtext>
pulpitum ...
<lemma
kurz=
"-a"
>
facitergula
</lemma>
cocco imaginata circumdari iussit
<redaktion-ergaenzung>
pontifex
</redaktion-ergaenzung>
.
</belegtext>
</verwendung>
<verwendung
name=
"facitergula-faciterulae"
id=
"facitergula_005"
>
<autor>
Catal.
</autor>
<werk>
thes. Germ.
</werk>
<stelle>
76,15
</stelle>
<belegtext><lemma
kurz=
"-rulae"
>
faciterulae
</lemma>
Il.
</belegtext>
</verwendung>
<verwendung
name=
"facitergula-vizregule"
id=
"facitergula_013"
>
<autor>
Catal.
</autor>
<werk>
thes. Germ.
</werk>
<stelle>
40,5 VI
</stelle>
<belegtext><lemma>
vizregule
</lemma>
.
</belegtext>
</verwendung>
<verwendung
name=
"facitergula-facisterculas"
id=
"facitergula_006"
>
<autor>
Catal.
</autor>
<werk>
thes. Germ.
</werk>
<stelle>
129
<hoch>
a
</hoch>
,5
</stelle>
<belegtext><lemma
kurz=
"-sterculas"
>
facisterculas
</lemma>
Il.
</belegtext>
</verwendung>
<verwendung
name=
"facitergula-facitella"
id=
"facitergula_007"
>
<autor>
Catal.
</autor>
<werk>
thes. Germ.
</werk>
<stelle>
24,8
</stelle>
<belegtext><lemma
kurz=
"-itella"
>
facitella
</lemma>
X.
</belegtext>
</verwendung>
<verwendung
name=
"facitergula-fezdregle"
id=
"facitergula_008"
>
<autor>
Catal.
</autor>
<werk>
thes. Germ.
</werk>
<stelle>
114,8
</stelle>
<belegtext>
VIII
<lemma>
fezdregle
</lemma>
.
</belegtext>
</verwendung>
<verwendung
name=
"facitergula-fasciutercule"
id=
"facitergula_014"
>
<autor>
Catal.
</autor>
<werk>
thes. Germ.
</werk>
<stelle>
6,24
</stelle>
<belegtext><lemma>
fasciutercule
</lemma>
VII.
</belegtext>
</verwendung>
<verwendung
name=
"facitergula-fascercule"
id=
"facitergula_009"
>
<autor>
Catal.
</autor>
<werk>
thes. Germ.
</werk>
<stelle>
92,6
</stelle>
<belegtext><lemma>
fascercule
</lemma>
tres.
</belegtext>
</verwendung>
<verwendung
name=
"facitergula-festregele"
id=
"facitergula_010"
>
<autor>
Catal.
</autor>
<werk>
thes. Germ.
</werk>
<stelle>
21,20
</stelle>
<belegtext>
IIII
<lemma>
festregele
</lemma>
.
</belegtext>
</verwendung>
<saepe></saepe>
<!--oder: -->
<zusatz
typ=
"saepe"
></zusatz>
</verwendung-position>
<bedeutung-position><bedeutung></bedeutung></bedeutung-position>
</bedeutung>
<bedeutung
nr=
"2"
>
<interpretament-latein>
capital, rica
</interpretament-latein>
<interpretament-deutsch>
Kopftuch
</interpretament-deutsch>
<verwendung-position>
<verwendung
name=
"facitergula-facitergulis"
id=
"facitergula_011"
>
<autor>
Transl.
</autor>
<werk>
Libor. I
</werk>
<stelle>
32
</stelle>
<belegtext>
raptis feminarum
<lemma
kurz=
"-is"
>
facitergulis
</lemma>
(
<lemma>
fa[s]citergiis
</lemma>
<redaktion-ergaenzung>
var. l.
</redaktion-ergaenzung>
).
</belegtext>
</verwendung>
<verwendung
name=
"facitergula-facitercula"
id=
"facitergula_012"
>
<autor>
Transl.
</autor>
<werk>
Libor. II
</werk>
<stelle>
20
</stelle>
<belegtext>
nuditatem membrorum illius
<redaktion-ergaenzung>
(puellae)
</redaktion-ergaenzung>
tegere festinarunt fideles clerici et laici inprimis cum eorum
<lemma
kurz=
"-cula"
>
facitercula
</lemma>
, dein vestibus solitis.
</belegtext>
</verwendung>
</verwendung-position>
</bedeutung>
</bedeutung-position>
<artikel-verfasser>
Johannes Staub
</artikel-verfasser>
</artikel>
</MLW-test>
examples/MLW/samples/fascitergula.mlw
View file @
74b39df2
...
...
@@ -10,7 +10,7 @@ VARIANTEN
GRAMMATIK
nomen; -a
r
f.;
nomen; -a
e
f.;
-us, -i m.: beleg_id_1
-um, -i n.: beleg_id_2
...
...
Write
Preview
Supports
Markdown
0%
Try again
or
attach a new file
.
Cancel
You are about to add
0
people
to the discussion. Proceed with caution.
Finish editing this message first!
Cancel
Please
register
or
sign in
to comment