Introduction

This document contains morphosyntactic specification for Lithuanian . The morphosyntactic descriptions (MSD) adhere to the following principles:

  • identical parts of speech have the same number of codes (all nouns have 7 codes);

  • if a morphological category is not applicable to a certain wordform, then the category is marked by a hyphen (-);

  • the first letter in the MSD denotes the part of speech and it is capitalised;

  • all parts of speech have Type category;

  • assigned morphosyntactic codes are based on MULTEXT-EAST specifications http://nl.ijs.si/ME/V4/msd/html/index.html and are essentially compatible with codes for other languages (e.g. noun – N, verb – V, feminine gender –f, etc.). The specifications include some codes specific to the Lithuanian language (e.g. būdinys – B;

  • 176 grammatical multi words expressions are tokenised and annotated as single units (for the complete list see Annex).

Categories

P Attribute Value
1 noun N
verb V
adjective A
pronoun P
adverb R
preposition S
conjunction C
numeral M
particle Q
interjection I
onomatopoeia O
abbreviation Y
residual X
punctuation and symbols T

Noun

Number of codes 7
Examples: Lietuvai,"Npfsdng"
vasarą,"Ncfsan-"
P Attribute Value Code
0 CATEGORY Noun N
1 Type common c
proper p
2 Gender common c
feminine f
masculine m
irrelevant -
3 Number plural p
singular s
dual d
irrelevant -
4 Case nominative n
genitive g
dative d
accusative a
instrumental i
locative l
vocative v
illiative x
irrelevant -
15 Reflexiveness yes y
no n
16 Name first f
surname s
geographic g
irrelevant -

Verb

Number of codes 14
Examples: rezervuoju,"Vgmp1s--n--ni-"
paliktu,"Vgps-smpnnin-p"
P Attribute Value Code
0 CATEGORY Verb V
1 Type general g
2 VForm infinitive i
main m
particle p
adverbial participle a
half particle h
adverbial participle2 s
3 Tense present p
simple past a
past tense s
past frequentative q
future f
4 Person first 1
second 2
third 3
irrelevant -
5 Number plural p
singular s
dual d
6 Gender feminine f
masculine m
neuter n
irrelevant -
7 Voice active a
passive p
necessity n
irrelevant -
8 Negative yes y
no n
9 Defineteness yes y
no n
11 Case nominative n
genitive g
dative d
accusative a
instrumental i
locative l
vocative v
illiative x
irrelevant -
18 Reflexiveness yes y
no n
19 Mood indicative i
subjunctive s
imperative m
irrelevant -
20 Degree positive p
comparative c
superlative s
irrelevant -

Adjective

Number of codes 7
Examples: svarbu,"Agpn--n"
gražiausius,"Agsmpan"
P Attribute Value Code
0 CATEGORY Adjective A
1 Type general g
2 Degree positive p
comparative c
superlative s
diminutive d
- -
3 Gender feminine f
masculine m
neuter n
- -
4 Number plural p
singular s
dual d
- -
5 Case nominative n
genitive g
dative d
accusative a
instrumental i
locative l
vocative v
illiative x
- -
6 Defineteness yes y
no n

Pronoun

Number of codes 7
Examples: visoks,"Pgmpin"
man,"Pg-sdn"
P Attribute Value Code
0 CATEGORY Pronoun P
1 Type general g
3 Gender feminine f
masculine m
neuter n
- -
4 Number plural p
singular s
dual d
- -
5 Case nominative n
genitive g
dative d
accusative a
instrumental i
locative l
vocative v
illiative x
- -
11 Defineteness yes y
no n
- -

Numeral

Number of codes 7
Examples: penkiom,"Mcf-iln" / "Mcf-dln"
10,"M----d-"
P Attribute Value Code
0 CATEGORY Numeral M
1 Type cardinal c
ordinal o
collect l
multiple m
- -
2 Gender feminine f
masculine m
neuter n
- -
3 Number plural p
singular s
- -
4 Case nominative n
genitive g
dative d
accusative a
instrumental i
locative l
vocative v
illiative x
- -
5 Form digit d
roman r
letter l
m-form m
6 Defineteness yes y
no n
- -

Adverb

Number of codes 3
Examples: apskritai,"Rgp"
gerai,"Rgc"
P Attribute Value Code
0 CATEGORY Adverb R
1 Type general g
3 Degree positive p
comparative c
superlative s
diminutive d
- - -

Preposition

Number of codes 3
Examples: su,"Sgi"
po,"Sgg"
P Attribute Value Code
0 CATEGORY Preposition S
1 Type general g
3 Case genitive g
dative d
accusative a
instrumental i

Conjunction

Number of codes 2
Examples: būtent,"Cg"
ir,"Cg"
P Attribute Value Code
0 CATEGORY Conjunction C
1 Type general g

Particle

Number of codes 2
Examples: pat,"Qg"
gal,"Qg"
P Attribute Value Code
0 CATEGORY Particle Q
1 Type general g

Interjection

Number of codes 2
Examples: na,"Ig"
va,"Ig"
P Attribute Value Code
0 CATEGORY Interjection I
1 Type general g

Onomatopoeia

Number of codes 2
Examples: dzin, "Og"
cypt, "Og"
P Attribute Value Code
0 CATEGORY Onomatopoeia O
1 Type general g

Abbreviation

Number of codes 2
Examples: t.t.,"Ys"
TV,"Ya"
P Attribute Value Code
0 CATEGORY Abbreviation Y
6 Type shortening s
acronym a

Others

Number of codes 2
Examples: the, "Df"
http://www.vdu.lt, "De"
P Attribute Value Code
0 CATEGORY Residual D
1 Type foreign f
typo t
segmentation p
tag h
link l
e-mail addresses e

Punctuation

Number of codes 2
Examples: ",","Tc"
"?","Tq"
P Attribute Value Code
0 CATEGORY Punctuation T
1 Type . full stop/period p
, comma c
; semicolon s
: colon n
? question mark q
! exclamation mark e
... ellipsis i
- – — dash, minus h
( [ { opening bracket l
) ] } closing bracket r
" ' „ “ quotation mark u
slash, stroke t
|\*%^$ other marks, symbols x

Annex

be abejo R
be galo R
be paliovos R
be perstojo R
bet ir C
bet kada R
bet kaip R
bet kas P
bet kiek R
bet koks P
bet kur R
bet kuris P
čia pat R
čia tai bent I
eik sau I
galų gale R
į pat S
į valias R
iš anksto R
iš dalies R
iš eilės R
iš esmės R
iš karto R
iš lėto R
iš mažens R
iš palengvo R
iš pasalų R
iš paskos R
iš paskutiniųjų R
iš pat mažens R
iš pat pradžių R
iš pradžių R
iš principo R
iš tiesų R
iš tikro R
iš tikrųjų R
iš tolo R
juo labiau R
ką tik R
ką tiktai R
kada nors R
kai kada R
kai kas P
kai koks P
kai kur R
kai kuris P
kaip kada R
kaip mat R
kaip nors R
kas nors P
kaži kada R
kaži kaip R
kaži kas P
kaži kiek R
kaži kodėl R
kaži kur R
kažin kada R
kažin kaip R
kažin kas P
kažin kiek R
kažin kodėl R
kažin kur R
kiek nors R
ko gera Q
ko gero Q
koks nors P
kol kas R
kolei kas R
kur kas R
kur ne kur R
kur nors R
kuriam laikui R
kuris nors P
lyg ir Q
lig pat S
lig šiol R
lig šiolei R
lyg tyčia R
lig tol R
lig tolei R
ligi kol R
ligi kolei R
ligi pat S
ligi šiol R
ligi šiolei R
ligi tol R
ligi tolei R
mažų mažiausiai R
nė kiek R
nė motais R
ne tik C
ne tiktai C
nė vienas P
nieko sau I
nieku gyvu R
nuo anksto R
nuo mažens R
nuo mažumės R
nuo pat S
nuo pat mažens R
nuo pat pradžių R
nuo pradžių R
nuo seno R
nuo šiol R
nuo šiolei R
nuo tol R
nuo tolei R
po galais I
po laiko R
po paraliais I
po perkūnais I
po šiai dienai R
po šimts I
po šimts perkūnų I
po šimts pypkių I
po šimts velnių I
po truputį R
po velnių I
po visam R
prie pat S
prieš pat S
prieš tai R
priešais pat S
šiaip jau R
šiaip ne taip R
šiaip sau R
šiaip taip R
šiek tiek R
šioks toks P
šis tas P
šit kaip I
t. y. R
tai bent I
tai va Q
taip kad Q
taip pat Q
taip pat R
tam tikras P
tarp kita ko Q
tarp kitko Q
tas pat P
tas pats P
ten pat R
tiek jau to I
tiek pat R
tiek to I
ties pat S
toks pat P
toks pats P
toli gražu R
tuo labiau R
tuo pačiu R
tuo tarpu C
tuoj pat R
tuoj tuoj R
tuojau pat R
už dyką R
vargais negalais R
vargu ar Q
vargu bau Q
vienui vienas A
vienur kitur R
vis dėlto C
vis tiek R
vis tik R
vis tiktai R
vis vien R
vis viena R
viso geriausio I
viso gero I
viso labo I
viso labo R
visų pirma R
visur kur R
vos ne vos R
vos vos R