Leksikalsk database
Innenfor SCARRIE-prosjektet ble det konstruert en leksikalsk database for norsk. Materialet i denne databasen er for tiden den mest omfattende ressursen med informasjon om subnormer/stiler innenfor bokmål. Materialet inneholder også noen rettelser i forhold til Bokmålsordboken og NorKompLeks. Materialet er likevel ikke fullstendig manuelt kontrollert.
Databasen ble laget med medvirkning fra:
- Paul Meurer, HIT (databasedesign og webgrensesnitt, programmering i COMMON LISP)
- Victoria Rosén, HIT/Seksjon for lingvistiske fag (definisjon av koder og normer)
- Karit Elise Valen, HIT (koding av ordformer)
- Koenraad de Smedt, HIT/Seksjon for lingvistiske fag (faglig ledelse)
- Torbjørn Nordgård, NTNU (underleverandør: material fra NorKompLeks)
Vi takker også Jon Erik Hagen, Helge Sandøy og Helge Dyvik for lingvistiske insikter og godt råd ifm. variasjon i bokmål.
Prosjektet har fått støtte fra EU. Den norske delen har blitt utført ved Universitetet i Bergen. Materialet eies av partnerne i SCARRIE-prosjektet. Materialet er rettighetsbelagt og kan ikke brukes til kommersielle formål uten nærmere avtale. All bruk av dette materialet i forskning og formidling skal klart oppgi at materialet kommer fra SCARRIE-prosjektet ved UiB. |
Databasen inneholder bøyningsformer av bokmålsord (unntatt genitiv og avledninger). For hver bøyningsform er det oppgitt følgende seks kolonner med informasjon (se et lite utdrag med eksempler):
- ordform
- frekvens (ikke lagt inn for tiden)
- ordtype mht. norm/stil (se nedenfor)
- kategori og trekk for sammensetningsanalyse
- evt. erstatning
- kategori og trekk for setningsanalyse
Ordtype består av en bokstavkode og evt. tallkoder for norm/stil:
- N = normalt ord, erstattes ikke under noen normer/stiler.
- C = skal erstattes under oppgitte normer/stiler.
- Nøytralt bokmål
- Konservativt bokmål
- Radikalt bokmål
- Læreboknormalen
- ‘Anything goes’
C12 betyr for eksempel “erstatt i nøytralt og konservativt bokmål”.