Scarrie Lexical Database (Norwegian)

Leksikalsk database

Innenfor SCARRIE-prosjektet ble det konstruert en leksikalsk database for norsk. Materialet i denne databasen er for tiden den mest omfattende ressursen med informasjon om subnormer/stiler innenfor bokmål. Materialet inneholder også noen rettelser i forhold til Bokmålsordboken og NorKompLeks. Materialet er likevel ikke fullstendig manuelt kontrollert.

Databasen ble laget med medvirkning fra:

  • Paul Meurer, HIT (databasedesign og webgrensesnitt, programmering i COMMON LISP)
  • Victoria Rosén, HIT/Seksjon for lingvistiske fag (definisjon av koder og normer)
  • Karit Elise Valen, HIT (koding av ordformer)
  • Koenraad de Smedt, HIT/Seksjon for lingvistiske fag (faglig ledelse)
  • Torbjørn Nordgård, NTNU (underleverandør: material fra NorKompLeks)

Vi takker også Jon Erik Hagen, Helge Sandøy og Helge Dyvik for lingvistiske insikter og godt råd ifm. variasjon i bokmål.

Prosjektet har fått støtte fra EU. Den norske delen har blitt utført ved Universitetet i Bergen. Materialet eies av partnerne i SCARRIE-prosjektet. Materialet er rettighetsbelagt og kan ikke brukes til kommersielle formål uten nærmere avtale. All bruk av dette materialet i forskning og formidling skal klart oppgi at materialet kommer fra SCARRIE-prosjektet ved UiB.

Databasen inneholder bøyningsformer av bokmålsord (unntatt genitiv og avledninger). For hver bøyningsform er det oppgitt følgende seks kolonner med informasjon (se et lite utdrag med eksempler):

  1. ordform
  2. frekvens (ikke lagt inn for tiden)
  3. ordtype mht. norm/stil (se nedenfor)
  4. kategori og trekk for sammensetningsanalyse
  5. evt. erstatning
  6. kategori og trekk for setningsanalyse

Ordtype består av en bokstavkode og evt. tallkoder for norm/stil:

  • N = normalt ord, erstattes ikke under noen normer/stiler.
  • C = skal erstattes under oppgitte normer/stiler.
  1. Nøytralt bokmål
  2. Konservativt bokmål
  3. Radikalt bokmål
  4. Læreboknormalen
  5. ‘Anything goes’

C12 betyr for eksempel “erstatt i nøytralt og konservativt bokmål”.