Helge Dyvik

When:
1 April, 2011 @ 14:15 – 16:00
2011-04-01T14:15:00+02:00
2011-04-01T16:00:00+02:00
Where:
HF:216

Normklynger i bokmål og nynorsk
Sammendrag:
Valgfriheten innenfor bokmål og nynorsk favner et antall intrikat sammenvevede og overlappende språkvarieteter. Strukturen i dette komplekset av varieteter kommer ikke til uttrykk i offisiell norm: Bokmål og nynorsk er offisielt individuert som to, og bare to, målformer. Det vil si at all valgfrihet (med noen unntagelser) offisielt presenteres som innbyrdes uavhengige enkeltordsanliggender. Men alle språkkompetente nordmenn vet at det består avhengighetsforhold mellom de valg man kan treffe i en tekst som skal oppleves som stilistisk og varietetsmessig konsistent. Dette betyr at variasjonsmønsteret i det faktiske skriftspråket har en struktur: I det totale tekstkorpus har valgene innenfor rommet av valgmuligheter en tilbøyelighet til å danne klynger, der klyngene utgjør mer eller mindre klart avgrensede varieteter (‘moderat bokmål’, ‘radikalt bokmål’, ‘tradisjonell nynorsk’, ‘normkjernenynorsk’, osv.). Avhengighetsforholdene mellom bøyningsformer har ofte form av ensidige implikasjoner: Hvis man på bokmål skriver kasta, skriver man helst også døra, mens døra på sin side synes forenlig med både kastet og kasta. Av dette følger at døren på sin side impliserer kastet. Blant disse fire formene har altså valg av kasta eller døren implikasjoner, mens valg av kastet eller døra ikke har det – hvis da de nevnte intuisjonene er korrekte.
Slike avhengighetsforhold medfører at tekstene danner mer eller mindre skarpt avgrensede klynger i det multidimensjonale rom som skapes av de offisielle valgmulighetene. Både språklig rådgivning og fremtidig normering forutsetter kjennskap til denne klyngestrukturen: Hva slags varieteter finner vi; i hva slags tekster er en gitt varietet dominerende; er det fremdeles offisielle valgmuligheter som ikke benyttes i tekster med innflytelse på den operative (dvs. faktiske, i motsetning til den foreskrevne) skriftspråksnormen?
Studien tok sikte på å utprøve metoder for å kartlegge denne klyngestrukturen gjennom datamaskinell bearbeidelse og analyse av et tekstkorpus. Basert på nettutgaver av fire bokmålsaviser og seks nynorskaviser siden ca. 2000, men med hovedvekt på 2008 og 2009, ble et antall tekster ekstrahert i pilotprosjektet, der en ‘tekst’ er alt en gitt skribent har skrevet i en gitt avis. Dette arbeidet ble utført ved Uni Digital. Materialet ble begrenset til de 20 mest produktive skribentene i hver avis. Dette gav et bokmålskorpus på 22 millioner ord og et nynorskkorpus på 12 millioner ord, inndelt i 200 tekster. Korpus ble automatisk lemmatisert og morfologisk tagget, det vil si at hvert ord i tekstene ble forsynt med informasjon om oppslagsform og hvilken bøyningsform som foreligger i teksten. På grunnlag av dette materialet, sammen med en database over offisielt mulige ordformer i bokmål og nynorsk, var det nå mulig å registrere automatisk i en tabell alle substantivformer, verbformer og adjektivformer i hver enkelt tekst som kunne ha sett annerledes ut i henhold til normen. I pilotprosjektet er dette foreløpig gjort med et mindre utvalg av former, med sikte på å illustrere sentrale variasjonstyper i de to målformene, først og fremst hunkjønns- versus hankjønnsbøyning av felleskjønnsord i bokmål, og e- vs. a-infinitiv i nynorsk. Tabellene behandles dernest statistisk ved hjelp av korrespondanseanalyse. Korrespondanseanalyse avslører hvordan et stort antall variabler samvarierer, og presenterer resultatet som et mangedimensjonalt rom der variantene finnes distribuert slik at varianter som har en tendens til å opptre sammen, opptrer nær hverandre i rommet. Distribusjonen i de ulike dimensjonene kan inspiseres separat; typisk er man interessert i projeksjonen på de to mest informative dimensjonene. For pilotprosjektets materiale får vi da en distribusjon av tekster og ordformer i samme rom. Det er også gjennomført implikasjonsanalyser som viser hvilke formvalg som impliserer hvilke andre formvalg innenfor korpus.
Materialet er for lite til å tillate generelle konklusjoner om tilstanden i norsk skriftspråk, men studien viser at metoden kan gi verdifulle innsikter.

Leave a Reply