Institutt for språk- og kommunikasjonsstudier, NTNU > Nordavinden og sola

Nordavinden og sola

Vis dialektprøver på norgeskart Vis liste over dialektprøver

naviger:
 Kart   Liste   Søk   Kildetekst   Om databasen   HJELP! 

Hva:

Nordavinden og sola er en nett-tilgjengelig database som inneholder opptak og transkripsjoner av historien om Nordavinden og sola lest på ulike norske dialekter. Opptakene finnes i MP3- og WAV-format, og transkripsjonene foreligger i vanlig IPA-notasjon, i XSAMPA, og ortografisk gjengitt.

Databasen dekker størsteparten av dialektvariasjonen i norsk talemål.

Hvem:

Opptak og transkripsjoner er ved Jørn Almberg, bearbeiding, teknisk tilrettelegging, database og web-grensesnitt ved Kristian Skarbø.

Hvordan:

Opptaksprosessen

Alle opptakene er gjort i opptaksrommet til Lingvistisk institutt på NTNU Dragvoll. Innleserne lagde først et tilpassa manuskript på grunnlag av kildeteksten. Her hadde de anledning til å bytte ut ord, og endre på ordrekkefølge der dette var nødvendig ut fra den enkeltes dialektbakgrunn. De ulike prøvene er følgelig ikke identiske ord for ord, selv om de springer ut fra den samme originalteksten. Leserne ble bedt om å tenke seg at de leste teksten for en de kjente som har samme dialektbakgrunn som dem sjøl. Motivasjonen bak denne instruksjonen var å få en uttale som for det første hadde en så naturlig talestil som mulig, og for det andre var rimelig dialektalt korrekt. Leserne hadde anledning til å lese historia flere ganger, til de var fornøyd med sin egen lesning. Etter at opptaket var gjennomført, fikk leserne også høre gjennom opptaket, slik at de kunne vurdere om de syntes lesinga de hadde gjort var akseptabel.

Teknisk utstyr
Mikrofonen som ble brukt er av merket MILAB LSR-1000, og prøvene ble spilt inn i DAT-format ved hjelp av en FOSTEX D-10 Digital Master Recorder.

Digitalisering og posteditering
DAT-opptakene ble overført og digitalisert til .wav-format ved hjelp av lydediteringsprogrammet CoolEdit Pro. Det samme programmet ble videre brukt til støyreduksjon, normalisering og balansering av opptakene.

Fonetisk transkripsjon

Den fonetiske transkripsjonen er gjort i det data-lesbare notasjonsspråket X-SAMPA. Transkripsjonen har deretter blitt konvertert til det tradisjonelle lydskriftalfabetet IPA ved hjelp av Kristians oversettingsprogram XSAMPA2IPA.

Konvensjoner for transkripsjonen:
Generelt kan vi si at transkripsjonene tar mål av seg å være på et detaljert nivå, ved at den skal reflektere den realiserte strengen av språklydsegmenter/-sekvenser i de enkelte dialektprøvene. Enkelte typiske ko-artikulatoriske trekk som labialisering av konsonanter før runda vokaler er imidlertid ikke gjengitt i transkripsjonen.
Transkripsjonen er gjort på grunnlag av lytting. Det vil si at vurdering på alle nivå, fra enkeltlyders kvalitet til de større enheters prosodiske egenskaper er gjort på et subjektivt grunnlag. Akustiske analyser er med andre ord ikke brukt i transkripsjonsarbeidet. Vi har hatt god hjelp av innspill og kommentarer til transkripsjonene fra Arne Kjell Foldvik, og Andreas Vikran har bistått arbeidet med å markere tonelag i prøvene fra de tre nordligste fylkene.
Detaljrikdommen i transkripsjonen har vært veid opp mot den udiskutable verdien som ligger i en konsistent transkripsjon. Å transkribere dialekter som ligger langt unna ens egen er alltid utfordrende, om ikke direkte risikabelt, og vi har derfor søkt å få innspill fra innleserne selv der dette har vært hensiktsmessig. Vi vil like fullt være glade for alle innspill til transkripsjonene i databasen.

Tegninventar:

Ei oversikt over alle lydtegna som er brukt, med eksempeluttaler, er å finne i Norske språklyder.

Tekniske detaljer og referanser

Opptakene er konvertert til 56kbps MP3-filer ved hjelp av LAME.

Opptakene er transkribert i XSAMPA ut i fra fremstillingen i John Wells' artikkel "Computer coding the IPA: A proposed extension of SAMPA", pluss hovedtrykk og tonelagsmerking etter konvensjonene til "SAMPA for Norwegian".

XSAMPA-transkripsjonene blir automatisk oversatt til IPA-koding i utf-8 (UNICODE) ved hjelp av programmet XSAMPA2IPA (som vil bli tilgjengelig etterhvert som Kristian får bedre tid...)

Et perl-skript lager PNG-bilder av utf-8-teksten ved hjelp av GD.pm og fonten Arial Unicode MS.

Databasen bruker GPL-lisensert MySQL, og grensesnittet er implementert på Zope som kjører bak Apache på Red Hat Linux. (Grensesnittet ble forsøksvis implementert i PHP, før vi bestemte oss for Zope -- mer elegant, mer robust og like raskt).


Lenker: