|
![]() |
![]() |
naviger: | ||||||||||
![]() | ||||||||||
Kart | ![]() |
Liste | ![]() |
Søk | ![]() |
Kildetekst | ![]() |
Om databasen | ![]() |
HJELP! |
Du kan sortere listen etter stedsnavn, kommunenavn, fylkesnavn og Tabu.0-region ved å klikke på SORTER under de respektive kolonneoverskriftene.
For å vise en bestemt prøve klikker du på stedsnavn for denne prøven (f.eks. Trondheim).
Du klikker på et kommunenavn, fylkesnavn eller en Tabu.0-region for å vise alle prøver fra denne kommunen/fylket/regionen.
For å høre opptaket av en bestemt prøve direkte fra listen klikker du på lenken .mp3 i kolonnen Opptak.
På kartet kan du se stedene prøvene er hentet fra. Beveg markøren over et sted for å se stedsnavn og kommune; klikk på stedet for å gå direkte til en prøve fra dette stedet.
Klikk på et fylke for å se en liste over prøver fra dette fylket; i denne listen klikker du på stedsnavn for å gå til prøven, eller på .mp3 for å høre opptaket.
Kartet er implementert som JavaScript/DHTML, og bør fungere i Internet Explorer versjon 4 og oppover på windows og Netscape Navigator versjon 4 og oppover på windows, mac og linux.
Hver dialektprøve viser:
Klikk på lenkene .mp3 eller .wav for å høre opptaket. Hvis du vil lagre opptaket kan du høyreklikke lenken og velge save target as el.l. (windows/linux); eller holde museknappen nede over lenken og velge save target as el.l. (mac).
Som ellers kan du klikke på kommunenavn, fylkesnavn eller Tabu.0-region for å vise alle prøver fra disse områdene.
Ved hjelp av søkeverktøyet kan du få frem alle dialektprøver med en bestemt egenskap.
Du kan foreløpig søke etter:
TABU.0-regionene har vi lånt fra et større taleinnsamlingsprosjekt kalt TABU.0, som ble gjennomført av Telenors Talegruppe for å få et materiale til å kunne forske på taleteknologi. TABU står for TAleBaserte brUkergrensesnitt, og resultatet av prosjektet var en database med taleopptak som inneholder 782 innlesere fordelt over de 24 TABU.0-regionene du finner i oversikten under. I TABU.0-prosjektet avgjorde innleserne selv sin dialektregion ved hjelp av en kort instruksjon ledsaga av en beskrivelse av de ulike regionene.
Mer om TABU.0 finner du i: Amdal, I. og Ljøen, H. (1995). TABU.0 - en norsk telefontaledatabase. FoU R 40/95. Telenor FoU.
Oversikt over Tabu.0-regioner:
Tabu.0 deler inn landet i 24 dialektregioner, inkludert en ikke-geografisk region kalt Utenlandsk språkbakgrunn.
For personer som har bodd lengre perioder i ulike regioner brukes den regionen de bodde i da de ble 15 år. Legg merke til at grensene for dialektregioner og fylker ikke nødvendigvis er sammenfallende. Region 21 går for eksempel over 4 fylker, mens region 17 er en del av ett fylke.
Her følger en kommunevis oversikt over Tabu.0-regionene:
01: Fra Finnmark fylke: Vardø, Vadsø, Hammerfest, Alta, Hasvik, Kvalsund, Måsøy, Nordkapp, Porsanger, Lebesby, Gamvik, Berlevåg, Båtsfjord, Sør-Varanger.
02: Fra Finnmark fylke: Kautokeino, Loppa, Karasjok, Tana, Nesseby. Fra Troms fylke: Lyngen, Storfjord, Kåfjord, Skjervøy, Nordreisa, Kvænangen.
03: Alle kommuner i Troms fylke unntatt Lyngen, Storfjord, Kåfjord, Skjervøy, Nordreisa, Kvænangen.
04: Fra Nordland fylke: Narvik, Tysfjord, Lødingen, Tjeldsund, Evenes, Ballangen, Bø, Øksnes, Sortland, Andøy.
05: Fra Nordland fylke: Bodø, Gildeskål, Beiarn, Saltdal, Fauske, Skjerstad, Sørfold, Steigen, Hamarøy, Røst, Værøy, Flakstad, Vestvågøy, Vågan, Hadsel, Moskenes.
06: Fra Nordland fylke: Dønna, Nesna, Hemnes, Rana, Lurøy, Træna, Rødøy, Meløy.
07: Fra Nordland fylke: Sømna, Brønnøy, Vega, Vevelstad, Herøy, Alstahaug, Leirfjord, Vefsn, Grane, Hattfjelldal.
08: Fra Nordland fylke: Bindal. Fra Nord-Trøndelag fylke: Namsos, Fosnes, Flatanger, Vikna, Nærøy, Leka. Fra Sør-Trøndelag fylke: Hemne, Snillfjord, Hitra, Frøya, Ørland, Agdenes, Rissa, Bjugn, Åfjord, Roan, Osen. Fra Møre og Romsdal fylke: Kristansund, Averøy, Frei, Gjemnes, Tingvoll, Sunndal, Surnadal, Rindal, Aure, Halsa, Tustna, Smøla.
09: Fra Nord-Trøndelag fylke: Steinkjer, Meråker, Stjørdal, Frosta, Leksvik, Levanger, Verdal, Mosvik, Verran, Namdalseid, Inderøy, Snåsa, Lierne, Røyrvik, Namsskogan, Grong, Høylandet, Overhalla. Fra Sør-Trøndelag fylke: Trondheim, Orkdal, Melhus, Skaun, Klæbu, Malvik.
10: Fra Sør-Trøndelag fylke: Oppdal, Rennebu, Meldal, Røros, Holtålen, Midtre Gauldal, Selbu, Tydal.
11: Fra Møre og Romsdal fylke: Molde, Rauma, Nesset, Midsund, Aukra, Fræna, Eide.
12: Fra Sogn og Fjordane fylke: Selje. Fra Møre og Romsdal fylke: Ålesund, Vanylven, Sande, Herøy, Ulstein, Hareid, Volda, Ørsta, Ørskog, Norddal, Stranda, Stordal, Sykkylven, Skodje, Sula, Giske, Haram, Vestnes, Sandøy.
13: Alle kommuner i Sogn og Fjordane fylke unntatt Selje, Sogndal, Balestrand, Leikanger, Aurland, Vik, Lærdal, Årdal, Luster.
14: Fra Sogn og Fjordane fylke: Sogndal, Balestrand, Leikanger, Aurland, Vik, Lærdal, Årdal, Luster.
15: Fra Hordaland fylke: Voss, Granvik, Ulvik.
16: Alle kommuner i Hordaland fylke unntatt Bergen, Askøy, Fjell, Sund, Os, Voss, Granvin, Ulvik.
17: Fra Hordaland fylke: Bergen, Askøy, Fjell, Sund, Os.
18: Alle kommuner i Rogaland fylke.
19: Alle kommuner i Vest-Agder fylke.
20: Alle kommuner i Aust-Agder fylke.
21: Alle kommuner i Oppland og Hedmark fylker. Alle kommuner i Telemark fylke unntatt Porsgrunn, Skien, Bamble, Kragerø, Siljan, Nome. Alle kommuner i Buskerud fylke unntatt Kongsberg, Øvre Eiker, Nedre Eiker, Drammen, Lier, Røyken, Hurum.
22: Alle kommuner i Oslo og Akershus fylker samt Rømskog fra Østfold fylke.
23: Alle kommuner i Vestfold fylke. Alle kommuner i Østfold fylke unntatt Rømsskog. Fra Telemark fylke: Porsgrunn, Skien, Bamble, Kragerø, Siljan, Nome. Fra Buskerud fylke: Kongsberg, Øvre Eiker, Nedre Eiker, Drammen, Lier, Røyken, Hurum.
24: Utenlandsk språkbakgrunn, ingen av regionene over.
Ukomprimert digitallyd tar svært mye lagringsplass. F.eks. er hver av dialektprøvene våre på rundt 3 megabyte, noe tar omtrent et kvarter å laste ned over et 28.8-modem.
MP3 (MPEG 1 layer 3) er et kompresjonsformat som bygger på en psyko-akustisk modell av hvordan mennesker oppfatter lyd. I praksis vil det si at man ved å kode lyd i MP3-format kan redusere størrelsen på lydfiler med en faktor på 12 uten nevneverdig tap av kvalitet.
Siden dialektprøvene våre kun består av tale kan vi komprimere enda mer, så en dialektprøve på 200 kilobyte kan lastes ned på under ett minutt over et 28.8-modem.
NB: Selve MP3-formatet er siden vi startet dette prosjektet blitt problematisk for ikke-kommersiell bruk. Vi tar derfor for fremtiden sikte på å gå over til det teknisk overlegne og fullstendig åpne Ogg Vorbis-formatet, og eventuelt RealAudio for størst mulig nedslagsfelt.
For Windows og MacOS anbefaler vi Microsofts Windows Media Player eller Nullsofts Winamp (Winamp for MacOS er foreløpig i alfaversjon). For linux anbefaler vi i utgangspunktet RealMedias RealPlayer, men hvis den skaper problemer finnes mange andre MP3-spillere.
NB: Med enkelte av MP3-filene har vi opplevd et problem med at RealPlayer kutter de siste sekundene. Dette er foreløpig observert for Windows 98, NT 4 og MacOS. Både for Windows og MacOS har Windows Media Player ingen problemer med avspilling av samme filer.
|
I korte trekk: Du må forsikre deg om at Netscape kjenner til mime-typen audio/mpeg, og vet om et program som kan spille filer med denne mime-typen. Her bruker vi RealPlayer som eksempel for alle plattformer, men du kan selvfølgelig bruke andre.
For linux er RealPlayer den eneste spilleren vi har fått Netscape til å samarbeide med. Men MP3-filene kan selvsagt lastes ned til din maskin, og et hvilket som helst program kan spille de derfra.
|
WAV (Windows PCM waveform) er det mest brukte lydformatet på windows-plattformer, og er ukomprimert standard PCM-kodede bølgeformer. (Skjønt ikke alle filer med endelsen .wav er WAV i denne forstand). WAV-filene du kan laste ned fra Nordavinden og Sola er alle 16 bit 44.1kHz mono.
WAV-filene du finner her er beregnet på brukere som vil gjøre akustiske analyser av data. Hvis du bare vil høre på dialektprøvene er MP3-filene mer velegnede.
PNG (Portable Network Graphics) er et open source grafikkformat som for alle formål er et bedre alternativ enn det lisens-problematiske GIF-formatet.
Ulike versjoner av Netscape Navigator og Internet Explorer støtter PNG i større og mindre grad. På PNGs websider kan du se en detaljert oversikt over hvilke nettlesere som kan vise PNG-bilder. Uansett, med en relativt ny versjon av en av disse burde du ikke oppleve problemer.
Den ortografiske gjengivelsen er lagd med tanke på de som ikke kjenner IPA eller X-SAMPA (se de to neste seksjonene). Denne transkripsjonen bruker bare vanlige norske skrifttegn, men er ikke tro mot de tradisjonelle skriftnormene - det er eksempelvis ikke brukt store bokstaver. Videre vil forskjellen på "mann" og "mannj" være at den siste uttalen av ordet har en palatal n-lyd. Uttales "nordavinden" med tjukk l til slutt i "nord", og med palatal n til slutt i "vinden", vil "nordavinden" transkriberes "nolavinnj". Dobbel konsonant betyr at foregående vokal oppfattes som kort. "Sj-lyd" er konsekvent transkribert som "sj", f.eks. ville "Oslo" transkriberes "osjlo" hvis ordet uttales med "sj" i stedet for en ordinær "s". Ytringene er skilt med punktum.
Kort om lydskrift
Lydskrift er ein sentral komponent i faget fonetikk, som studerer det talte språket.
Lydskrift er difor ei skrift som skal gjengi det vi seier. Mange av oss er kanskje ikkje
så bevisste på at språket vårt finst i to forskjellige former - muntleg og skriftleg - sjøl
om vi gjerne både snakkar, skriv og les dagleg. Vi kan bruke ordet skjørtet som eksempel.
Vi skriv ordet med åtte bokstavar, men uttalar det med berre fire lydar i mange norske
dialektar: skj--ø--rt--et. Og det er her lydskrifta kjem inn. Formålet med lydskrift er
at den skal gjengi nøyaktig det vi seier, dei lydane vi uttalar. Dersom eg seier ordet
skjørtet med berre fire lydar, så vil lydskrifta til min uttale av ordet berre ha fire
lyd-teikn.
IPA
Det lydskriftsystemet vi brukar i Nordavinden og sola heiter IPA. IPA står for to ting:
International Phonetic Alphabet, og International Phonetic Association.
IPA som forening vart stifta i 1886. Ei gruppe med språklærarar i Frankrike såg stor
nytteverdi i å bruke fonetisk teori og lydskrift i språkundervisninga si, og ønska å
popularisere sine læringsmetodar.
I 1888 vart det første IPA-kartet presentert, og sidan da har kartet vorte revidert ei rekkje
gonger - sist det skjedde var i 1996. Denne versjonen inneheld et symbol for alle språklydar
som er kjent per 1996, og gjer det mogleg for oss å praktisere det som er sjølve hovedpoenget
med lydskrift: Å operere med et ein til ein-forhold mellom symbol og språklyd.
Oppbygging
IPA-alfabetet er delt opp i fleire seksjonar. Det internasjonale kartet er delt i seks tavler,
medan det held å bruke tre av desse når vi skal skildre norsk talespråk. Dei tre tavlene er
konsonanttavla, vokaltavla og en tredje seksjon som vi kallar for diakritiske teikn.
Du kan finne en nett-versjon av det norske IPA-kartet
på www.ling.hf.ntnu.no/ipa/no/,
medan det komplette kartet ligg på
www.ling.hf.ntnu.no/ipa/full/.
Referansar:
1949, opptrykt 1984. The Principles of the International Phonetic Association. UCL, London.
1999. Handbook of the International Phonetic Association. Cambridge University Press.
SAMPA (Speech Assessment Methods Phonetic Alphabet) er et fonetisk alfabet som kan leses både av mennesker og datamaskiner. I korte trekk er det en mapping fra IPA-symboler til de 7-bits skrivbare ASCII/ANSI-tegnene (33..127).
SAMPA er blitt tilpasset ulike språk, deriblant norsk. SAMPA for Norwegian gir særnorske konvensjoner for diftonger, retroflekser, hovedtrykk og tonelagsmerking.
XSAMPA er et forslag til en utvidelse av SAMPA som gjør det mulig å transkribere alle tegn på IPA-kartet.
Jørn og Kristian synes at XSAMPA er fantastisk, og bruker det hele tiden ^_^
|