Informant
Opptak
Tekst
Utvalg
Hjelp

Velg informant direkte:

Tast inn et eller flere referansenumre, atskilt med blanke.
Referansenr.:
Demografiske trekk:
Alder
min: maks:

Kjønn
kvinne: mann:

Bosted
Vest Øst

Yrke
Utelukk

Ta med

Utdannelse
Egen Høy: Lav:

Se utvalget
down
add
drop

down
add
drop

down
add
drop

down
add
drop

TAUS versjon 1.0.1 (Beta)
Denne versjon av TAUS virker best i Firefox, både på Mac og Windows. På Windows kan Internet Explorer også brukes.
Firefox kan lastes ned ved http://www.mozilla.com/firefox/

Om TAUS-korpuset og søkegrensesnittet

Les mer om disse emnene nedenfor:

Informantene
Det opprinnelige TAUS-materialet fra 1970-tallet bestod av 36 informanter fra A-serien, 26 informanter fra B-serien og 12 informanter fra C-serien. Opptakene ble lagret på spolebånd, og de fleste av båndene har vi klart å få tak i. C-serien er komplett, og fra A-serien har bare to bånd gått tapt. B-serien har vi imidlertid ikke klart å oppspore, så disse informantene er utelatt.

Det moderne TAUS-korpuset inneholder 59 informanter. Av disse er:

• 34 informanter fra A-serien. Informantene kommer fra Vålerenga og Frogner, og er mellom 35 og 75 år
• 12 informanter fra C serien. Informantene kommer fra Kampen og Frogner, og er mellom 15 og 17 år
• 13 informanter fra lydbånd isom ikke ble tatt med i den originale TAUS-undersøkelsen (A-serien). Disse informantene har vi foreløpig lite informasjon om.

I den originale TAUS-undersøkelsen var det like mange informanter fra Oslo øst som Oslo vest, og det var like mange kvinner som menn.

Opptakssituasjon
Hver informant ble intervjuet hjemme hos seg. Intervjuene varer fra 15 til 45 minutter.

Lydkvalitet
De originale spolebåndene (1/4" lydbånd) er av varierende kvalitet, noen er brukbare, andre har mye susing og svært lav lyd. I noen tilfeller har opptaksutstyret vært feil innstilt slik at opptaket har variabel hastighet. Dette fører til at opptaket noen ganger går for fort, noen ganger alt for sakte.

Transkripsjon og ordklassetagging
Hele TAUS-korpuset er nytranskribert med ortografisk transkripsjon, se transkripsjonsveiledningen for NoTa for flere opplysninger. TAUS-korpuset er tagget med NoTa-taggeren, en statistisk talemålstagger (TreeTagger) som er trent på talemålsmaterialet fra NoTa-Oslo. NoTa-taggeren merker hvert ord i materialet med ordklasse og annen morfologisk informasjon. Foreløpig kan man bare søke på ordklasse, men flere muligheter kommer senere.

Søkegrensesnitt og søkemuligheter
NB! Vær klar over at korpuset inneholder ekte mennesker, så all sitering og omtale bør gjøres med varsomhet og respekt for den enkelte.

Søk på frekvente ord eller frekvente ordklasser kan ta lang tid. Et godt råd er å begrense søket. (Eksempel: Del søket på jeg opp i flere søk, først et søk på jeg uttalt av kvinner mellom 16 og 25, deretter søk på jeg og menn mellom 16 og 25 osv.)

Siden korpuset fortsatt er under oppbygging, vil vi gjerne ha kommentarer om ting virker annerledes enn de burde, eller om dere har forslag til forbedringer. (Send en epost til Kristin Hagen) Videre vil det skje endringer og forbedringer i løpet av våren, særlig disse:

• Søk på frekvente ord vil gå hurtigere
• det blir mulig å søke på morfologiske trekk som substantivets kjønn, tempus osv
• det blir mange flere muligheter når det gjelder å få presentert resultatene på ulike måter (sortert på
ulike vis, ferdig presentasjon i form av ulike grafiske fremstillinger o.a.)
• det blir mulig å få tatt vare på resultatene på egen fil, kode dem med egne koder og sortere dem på ulike måter
• Det blir mulig å søke i de originale TAUS-transkripsjonene. (20 intervju fra TAUS har originaltranskripsjon i digital form. Originaltranskripsjonen er koplet sammen med den nye ortografiske transkripsjonen, men foreløpig er det ikke mulig å søke i den originale transkripsjonen.

Kort bruksanvisning
Forsiden har fire faner øverst: Informant, Opptak, Tekst, Utvalg

• Klikk på Informant:
Her kan man velge informanter ut fra variablene alder, kjønn, bosted, yrke og utdannelse. Når man klikker på en av disse, får man opp mer detaljerte muligheter for avgrensning av informantutvalget. I tekstboksene som kommer til syne, står alternativer man må klikke på for å utelukke eller velge ved hjelp av pilene mellom tekstboksene.
Klikker man på Se utvalget, får man opp en liste over de informantene man har valgt.

• Klikk på Opptak:
TAUS-materialet inneholder bare intervjuer, så her er det ingen valg.

• Klikk på Tekst:
Her kommer det opp et eget vindu hvor man kan velge å fylle inn et søkeord eller flere (i en eller flere bokser). Hvert ord må stå i en egen boks. Trykk på pilene til høyre og få flere bokser. (Eksempel: Søk på sekvensen på grunn av. Skriv i første boks, grunn i andre boks til høyre, klikk på høyrepil og skriv av i siste boks.) Spesifiser avstanden mellom ordene ved å skrive inn tall i de egne småboksene. Unnlater man å skrive et tall, er standardinnstillingen at det er null ord mellom.

Trykk på pilene under for å få opp bokser for disjunktive søk. (Eksempel: Søk på pronomenene hun og han. Skriv f.eks. hun i boksen øverst til venstre, og klikk på pilen under for å få opp en ny boks hvor man skriver han.)

Ved å fjerne en boks, fjerner man også det som sto inni, så det blir som å klikke på Tøm.

Alternativer under Tekst
•• Ordklasse:
Velg eller velg bort ønsket ordklasse. Søket virker alene eller sammen med tekst i tekstboksen (Eksempel: Søk på alle subjunksjoner eller søk på som subjunksjon. Vil man ha både som subjunksjon og verb, benytter man disjunksjonsboksene og søker etter som subjunksjon i den øverste boksen og som verb i boksen nedenunder.) Ordklassen som er valgt, blir synlig i en liten boks under tekstboksen. Dobbeltklikk på ordklassen boksen for å velge det bort.
•• Start på ord, inni ord, slutt på ord: Er man interessert i prefikser, suffikser eller rett og slett begynnelse av ord, slutt av ord eller bokstavkombinasjoner inne i ord, velger manen av disse alternativene. (Eksempel: søker man på alle ord som begynner med hu, får man husker, hun, husleia osv.)
•• Lemma: Skriv inn grunnformen av søkeordet, og søket vil gi alle bøyingsformene av ordet. (Søk på være og få alle forekomster av være, er, var, vært)
•• x:
Velg x og få alle ordene som er merket som x i korpuset, det vil si ord som ikke står i Bokmålsordboka, for eksempel nye ord, slang, dialektord eller ord fra andre språk
•• Uttale: Uttale som avviker fra standard østnorsk er vanligvis ikke transkribert. Unntaket er pronomener. Om informanten f.eks. sier hu, transkriberes dette hun [utt=hu]. Velger man uttale og skriver aktuell uttalevariant i søkeboksen (f.eks. hu), får man alle eksempler der hun er uttalt hu.
•• Ikke-språklig: Ikke språklige lyder er også annotert. Under ikke-språklig kan man velge ikke-språklige lyder ut i fra en liste. (Eksempel: Bakre klikkelyd eller gjesping)

Trykker man så på Søk-knappen, får man opp alle resultatene som tilfredsstiller kombinasjonen av kriterier som har fått treff (informantutvalg, opptakssituasjon og tekst).

• Resultatene
Resultatene kommer opp i et eget vindu i form av konkordanser. Helt øverst er det plass til lydklipp. Klikker man på høytalerikonet til venstre for hver konkordanselinje, får man opp lyd som er koblet til den linjen. Konteksten kan økes inni multimedievinduet. Klikker man på informasjons-i’en, får man informasjon om informanten.

Utvalgte informanter
Alle opptak er fra intervjuer.