Hvor enkelt er alfabetet?

Vi tar alfabetet for gitt. Men det burde vi antagelig ikke gjøre. Rekkefølgen mellom bokstavene er helt tilfeldig. Og hva kommer først, a eller A, à eller á?

(Foto: iStockphoto)

Det er jo enkelt og greit hva «det latinske alfabetet» er – kanskje. Det er to ting: a b c d e f g h i j k l m n o p q r s t u v w x y z – disse bokstavene, og den innbyrdes rekkefølgen. Men selvsagt er det ikke så enkelt.

Latin ble skrevet med bokstavene A B C D E F H I L M N O P Q R S T V X. Tegnet C kommer fra gresk Γ, som på latin ble brukt for både k-lyden og g-lyden.

Etter hvert modifiserte de C med en liten hake og fikk G. Og så lånte de etter hvert K, Y og Z fra gresk (for de trengte å skrive greske ord også).

Latin skilte ikke i skrift mellom I og J eller mellom U og V. Og W var helt ukjent til langt inn i middelalderen, da VV ble satt sammen for å kunne skrive germanske ord.

Rekkefølgen av tegnene var nok allerede i den klassiske tida ganske fast. I tidlig latin kom ofte Z mellom F og H. Etter hvert festnet det klassisk latinske alfabetet seg slik: A B C D E F G H I K L M N O P Q R S T V X Y Z. Denne rekkefølgen er så godt som totalt blottet for språklig logikk. Det er bare blitt slik i en tilfeldig historisk utvikling.

Hele det latinske tegnsettet

Etter hvert har det latinske alfabetet spredt seg til alle verdensdeler og så godt som alle språkfamilier, selv om det bare er ett av fem offisielle alfabeter i Europa (latinsk, kyrillisk, gresk, armensk og georgisk; i tillegg kan en også regne med hebraisk, som brukes til å skrive jiddisk, som har offisiell status i flere europeiske land).

De alle fleste språkene har tilpasset tegnsettet for å passe med lydene på det enkelte språket. Norsk er selvsagt ikke i noen særstilling i så måte. Faktisk er våre «æ-ø-å-problemer» små i forhold til de «problemene» enkelte andre språk har hatt med sine tegnsett.

I et historisk perspektiv har disse problemene vært svært begrenset. De startet med innføring av elektronisk databehandling sånn omkring 1960-tallet, og nå er problemene for lengst løst – stort sett – egentlig. Du vet det kanskje ikke, men sannsynligvis er det mulig også på din datamaskin å skrive «ă ÿ ħ ŀ ő Œ ǿ ǖ ζ α ΰ Ж щ ҝ ẫ א☺» (om behovet skulle melde seg).

Løsningen ligger i den internasjonale standarden som er kjent som Unicode. Standarden dekker de aller fleste tegn som brukes for å gjengi språklig tekst, pluss massevis av «kruseduller» (som ₪ ↔ ☺ ♫). Og den blir stadig utvidet til å omfatte for eksempel lydskrifttegn og tegn som trengs for å registrere historiske dokumenter på vitenskapelig tilfredsstillende måte.

I Unicode er a á à e é è o ó ò ni ulike bokstavtegn, ikke tre bokstavtegn pluss to diakritiske tegn. Dette beror på et vesentlig teknologisk valg som har betydning også når en skal bestemme seg for hvilke tegn en trenger. Dette valget er blant annet betinget av í, som jo ikke egentlig er «i med akutt aksent», men «i uten prikk med akutt aksent».

Unicode har 560 ulike bokstavtegn som betegnes som «latinsk», der «Latin letter» inngår i betegnelsen. Alle tegnene har sine «navn». For eksempel er á «Latin small letter a with acute» og «Hebrew letter alef with qamats».

Det er nødvendigvis en viss treghet i overgangen til bruk av Unicode i alle sammenhenger. For eksempel er en del offentlige register stadig basert på mer begrensede tegnsett.

Dette kan være svært store databaser og omfattende programsystemer som må oppdateres i takt med øvrig utskifting og oppgradering. Men det er ingen grunn for noen til å utvikle nye systemer som har problemer med å gjengi et fullstendig tegnsett.

Det norske tegnsettet

Utdrag fra russisk ordbok, kyrillisk skrift (Foto: iStockphoto)

For en del år siden gikk Moldova over fra å bruke det kyrilliske til det latinske alfabetet. Moldovisk er nå identisk med rumensk. Tidligere ble de skrevet med ulike alfabeter; nå skrives de også likt.

Skrivemåten av moldoviske stedsnavn ble dermed endret. Siden de gamle navnene hadde sine «offisielle» transkripsjoner til norsk, vedtok daværende Norsk språkråd nye «norske» former av moldoviske navn. Der finner en ă ş ţ, som er vanlige tegn på rumensk og moldovisk. Men da ble vel også disse tegnene «norske».

For at språkrådets vedtak skal ha noen mening, må en jo kunne gjengi dem i norske bøker, og de må kunne skrives på norske datamaskiner.

Da er det kanskje ikke hensiktsmessig å sette opp en liste over «norske» tegn. Om en likevel skulle gjøre et forsøk, kunne det være:

(1) a–å er jo opplagt

(2) á à ã ä ç é è ê ë í ï ñ ó ò ô ö ú ü fins i norske rettskrivningsordbøker eller er forholdsvis ofte brukt i gjengivelse av stedsnavn,

(3) ă â ã ā ć č đ ð ę ğ î ł ń ň ŋ ő ř ś š ş ţ ŧ þ ù ý ź ? forekommer i Språkrådets egen «geografiliste» (i tillegg til bokstavene under de to første punktene), og da er det forholdsvis tilfeldig at tegn som ċ ē ġ ħ ī ō ū ű ż (fra andre europeiske språk) ikke er med.

For å skrive samisk må en i det minste ha tegnene č đ ŋ š ŧ ? (i tillegg til de fleste «norske» tegnene). Det må i det minste alle norske datamaskiner kunne skrive. Men er det egentlig noe behov for å begrense?

Hvorfor alle disse tegnene?

Hva skjer når en person med «utenlandsk» navn slår seg ned i Norge? La oss kalle ham Mąňń (fordi det er enklere enn Kŵıņńĕ). Det er opplagt upraktisk å hete «Mann» i Norge, så Mąňń insisterer på å hete Mąňń, også i forhold til folkeregister og skattemyndigheter. Brev til «Mann» blir rett og slett returnert til avsender med påskrift «adressaten ukjent». Mąňń kjenner ikke noen Mann.

En europeisk konvensjon helt tilbake fra 1974 (International Commission on Civil Status, der Norge rett nok ikke er medlem) krever at fremmedspråklige navn i offentlige registre skal gjengis nøyaktig «uten endring eller oversettelse».

Dette har skjedd i et vesteuropeisk land: En person fikk rettens medhold i at han kunne nekte å motta brev som var stilt til en annen enn ham selv. Det dreide seg om skrivemåten av et «fremmed» navn. Om det dreier seg om «Hansen» / «Hansson» eller «Mann» / «Mąňń» (eller «Haavard» / «Håvard») kunne være likegyldig. Navn skal skrives rett for å være rett, inklusive alle kruseduller.

Men da er det «norske» tegnsettet identisk med hele det latinske alfabetet. Og så måtte folkeregisteret og skatteetaten bruke hele dette tegnsettet. Det er vel heller ikke egentlig vedtatt noe sted at det er kun det latinske alfabetet som er «lovlig» i Norge …
Dette ser sikkert ut som en stor spøk. Men det ligger svært mye alvor her.

Det er et stort behov for at det blir tatt skikkelig tak i disse spørsmålene: Hva er minimumstegnsettet som en må ha for å kunne skrive norsk tekst og norske navn fullstendig? I hvilke sammenhenger bør en påby bruk av et fullstendig tegnsett? Hva gjør en med tegn som ikke finnes i det «norske» tegnsettet?

Denne artikkelen er sakset fra forskning.no. Les hele artikkelen her.