Um Beygingarlýsingu íslensks nútímamáls

Kristín Bjarnadóttir, 11. nóvember 2009

Beygingarlýsing íslensks nútímamáls (BÍN) er safn beygingardćma á tölvutćku formi sem er grunnur ađ ýmiss konar tungutćkniverkefnum en jafnframt er efniđ birt á vefsetri Stofnunar Árna Magnússonar í íslenskum frćđum og gagnast ţar međ almennum notendum. Vinna viđ BíN hófst áriđ 2002 hjá Orđabók Háskólans.

Rétthafi BÍN er Stofnun Árna Magnússonar í íslenskum frćđum sem sér um viđhald og dreifingu BÍN, samkvćmt samningi menntamálaráđuneytisins viđ Orđabók Háskólans frá 2005.

Ađgangur ađ BÍN á vefsíđu Stofnunar Árna Magnússonar er öllum opinn. Hćgt er ađ leita ađ beygingardćmi međ ţví ađ slá inn uppflettimynd eđa beygingarmynd orđs, og nota má algildistákn í leitinni.

Efniđ úr BÍN er sérstaklega ćtlađ til nota í tungutćkniverkefni. Frá 11. nóvember 2009 er ađgangur ađ gögnum úr BÍN opinn á vefsíđu BÍN, fyrir atbeina Já sem styrkir verkefniđ. Skilmálar fyrir leyfi til ađ nota gögnin eru hér.

Sérstök vefsíđa hefur nú veriđ opnuđ sem kynnir ţetta átak og samvinnu Stofnunar Árna Magnússonar í íslenskum frćđum og Já, Orđiđ.is.

Markmiđiđ

Upphaflegt markmiđ međ verkefninu var ađ koma upp beygingarlýsingu á tölvutćku formi til nota í ýmiss konar tungutćkniverkefni en ítarleg beygingarlýsing er grundvöllur ađ vélrćnni greiningu á íslenskum textum og nauđsynlegur undanfari orđflokkagreiningar og setningagreiningar.

Beygingarlýsingin nýtist t.d. viđ mörkun texta, viđ gerđ leitarvéla, leiđréttingar- og ţýđingarforrita, auk ţess ađ vera forsenda skilvirkrar orđabókargerđar og heimildasöfnunar um tungumáliđ. Beygingarlýsingin er notuđ innan stofnunar og utan.

Međal verkefna ţar sem BÍN er eđa hefur veriđ notuđ eru

hugi.is

Upphaf og umfang

Útgáfa 1.0 af BÍN

Fyrsti áfangi verksins var unninn hjá Orđabók Háskólans fyrir styrk frá tungutćkniverkefni menntamálaráđuneytisins og var gengiđ frá samningi um verkiđ 23. ágúst 2002. Ţessum áfanga lauk 15. mars 2004 ţegar menntamálaráđuneytinu var afhentur geisladiskur međ útgáfu 1.0 af Beygingarlýsingunni međ 173.389 beygingardćmum á formi xml-skráa.

Tungutćkniverkefni menntamálaráđuneytisins

Tungutćkniverkefni ráđuneytisins hófst haustiđ 1998 ađ frumkvćđi Björns Bjarnasonar, ţáverandi menntamálaráđherra. Í apríl 1999 birtist skýrsla starfshóps sem faliđ hafđi veriđ ađ kanna hver stađa íslenskrar tungu vćri í upplýsingaţjóđfélaginu. Í starfshópnum voru Rögnvaldur Ólafsson eđlisfrćđingur, Eiríkur Rögnvaldsson prófessor í íslenskri málfrćđi og Ţorgeir Sigurđsson, rafmagnsverkfrćđingur og íslenskufrćđingur. Í skýrslunni kom fram ađ átak ţyrfti ađ gera á fjórum sviđum (Rögnvaldur Ólafsson 2004:5):

Rögnvaldur segir einnig ,,ađ tilgangur Tungutćkniverkefnisins sé ađ koma fótum undir tungutćkni á Íslandi. Í ţví felst ađ byggja upp ţekkingu á viđfangsefninu og ţá gagnagrunna sem ţarf til ţess ađ hćgt sé ađ nýta íslenskt mál, bćđi ritađ og mćlt, í nýjustu samskipta- og tölvutćkni." (Rögnvaldur Ólafsson 2004:5).

Auk Beygingarlýsingarinnar hlutu tvö önnur verkefni Orđabókar Háskólans styrk í ţessu átaki, Málfrćđilegur markari fyrir íslensku og Mörkuđ íslensk málheild.

Vinnan viđ BÍN 1.0

Orđabók Háskólans og Edda hf. sóttu sameiginlega um styrkinn til gerđar Beygingarlýsingarinnar áriđ 2002. Orđabókin sá ađ öllu leyti um vinnuna og lagđi til húsnćđi, alla ađstöđu og ađgang ađ gögnum. Edda hf. lagđi til endurskođađa beygingarlýsingu sem Kristín Bjarnadóttir vann fyrir tölvuútgáfu Íslenskrar orđabókar 2002.

Orđaforđinn í BÍN 1.0 er ađ stofni til úr 3. útgáfu Íslenskrar orđabókar og úr söfnum Orđabókar Háskólans, sérstaklega úr Norrćna verkefninu sem er íslenskur orđabókarstofn sem unninn var sem grunnur ađ tvímála orđabókum milli íslensku og annarra Norđurlandamála (www.lexis.hi.is/ kristinb/norr.pdf). Orđaforđinn í BÍN 1.0 er ađ mestu úr almennu máli en ađ auki eru ţar tćplega 5 ţúsund mannanöfn úr bókinni Nöfn Íslendinga eftir Guđrúnu Kvaran og Sigurđ Jónsson frá Arnarvatni.

Helstu heimildir viđ rannsóknir á einstökum orđum og beygingarflokkum í BÍN 1.0 voru Ritmálsskrá og Textasafn Orđabókar Háskólans, auk handbóka greina og ritgerđa um íslenskt mál. Ber ţar sérstaklega ađ nefna bók Valtýs Guđmundssonar, Islandsk grammatik (1922).

BÍN 2.0 og birting á vefsíđu OH

Nćsti áfangi í vinnu viđ BÍN var birting beygingardćmanna á vefsíđu Orđabókar Háskólans sem var kynnt 24. september 2004, á sextugsafmćli Orđabókarinnar. Jafnframt varđ til útgáfa 2.0 af Beygingarlýsingunni sem afhent var menntamálaráđuneytinu 30. nóvember 2004 en ţá lauk tungutćkniverkefni ráđuneytisins formlega. Fjöldi beygingardćma í útgáfu 2.0 var rúmlega 176 ţúsund.

BÍN 3.0 og Veflćg orđmyndabók

Haustiđ 2005 fengu Orđabók Háskólans og Spurl ehf. sameiginlega styrk úr Tćkniţróunarsjóđi til ađ vinna ađ gagnagrunni fyrir BÍN. Hjálmar Gíslason hjá Spurl hafđi ţá notađ gögn úr BÍN til ţess ađ gera leitarvélina Emblu fyrir Morgunblađiđ en ţađ var fyrsta íslenska leitarvélin sem leitađi ađ öllum beygingarmyndum orđs í einu. Verkefniđ um gagnagrunn fyrir BÍN gengur undir nafninu Veflćg orđmyndabók (VO) en ţađ er vefkerfi til viđhalds og umsýslu BÍN sem margfaldar notkunarmöguleikana á gögnunum.

Nćsti áfangi í vinnu viđ BÍN (útgáfa 3.0) var kynntur sem tilraunaverkefni 25. ágúst 2006 en ţá voru beygingardćmin rúmlega 209 ţúsund og voru ţá komin inn í nýja gagnagrunninn. Viđ yfirfćrslu í gagnagrunninn voru beygingarflokkar endurskođađir og allt efni endurskipulagt.

Á degi íslenskrar tungu 16. nóvember 2007 var opnađur ađgangur ađ BÍN á nýrri vefsíđu Stofnunar Árna Magnússonar í íslenskum frćđum (SÁ) en Orđabók Háskólans varđ hluti SÁ 1. september 2007. Fjöldi beygingardćma var ţá tćplega 257 ţúsund. Í nóvember 2009 eru uppflettiorđ ríflega 270 ţúsund. Heimsóknir á vefinn í október 2009 voru 24.345.

BÍN og Já

Spurl er nú hluti Já og Orđabók Háskólans er nú hluti Stofnunar Árna Magnússonar í íslenskum frćđum en samvinnan um VO heldur áfram. Haustiđ 2009 var ađgangur ađ tölvutćkum gögnum úr BÍN opnađur, međ atbeina Já sem styrkir framtakiđ. Jafnframt efnir Já til samkeppni um notkun á gögnum úr BÍN.

Efniviđurinn í BÍN

Orđaforđinn í BÍN er ađallega úr almennu nútímamáli, auk mannanafna og örnefna. Vinna viđ sérorđaforđa er komin nokkuđ á veg á má ţar nefna orđaforđann úr Tölvuorđasafni (4. útg, 2005), úr nýrri ţýđingu Biblíunnar (2007), ásamt talsverđum fjölda fyrirtćkja- og stofnanaheita. Dálítiđ er af orđum og orđmyndum úr eldra máli, ef ćtla má ađ orđin komi fyrir í nútímamáli.

Skipting orđaforđans í BÍN 11.11.2009

Almennt mál 220.530
Eiginnöfn 4.755
Föđurnöfn 5.416
Móđurnöfn 5.053
Örnefni 22.704
Fyrirtćkja- og stofnanaheiti 7.296
Orđaforđi úr Tölvuorđasafni 2005 3.942
Orđaforđi úr Biblíunni 2007 697

Skipting orđaforđans í BÍN og heimildirnar 11.11.2009

Helstu heimildir í BÍN eru gagnasöfn Orđabókar Háskólans, ásamt Íslenskri orđabók (2002):

Norrćna verkefniđ 125.316
Íslensk orđabók 53.504
Ritmálsskrá OH 32.078
Landmćlingar Íslands 19.051
Nöfn Íslendinga 4.197
Símaskrá 3.381
Ţjóđskrá 3.365
Mannanafnaskrá 554
Annađ 1.753

Um beygingardćmin

Viđ birtingu beygingardćmanna er markmiđiđ ađ einskorđa efniđ viđ raunverulegar myndir hvers orđs, ţ.e. ađ sýna afbrigđi ţar sem ţađ á viđ en fylla ekki upp í beygingardćmi međ tilbúnum myndum.

Skipting í beygingarflokka byggđist í fyrstu á kennimyndum og kenniföllum í Íslenskri orđabók (2002), svo langt sem hún náđi. Ţá var leitađ heimilda í gagnasöfnum Orđabókarinnar, sérstaklega í Ritmálssafni, og í öllum tiltćkum málfrćđibókum og greinum. Notadrýgsta yfirlitsritiđ reyndist vera Islandsk grammatik eftir Valtý Guđmundsson (1922). Sú bók er ađ vísu nokkuđ gömul og tekur ţar ađ auki miđ af fornmáli ađ verulegu leyti. Leitađ var ađ álitamálum í Textasafni Orđabókarinnar og í öllum tiltćkum rafrćnum textum ţegar öll önnur ráđ ţraut.

Fjöldi beygingarmynda

Án afbrigđa eru beygingarmyndir nafnorđs 16, ţ.e. fjögur föll eintölu og fleirtölu, án greinis og međ greini. Beygingarmyndir sagnar í persónuhćtti eru 48, auk bođháttar og lýsingarhátta, en ađ ţessu međtöldu geta beygingarmyndir hverrar sagnar orđiđ 106. Ţá eru spurnarmyndir sagna (t.d. ferđu, fórstu, fariđi) ekki taldar međ en ţćr birtast ekki á vefsíđunni. Beygingarmyndir lýsingarorđs sem tekur stigbreytingu eru allt ađ 120. Afbrigđi geta fjölgađ beygingarmyndum einstakra orđa verulega.

Tölur um orđ, beygingarmyndir og orđflokka 11.11.2009

Orđflokkur Orđafjöldi Orđmyndafjöldi
Nafnorđ 234.501 2.804.439
Hvorugkyn 74.711 888.101
Karlkyn 70.858 877.456
Kvenkyn 88.932 1.038.882
Sagnir 7.681 699.090
Lýsingarorđ 26.204 2.360.335
Atviksorđ 1.987 2.231
Töluorđ 4 69
Rađtölur 74 1.776
Persónufornöfn 7 52
Afturbeygt fornafn 1 3
Önnur fornöfn 34 765
Greinir 1 24

Eyđur í beygingardćmunum

Eyđur eru t.d. í beygingardćmum fleirtöluorđa (dyr, buxur, skćri, órar, töfrar) ţar sem tilbúnar eintölumyndir eru ekki settar upp, í sögnum sem ekki eru til í miđmynd (auđvelda) ţar sem germyndin ein er sýnd, í miđmyndarsögnum (óttast) ţar sem germyndina vantar og í sögnum ţar sem lýsingarháttur ţátíđar er ekki til (duga, kunna). Ţá eru eiginnöfn ađeins sýnd í eintölu og örnefni ađeins sýnd í ţeirri tölu sem höfđ er í hverju örnefni, eins og sjá má af beygingardćmunum Hóll og Hólar.

Afbrigđi

Afbrigđi eru sýnd ţar sem ţađ á viđ, t.d. í ţágufalli eintölu af nafnorđinu hnífur en ţar eru afbrigđin hníf og hnífi.

Afbrigđi í BÍN eru strangt tiltekiđ jafnrétthá, óháđ röđun, enda ţarf ađ taka tillit til mismunandi ţátta, t.d. uppruna og tíđni í nútímamáli. Ţađ er ţví ekki einbođiđ hvernig röđin á ađ vera. Ţrátt fyrir ţennan fyrirvara er reynt ađ hafa röđina ţannig ađ ákjósanlegasta myndin sé á undan víkjandi mynd, t.d. í Haraldur ţar sem eignarfalliđ er Haralds/Haraldar.

Ef ástćđa ţykir til er birt athugasemd til notenda fyrir ofan beygingardćmiđ um notkun afbrigđa, t.d. í tönn ţar sem fleirtölumyndirnar tannir og tönnur eru sagđar sjaldgćfar og í refur ţar sem fleirtalan refar er bundin viđ orđasambönd, t.d. til ţess eru refarnir skornir. Athugasemdunum er ćtlađ ţađ hlutverk ađ tilgreina ţegar tilteknar beygingarmyndir eru ađeins notađar viđ tilteknar ađstćđur, t.d. í tiltekinni merkingu eđa setningarumhverfi.

BÍN nćr ekki yfir afbrigđi úr eldra máli nema í undantekningartilvikum. Ţau eru stundum látin fylgja í athugasemdum, án ţess ađ ţau komi fram í sjálfu beygingardćminu, t.d. beygingarmyndirnar ávöxtu og stjórnarháttu í ţolfall fleirtölu af ávöxtur og stjórnarhćttir.

Beygingakerfiđ og rétt mál og rangt

BÍN er beygingarlýsing og henni er ćtlađ ađ sýna beygingarkerfiđ eins og ţađ kemur fyrir í rćđu og riti í nútímamáli. Settar eru inn athugasemdir til notenda til ađ gefa vísbendingar um notkun ţar sem ástćđa ţykir til, t.d. ţar sem ein beygingarmynd ţykir betri en önnur ţó ađ báđar teljist tćkar. Mörkin eru sett viđ birtingu efnis sem beinlínis er taliđ rangt mál en ljóst er ađ ţar eru álitamálin mörg. Beygingarnar komustum, lćknirar, mér langar og ég vill birtast ţví ekki í beygingardćmunum.

Ritháttur orđa

Ástćđa er til ađ taka fram ađ ritháttur orđa er međ ýmsu móti í BÍN enda er sú raunin í ţeim heimildum sem orđaforđinn er fenginn úr, t.d. í Ritmálssafni Orđabókarinnar. Athugasemdir um réttritun fylgja orđum til hćgđarauka fyrir notendur eftir ţví sem tök eru á. Ţetta á t.d. viđ um ritmyndirnar allskyns, scandíum og breti ţar sem vísađ er á ritmyndirnar alls kyns, skandíum (og skandín) og Breti. Viđfangsefniđ í BíN er m.ö.o. beygingarkerfiđ og verkinu er ekki ćtlađ hlutverk stafsetningarreglna eđa stafsetningarorđabókar.

Starfsfólk viđ BÍN

Kristín Bjarnadóttir verkefnisstjóri: Beygingarferliđ, skipulag og kerfisgreining, beyging orđa annarra en ţeirra sem Ţórdís Úlfarsdóttir sá um. Kristín lagđi fyrstu drög ađ verkinu áriđ 2001 og hefur starfađ viđ verkiđ síđan.

Ţórdís Úlfarsdóttir: Beyging lýsingarorđa og veikra sagna, 2003--2004 (BÍN 1.0--2.0).

Auđur Ţórunn Rögnvaldsdóttir: Leitarađgangur á vefsíđu OH og gerđ html- og xml-skráa, 2002--2004 (BÍN 1.0--2.0).

Ađalsteinn Eyţórsson: Yfirlestur veikra kvenkynsnafnorđa, sumariđ 2003 (BÍN 1.0).

Ragnhildur Hrönn Sigurđardóttir: Yfirlestur mannanafna, sumariđ 2002 (BÍN 1.0).

Hjálmar Gíslason (hjá Spurl ehf., síđar Já hf): Verkefnisstjóri og forritari viđ gerđ gagnagrunnsins fyrir BÍN 3.0, Veflćgrar orđmyndabókar, frá 2005.

Ađrir starfsmenn Orđabókarinnar hafa jafnan leyst úr ýmiss konar álitamálum ţegar eftir ţví hefur veriđ leitađ og ţeir hafa óspart veitt ađgang ađ gögnum sínum. Eiríkur Rögnvaldsson formađur stjórnar Orđabókar Háskólans lagđi verkinu liđ á allan hátt, allt frá ţví ađ fyrstu hugmyndir um verkiđ urđu til.

Tilvitnanir í BÍN

Lagt er til ađ vitnađ sé í BÍN á eftirfarandi hátt:

Beygingarlýsing íslensks nútímamáls. Ritstjóri Kristín Bjarnadóttir. Stofnun Árna Magnússonar í íslenskum frćđum. Sótt 5. nóv. 2009 á http://bin.arnastofnun.is/.

Heimildir

Guđrún Kvaran og Sigurđur Jónsson frá Arnarvatni. 1991. Nöfn Íslendinga. Heimskringla, Reykjavík.

Kristín Bjarnadóttir. 2000. Beygingarlýsingin í Íslenskri orđabók. Óprentuđ skýrsla, unnin fyrir Mál og menningu. 735 bls.

Kristín Bjarnadóttir. 1998. Norrćna verkefniđ. Óprentuđ skýrsla. Orđabók Háskólans, www.lexis.hi.is/kristinb/norr.pdf.

Kristín Bjarnadóttir. 2004. Beygingarlýsing í slensks nútímamáls. Samspil tungu og tćkni. Afrakstur tungutćkniverkefnis menntamálaráđuneytisins. Menntamálaráđuneytiđ, bls. 23--25.

Mörđur Árnason (ritstj.). 2002. Íslensk orđabók, 3. útgáfa. Tölvuútgáfa. Edda hf. -- Miđlun og útgáfa, Reykjavík.

Rögnvaldur Ólafsson. 2004. Tungutćkniverkefni menntamálaráđuneytisins. Samspil tungu og tćkni. Afrakstur tungutćkniverkefnis menntamálaráđuneytisins. Menntamálaráđuneytiđ, bls. 5--11.

Sigrún Helgadóttir. 2004. Markari fyrir íslenskan texta. Samspil tungu og tćkni. Afrakstur tungutćkniverkefnis menntamálaráđuneytisins. Menntamálaráđuneytiđ, bls. 57--64.

Sigrún Helgadóttir. 2004. Mörkuđ í slensk málheild. Samspil tungu og tćkni. Afrakstur tungutćkniverkefnis menntamálaráđuneytisins. Menntamálaráđuneytiđ, bls. 65--71.

Valtýr Guđmundsson. 1922. Islandsk grammatik. H. Hagerups Forlag, Kaupmannahöfn.

© Orđabók Háskólans / Stofnun Árna Magnússonar í íslenskum frćđum 2002-2009
Öll afritun Beygingarlýsingarinnar er bönnuđ án leyfis.
Rétthafi efnisins er Stofnun Árna Magnússonar í í slenskum frćđum sem sér um vefsíđuna og miđlun efnisins samkvćmt samningi viđ Menntamálaráđuneytiđ.
Vefsíđa í vinnslu. Athugasemdir og ábendingar berist Kristínu Bjarnadóttur.