Þúsund þjóðsögur á rafrænu formi – með þinni hjálp

Kreddur

Eftirfarandi grein barst Kreddum frá Óla Gneista Sóleyjarsyni. Þar fjallar hann um möguleika dreifðs prófarkalesturs til að auka það magn stafrænna gagna sem þjóðfræðingar og aðrir hafa aðgang að.

 

Eitt gagnlegasta tólið sem ég hafði aðgang að í þjóðfræðinámi mínu var Netútgáfan [http://snerpa.is/net/]. Það er vonandi erfitt að finna þjóðfræðing eða þjóðfræðinema sem ekki þekkir þann vef. Þar má fletta upp í ýmsum fornritum, m.a. Íslendingasögum og fornkvæðum. Þar eru líka einhverjar þjóðsögur. Það er þó ekki þannig að þar sé hægt að finna heildarútgáfur af söfnum. Það vantar til dæmis tilfinnanlega margar þjóðsögur Jóns Árnasonar. Ég hef verið að vinna í þessum málum en ég þarf hjálp.

Til þess að koma bók á textaform þarf að skanna hana inn og setja myndir af síðum í gegnum svokallað ljóslestursforrit sem breytir mynd í texta. En það er ekki nóg því ljóslestursforrit gera oft mistök, þá sérstaklega á gömlum texta og íslenskum stöfum. Það þarf því mannsaugað til þess að fara yfir textann sem forritið sendir frá sér. Það er mikið verk fyrir eina manneskju en lítið verk fyrir fimmtíu manneskjur.

Aðferðafræðin sem gerir okkur kleift að vinna stór verk kallast lýðvistun (crowd sourcing). Tólið sem gerir okkur kleift að vinna þetta verk er dreifða prófarkalesturskerfi Rafbókavefsins [http://profork.rafbokavefur.is/c/] sem ég setti í gang fyrir um ári með aðstoð góðs fólks. Þar getur hver sem er skráð sig og lesið yfir texta. Notendur fá tvískiptan glugga þar sem er annars vegar mynd af síðu og hins vegar ljóslesinn texti sem hægt er að laga. Það eru einhverjar grunnreglur sem þarf að fara eftir í yfirlestrinum en þær lærast fljótt. Hver síða fer í nokkrar umferðir af yfirlestri til þess að tryggja að sem fæstar villur verði eftir.

Sjá kennslumyndband: Byrjendakennsla í dreifðum prófarkalestri.

Þegar bók hefur lokið ferli sínum í gegnum prófarkalesturskerfið er hún gerð aðgengileg sem textaskjal, vefskjal og sem fullbúin rafbók. Þessu efni má síðan hver sem er dreifa, breyta og nota svo lengi sem höfundaréttur sé útrunninn. Það er raunar svo að einhverjar höfundavarðar bækur eru í yfirlestri með leyfi rétthafa en þar gildir einnig reglan um frjálsa dreifingu. Tvær höfundavarðar bækur sem eru nú í yfirlestri vekja væntanlega áhuga þjóðfræðinga en það eru Heiðinn siður á Íslandi og Norræn goðafræði á Íslandi eftir Ólaf Briem.

Þó dreifða prófarkalesturskerfið sé til staðar vantar alltaf sjálfboðaliða. Það hefur reyndar vakið nokkur vonbrigði hjá mér hve fáir notendur hafa áhuga á að lesa yfir þjóðsagnasafn Jóns Árnasonar. Hér væri gott að virkja kraft þjóðfræðinga og þjóðfræðinema. Hver sem er getur stokkið til og lesið yfir texta en ég vil koma með áskorun sérstaklega til þjóðfræðinema: Myndið hóp um verkefnið til þess að setja kraft í það (hafið samband við mig ef þið viljið leiðbeiningar). Þið getið háð innbyrðis keppni um hverjir lesa flestar síður. Tíu manns sem lesa yfir tíu síður á dag geta klárað eina umferð á heilu bindi af þjóðsagnasafninu á einni viku. Tuttugu manns geta tekið tvær umferðir.

Það er rétt að benda á að það eru fleiri verkefni í vinnslu sem tengjast þjóðfræði. Þar má nefna Hómerskviður og Þúsund og eina nótt. Þetta eru verk sem hvaða þjóðfræðingur sem er ætti að gleðjast yfir að eignast á rafrænu, leitarbæru formi.

Það má líka benda á verk sem hafa lokið ferlinu og eru nú þegar aðgengilegar: Ævintýri H.C. Andersen [http://rafbokavefur.is/rafbaekur/aevintyri-og-sogur-1-h-c-andersen/] og Þjóðtrú og þjóðsagnir [http://rafbokavefur.is/rafbaekur/thjodtru-og-thjodsagnir/] sem er þjóðsagnasafn sem kom fyrst út árið 1908.

Ég get ekki talið upp alla þá sem hafa sagt mér hve dreifði prófarkalestursvefurinn sé sniðugt verkefni. Ég get hins vegar nokkurn veginn talið upp þá sem hafa gerst sjálfboðaliðar og unnið að verkinu í lengri tíma. Ég þarf fleiri sjálfboðaliða. Þetta er snjóbolti sem þarf að rúlla og stækka. Þjóðfræðin er sú fræðigrein sem mun helst hagnast á því.

Óli Gneisti Sóleyjarsonar