Fornsvenska textbanken Bakgrund
Det
första initiativet till en svensk textdatabas med äldre svenska texter
togs inom projektet Källtext vid institutionen för svenska i Göteborg.
Inom detta projekt skrevs en rad fornsvenska texter in. Materialet är
stort och omfattar ungefär en miljon ord. Texterna är fördelade på
vers, religiös prosa och profan prosa. Jag har tacksamt använt Källtext
texter i stor omfattning vid min egen forskning, och i samband med
detta har jag sett behovet av fler genrer och fler texter, särskilt har
jag saknat lagtexter. Jag har också funnit en hel del brister i själva
texterna. Enstaka sidor saknas, enstaka rader har hoppats över och
korrekturfelen är många. Källtexts initiativ är mycket lovvärt och dess
texter är ett fantastiskt material, men det kan förbättras.
I min egen forskning har jag haft behov av fler texter än de som finns hos Källtext, och jag har också känt behov av högre kvalitet på texterna. Jag har därför med ojämna mellangum, under de senaste 25 åren skrivit och skannat in en lång rad texter och förbättrat Källtexts texter, genom att korrekturläsa kortare och längre partier och genom att rätta enstaka korrekturfel som jag funnit i samband med excerpering. Jag har också många gånger gjort maskinella sökningar efter fel som är ofta förekommande. De fel jag upptäckt har sedan rättats i enlighet med utgåvan. Dessutom har jag genom utbyte eller bara genom kollegers välvilja fått texter som är inskrivna eller inskannade av andra forskare. Materialet har till slut blivit så stort att jag tyckt att även andra forskare bör få del av de texter som jag skapat, fått, och/eller bearbetat. Så föddes idén om fornsvenska textbanken som en webbaserad textbank.
I fornsvenska textbanken har jag samlat alla de maskinläsbara texter
som jag har tillgång till. Textbanken har fyra huvudsyften. Den ska:
o göra fornsvenska texter lätt åtkomliga över webben
o göra texterna nedladdningsbara till den egna hårddisken
o göra texterna sökbara på olika sätt (via utgåvan, handskriften eller texten)
o ge kort och koncis information om texter, handskrifter och utgåvor
En
viktig grundtanke med fornsvenska textbanken är att texter ska vara
åtkomliga som rena textfiler som kan behandlas på den egna hårddisken,
med hjälp av konkordansprogram eller andra textbehandlingsprogram.
Texterna är åtkomliga på två sätt. De kan läsas på skärmen eller hämtas
hem till hårddisken som RTF-filer.
Jag
är mycket medveten om att Fornsvenska textbanken, liksom sin
föregångare, Källtext, har flera brister. Man kan ha synpunkter på
texturvalet, texternas kvalitet, beskrivningen av texter och
handskrifter, organisationen av materialet m m. Texturvalet blir ibland
snett på grund av att jag fått maskintexter av andra. Jag har själv
skrivit in UL:s A-handskrift, och sedan fått dess B-handskrift. Om man
finge välja skulle man givetvis hellre vilja ha en maskintext av en
handskrift som stod längre från A-handskriften, t ex Esplunda eller
Ängsö. Jag dristar mig ändå att lägga ut materialet på nätet i
förhoppningen att forskare ska använda det med försiktighet och att de
genom att använda det ska bidra till att det förbättras och/eller
utökas.
Lars-Olof Delsing