Diplomatarium Fennicum


Tietokanta


Tekninen toteutus
Metatiedot
Aineisto
Sisällöntuotanto
Tietokannan kehittäminen

Tekninen toteutus

Diplomatarium Fennicum on verkkopalvelu, joka koostuu kolmesta osasta: käyttöliittymästä, logiikkakerroksesta ja relaatiotietokannasta. Ratkaisu mahdollistaa käyttöliittymän ja tietokannan itsenäisen kehittämisen ja helpottaa niiden ylläpitoa.

Tietokannan sisältö tullaan tulevaisuudessa avaamaan käyttäjille niin, että sen voi halutessaan ladata omalle tietokoneelleen, mutta tällä hetkellä tällaista ominaisuutta ei vielä ole.


Metatiedot

Diplomatarium Fennicum on relaatiotietokanta, jonka toiminta perustuu metatietojen yhdistelylle. Tietoja on tallennettu järjestelmään kymmenissä eri muodoissa. Metatiedoilla tarkoitetaan laajasti ottaen kaikkea DF:n sisältämää asiakirjojen tekstejä koskevaa lisätietoa, kuten esimerkiksi tietoa asiakirjan kirjoitusajankohdasta, tyypistä, materiaalista tai sinetistä. Tiedot perustuvat osin Reinhold Hausenin FMU-sarjaan, osin nykyisessä (vuonna 2015 alkaneessa) hankkeessa tai edellisessä (1990-luvun ja 2000-luvun taitteessa toteutetussa) hankkeessa tehtyyn työhön.

Metatiedot ovat erittäin laaja kokonaisuus, ja työ niiden kehittämiseksi on kesken. Tiedot ovat osin puutteellisia ja ne sisältävät myös virheitä, joita korjataan koko ajan hankkeen resurssien puitteissa. Tavoitteena on kuvata kaikkien metatietojen tila tarkasti beta-kehitysvaiheen aikana ja mahdollistaa tietojen kehittäminen myös pitkällä aikavälillä.

Betaversion hakuehtoina toimivat metatiedot ovat tietokannan käyttämisen kannalta tärkeimmät, ja niiden tilanne kuvataan lyhyesti alla.


Päiväystiedot

Tiedot asiakirjojen päiväyksistä (ajankohta ja paikka) perustuvat valtaosaltaan FMU-sarjan editioihin. Milloin on huomattu FMU:ssa olevan selvä virhe, on tämä korjattu hauissa käytettäviin metatietoihin. FMU:ssa painetut tiedot ovat kuitenkin aina luettavissa tekstien yhteydessä sellaisinaan, virheineen kaikkineen.


Henkilötiedot

Tällä hetkellä nimitietoja löytyy FMU:hun ja vanhaan DF-hankkeeseen pohjaten ainoastaan asiakirjan antajista, ja nämäkin tiedot ovat usein puutteellisia. Hankkeen tavoitteena on tulevaisuudessa tallentaa tietokantaan asiakirjoissa esiintyvien henkilöiden nimet sekä normalisoidussa että asiakirjassa mainitussa muodossa ja mahdollistaa tiedon hakeminen niiden avulla.


Arkistoprovenienssi

DF-hanke on pyrkinyt päivittämään FMU:n sisältämien arkistoviitteiden tiedot ajantasaisiksi. Tältäkin osin työ on kesken, mutta suurelle osalle arkistolähteistä on etsitty tarkka lähdeviite tai ajantasainen kokoelmatieto. Täydellisimmin tietoja on kerätty Suomessa säilytettävän aineiston osalta.


Aineisto

Diplomatarium Fennicum pyrkii kokoamaan yhteen kaikki keskiaikaista Suomea tai suomalaisia koskevat asiakirjalähteet. Kaikkiaan tietokanta sisältää yli 6700 asiakirjaa tai tekstikatkelmaa, ja niihin liittyen yli 23 000 viitettä sekä arkistoaineistoon että verkko- ja painettuun aineistoon, kuten lähdejulkaisuihin.

Suomea koskevat keskiaikaiset arkistoaineistot ovat hajaantuneet maantieteellisesti varsin laajalle alueelle. Suurin yksittäinen kokonaisuus DF:n sisältämistä asiakirjoista sijaitsee Ruotsin Valtionarkistossa, mutta myös Tukholman kaupunginarkistossa on talletettuna runsaasti Suomeen liittyvää aineistoa. Samoin merkittäviä aineistokokonaisuuksia on säilynyt Tallinnan kaupunginarkistossa sekä Vatikaanin arkistossa. Suomessa sijaitsevat arkistolähteet sijaitsevat pääosin joko Kansallisarkistossa tai Kansalliskirjastossa. Pienempiä DF:ään kuuluvia kokonaisuuksia on löydettävissä useiden pohjoismaisten yliopistojen tai entisten hansakaupunkien arkistoista, esimerkiksi Upsalasta, Lyypekistä tai Gdanskista.

Uudessa DF-tietokannassa aineistoviittausten laatua on parannettu huomattavasti. Hankkeen puitteissa on mm. käyty laajalti läpi FMU:n arkistoviittauksia, jotka ovat nykytutkimuksen näkökulmasta usein varsin epätarkkoja (”Original på papper i Finlands Riksarkiv”). Suuri osa erityisesti Suomessa sijaitsevasta aineistosta on saatu paikannettua nykyisiin säilytysinstituutioihinsa ja arkistokokoelmiinsa. Lisäksi lähteiden alkuperäisyyttä on pyritty erottelemaan jaottelulla ’alkuperäinen–kopio’ ja ’keskiaikainen–myöhempi jäljenne’. Osa aineistoviittauksista on kuitenkin betaversion julkaisuvaiheessa edelleen hankkeen puitteissa tarkistamatta tai tarkentamatta. Kaikkia saatavilla olevia metatietoja ei myöskään ole sisällytetty vielä betaversioon. Hankkeen tavoitteena on vuosien 2017–2018 aikana päivittää aineistolle viitetiedot kaikkien säilyneiden ja tunnistettavien lähteiden osalta.

Arkistolähteiden lisäksi Diplomatarium Fennicum sisältää kirjallista aineistoa, erityisesti lähdejulkaisuja, sekä viitteitä muihin tietokantoihin. Tärkeimmät lähdejulkaisut ovat FMU ja REA, jotka sisältyvät tietokantaan sekä tekstimuodossa että pdf-tiedostoina. Lisäksi DF sisältää viitteitä useisiin muihin editiosarjoihin, muun muassa A. I. Arwidssonin ja E. Grönbladin lähdejulkaisuihin sekä hansakaupunkien asiakirjajulkaisuihin. Hanke tarjoaa myös useita lähdejulkaisuja kokonaisina käyttäjille ladattavaksi. Eri editioversioiden käsittely rinta rinnan tuo näkyviin asiakirjojen tutkimushistorian. Diplomatarium Fennicumin merkitys tutkimukselle korostuukin hajanaisen aineiston kokoamisessa yhdeksi helposti saavutettavissa olevaksi kokonaisuudeksi.

Puhtaan asiakirja-aineiston lisäksi Diplomatarium Fennicum sisältää myös muuta Suomea koskevaa keskiaikaista aineistoa. Tietokantaan on kirjattu mm. joitakin hautakivikirjoituksia, kirkkojen seinämaalauksia, esineisiin kirjoitettuja tekstejä sekä kronikkakatkelmia. Valinta on alkujaan Hausenin FMU:ssaan tekemä. Linjauksen mukaisesti myös Diplomatarium Fennicum -tietokantaan voidaan jatkossa lisätä muutakin kuin asiakirja-aineistoa, esimerkiksi piirtokirjoituksia. Aineistorajaus on haluttu jättää laajaksi, jotta tietokanta palvelisi Suomen keskiajan tutkijoita mahdollisimman monipuolisesti. Asiakirja-aineistosta materiaaleiltaan ja muodoiltaan eroavat tekstit erotellaan tietokannassa omiksi lähderyhmikseen.


Sisällöntuotanto

Diplomatarium Fennicum -hankkeen yhteydessä tietokantaan lisätään myös uutta sisältöä, niin asiakirjatietueita kuin metatietoa. Metatiedon tuotantoon pyritään panostamaan hankkeen betakehitysvaiheen aikana. Hankkeessa tuotettava metatieto käsittää mm. paikka- ja henkilörekisterit ja ajoitustiedot, asiakirjojen kategorisointitiedot, sekä tiedot asiakirjojen fyysisistä ominaisuuksista (kodikologia, sigillografia, paleografia). Metatietojen tuottamisen laajuus on betavaiheessa kuitenkin riippuvainen hankkeen resursseista.

Uusia editioita tuotetaan aiemmin julkaisemattomista asiakirjoista, mutta myös jo aiemmin tunnetuista ja julkaistuista asiakirjoista. Palvelun betakehitysvaiheen aikana pyritään ensinnäkin julkaisemaan Hausenin työn jälkeen löytyneitä asiakirjoja, jotka on julkaistu esimerkiksi tieteellisissä aikakauskirjoissa. Kokonaan uusina tietokannassa julkaistaan missään aiemmin julkaisemattomia asiakirjoja, joita tunnetaan mm. Tallinnan ja Vatikaanin arkistoista. Diplomatarium Fennicum -hanke tulee antamaan uusille asiakirjoille DF-numerot, jotka jatkavat numerosarjaa FMU:n viimeisestä numerosta (6726). Tätä pienemmät DF-numerot vastaavat lähtökohtaisesti suoraan FMU:n numeroita. Tulevaisuudessa tähän voi tulla pieniä muutoksia – esimerkiksi jos Hausenin yhtenä kokonaisuutena julkaisemia tekstikatkelmia halutaan editoida yksittäin omina teksteinään.

Uusien editioversioiden tuotanto jo tunnetuista asiakirjoista on myös käynnistynyt. Tarve uusille editioille on ilmeinen. Monet 1800-luvun ja 1900-luvun alun editioissa tehdyt valinnat ovat osoittautuneet vanhentuneiksi, eivätkä tekstit vastaa kaikilta osiltaan nykytutkimuksen, esimerkiksi historiallisen kielitieteen tarpeisiin. Editioiden tuottamiseksi hankkeen puitteissa on luotu kansalliset editioperiaatteet keskiaikaisten aineistojen editoinnille. Editioiden tuotannosta vastaavat alan tutkijat yhteistyössä hankkeen henkilöstön kanssa. Lisättävät tekstit käyvät läpi tarkastusprosessin.

Uusien editioiden tuottamisen myötä uusi Diplomatarium Fennicum tietokantana erkaantuu sekä vanhasta tietokannasta että FMU:sta sekä sisällöllisesti että määritteellisesti. Jokaisella Diplomatarium Fennicumiin kuuluvalla tekstillä on DF-numero, joka yksilöi sen tietosisällön. Uuden tietokannan DF-numero viittaa siis nimenomaan asiakirjan sisältämään tiedolliseen kokonaisuuteen, ei mihinkään yksittäiseen tekstiversioon tai editioon tästä kokonaisuudesta. Täten Diplomatarium Fennicum rakentuu tietokantana selkeästi perinteisistä editiosta eroavin tavoin. Ero on huomioitava DF-tietueisiin viitatessa: katso Ohje-sivu.


Tietokannan kehittäminen

Tietokannan kehitys jatkuu läpi betavaiheen. Erityisesti hankkeen kehitysresursseja kohdennetaan tietokannan sisältöä hyödyntäviin työkaluihin sekä sisällöntuotannollisesti metatietoon, jota työkalut edellyttävät toimiakseen.

Betavaiheen edetessä metatiedot päivitetään vastaamaan hankkeen puitteissa luotua tietomallia. Tämä tietomalli kattaa asiakirjoja koskevat metatiedot täydellisimmässä muodossaan. Nykyisten paikka-, antaja- ja arkistotietojen lisäksi malli huomioi mm. asiakirjojen materiaaliset puolet – kodikologiset, sigillografiset ja paleografiset. Pitkällä aikavälillä metatietoja pyritään kehittämään esimerkiksi seuraavin tavoin: Asiakirjat kategorisoidaan sisältönsä mukaan; Paikka- ja henkilötiedot kerätään aiempaa täydellisemmin; Kaikki mainitut nimet kerätään tietokantaan sekä lähteen kirjoitus- että modernissa standardimuodossa; Paikat ja henkilöt kategorisoidaan. Paikat myös geokoodataan karttasovellusta varten. Metadataa kerrytetään hankkeen sisäisesti sekä joukkoistaen yhteistyössä tutkijoiden ja tutkimushankkeiden kanssa. Koneellisia tekstinlouhintakeinoja pyritään myös hyödyntämään.

Metatietojen kattaessa riittävän laajan aineiston voidaan kehittää tietokantaan sitä niitä sovelluksia sekä haku- ja suodatustoimintoja. Sovellukset mahdollistavat esimerkiksi asiakirjojen etsimisen tyyppinsä ja sisältönsä mukaan tai sisältämiensä henkilön- ja paikannimien ja kategorioiden mukaan. Tulokset voidaan esittää käyttäjän haluamalla tavalla: esimerkiksi aikajanassa, kartalla, tilastoituna valitun arvon mukaisesti, tai esimerkiksi nimenkirjoitusasun mukaisesti. Sovelluksia kehitetään ja testataan läheisessä yhteistyössä tutkijayhteisön kanssa.

Tietokannan käyttöliittymää kehitetään ensisijaisesti käyttäjäpalautteen perusteella. Betaversion käyttöliittymä on julkaisuhetkellä saatavilla ainoastaan suomeksi. Käyttöliittymä tulee saataville ruotsiksi ja englanniksi betakehitysvaiheen aikana.