Länkkontroll¶
För att avgöra statusen för datakatalogens länkar, görs dagliga länkkontroller. Dessa sammanfattas i rapporter, som görs tillgängliga i gränssnittets vyer. Rapporten går att nå via datakatalogens statusrapport (https://admin.dataportal.se/status/reports). En inloggad användare kan även ta del av den via den organisation som tillhandahåller datakatalogen (https://admin.dataportal.se/organization).
Kontroll¶
Först extraheras de fält i katalogen som innehåller länkar. I dagsläget är de fält som kontrolleras för respektive typ:
-
dcat:Distribution
- dcterms:conformsTo
- dcat:accessURL
- dcat:downloadURL
-
dcat:Dataset
- dcat:landingPage
- dcterms:conformsTo
- foaf:page
- owl:versionInfo
-
dcat:DataService
- dcat:endpointDescription
- dcat:landingPage
- foaf:page
Därefter följer kontrollen av alla länkar. Ett första försök att nå länken görs via metoden HEAD. Om anropet besvaras med status 400 eller högre, används istället metoden GET. En timeout för anropet används, i nuläget 5000 ms. För att inte överbelasta domäner med många länkar i datakatalogen, görs en paus på åtminstone 1000 ms mellan varje anrop till varje länk inom samma domän. När anropet är gjort rapporteras länkens status till rapporten.
Rapport¶
I rapporten meddelas hur många länkar som identifierats, samt hur många som misslyckats att nå respektive undantagits under kontrollen. En lista över de misslyckade länkkontrollerna följer, där status anges om länken besvarat med en sådan.
En detaljvy finns även för varje länk, där man kan se information om vilken tidpunkt kontrollen skedde och hur många försök som gjorts. Vidare finns information om den post som länken tillhör (typ, beteckning, uri samt egenskap / fält). Slutligen presenteras även de poster som refererar till denna länks post för att ge en bättre översikt (t.ex. för länkar i distributioner ser man även vilken datamängd det rör sig om).