Referensgrupp DCAT-AP-SE¶

Minnesanteckningar 2019-09-30

Närvarande	Organisation	Mötesroll
Matthias Palmér	MetaSolutions	Ordförande
Ekhem Mattias	DIGG	Sekreterare
Kristine Ulander	DIGG
Caspar Almalander	SKL
Kjell Hjorth	Lantmäteriet
Michael Östling	Metagis
Øystein Åsnes	DIFI (Norge)
Catrin Karling	SCB
Marcus Smith	Riksantikvarieämbetet
Mats Åhlin	SIS
Ulrika Domellöf-Mattsson	Naturvårdsverket
John Cunningham	Bolagsverket
Hans Ekstål	Bolagsverket
Hannes Ebner	MetaSolutions
Thomas Kvist	Region Västerbotten

Mötet utgick från en presentation och nedan refereras till dess bilder samt ärenden i ärendehanteringssystemet på github. I anteckningarna nedan är mycket av konversationerna återgivna. När namn saknas är det oftast ordförande som är föredragande.

Sidan 10 Föreslagen åtgärd per ärende¶

John: Ska specifikationen även klara av PSI-data och base registry data?

Matthias: DCAT 2.0 specifikationen kommer att bli bredare och kan användas för fler behov. Fråga om vad man egentligen behöver göra när det gäller PSI-förteckning.

Datamängder som ska dokumenteras på portalen, det är skillnad på om det är strukturerad data och ostrukturerad data. Ska vi ha med konstruktionen eller inte, t ex ABR det räcker inte att ha en katalog man har även en koppling till tjänstebegreppet.

John lägger upp några ärenden utifrån frågeställningen.

Matthias: hur har man gjort i Norge?

Öystein: Man gjorde ett val 2016 att utvidga scopet till att omfatta alla datamängder för offentliga data. Vi saknade översikt om vem som förvaltar information använder access-rights för att skilja öppna och stängda data. Har också valt att inkludera terminologihantering och datamodeller. Då kan man visa kopplingar mellan juridiken och datamängderna, ett stort arbete kring begreppsmodellering som man gjort en egen standard kring. Parallellt arbete med begrepp och vilka datamängder de olika verksamheterna förvaltar. Vi kanske behöver en djupare terminologihantering. Det blir synligt hur många begrepp man har och det får konsekvenser på olika lagar.

Thomas K: Begreppsdefinitioner är viktigt men kanske inte ingår i projektet? I ABR tittar man på det Vet inte om det ingår i projektet, diskussioner pågår fortfarande i ABR-gruppen men rimligt att bevaka frågan.

Öystein: göra datadictionaries för olika datamängder, behov av att lagra informationen.

Sidan 11 Översättning¶

Gå in i github och kommentera på följande ärenden: * Vad ska vi kalla publisher för på svenska? #1 * Contactpoint – kontakt eller kontaktpunkt eller annat? #13 * Agent är en superklass till person eller organisation. #21

Thomas K: Vi går mer mot samverkan och då är det viktigt att definitionerna inryms de samarbetsmiljöer kommunerna befinner sig i.

John: På Bolagsverket har man förmedlare av data och producent för dataägare.

Michael: Geodata ResponsibleOrganisation i dagsläget finns i standarden 13 roller Ansvarig organisation använder man på publisher Det kan bli lite begränsande eftersom Agent även tillåter person

Kjell: Kan man använda personnamn med tanke på GDPR inom geodata har man tagit bort det. Det går om det kopplas till ett godkännande men inte generellt.

Öystein: man kan ha vinst av att samarbete en norsk-svensk-engelsk utgivare för publisher man kan titta på hur man gjort i Norge

Catrin: SCB har myndighetsregistret och det allmänna företagsregistret

?: Arbetsställenummer i kombination med organisationsnummer KB har en rekommendation

Thomas: Kommunerna vill gärna att man återanvänder något som finns istället för att ta något nytt från KB

Sidan 12 Dokumentation¶

Gå in på github och kommentera Håll varje ärende centrerat till ett ärende. Alla dessa kommer hanteras med accept om ingen tycker något annat.

Förtydliga om hur man lägger upp flera filer till en distribution #17
Svensk version på engelska? :) #29
önskemål om testmiljö och dokumentation #31
Hur "interoperabla" är olika profiler med varandra #32

Sidan 13 Kardinalitet¶

Gå in och kommentera issues. * Obligatorisk licens för katalogen #5 * Obligatorisk licens på datamängd / distribution #6 * Obligatorisk dct:issued på katalogen #7 * Obligatorisk dct:rights på distributionen #8 * Rekommenderad dct:issued på datamängd #9 * Rekommenderad dct:modified på datamängden #10 * Rekommenderad dct:accessRights på datamängden #11 * Rekommenderad dct:language på datamängden #12 * Obligatorisk dct:publisher på datamängden #16

Ulrika: När det gäller licenser så kan det vara svårt att ändra bakåt.

Matthias: Det är först när man kommer till distribution som licens är intressant. Ulrika: Men det gäller även historiskt att man distribuerat utan licens. #5

Matthias: Är det något som behöver vara obligatoriskt så är det license och inte rights, den bör vara frivillig. #8

Issued när har en datamängd givits ut första gången, bra att rekommendera #9

Modified inte rimligt att hela tiden uppdatera på realtidsnära data. Om den ska vara rekommenderad så bör man ha en text till. #10

AccessRights rimligt att den är rekommenderad #11

Language inte alltid relevant om det bara är siffror, datamängden kan bli svår att använda en dubbelhet. #12

Publisher ska man kräva att den är obligatorisk? Det skulle hjälpa oss #16 Viktigt att kunna skilja på publishers Bör användas som utgivande snarare än tillhandahållande.

Katalogdelen bör tonas ner

I Norge gjorde man publisher obligatorisk

Sidan 14 DCAT2¶

Ta in DataService som föreslås av DCAT 2 #18
Available formats på DataService #19
Fler relationer mellan datamängd och aktörer #20
Till nästa gång så för Matthias in de aspekter av DCAT 2 som ska föras in. Vi kan titta på detaljerna då.
Dataservice innebär att tidigare har man bara haft PSI-förteckningar med data i. Syfte är att beskriva API rikare men ska peka ut en tjänst som kan återanvändas mellan datamängder. Det kan också vara t ex valutaomvandlare, inte tjänster med information i sig. Man får större uttrycksmöjlighet med dataservice #18
Vill vi förtydliga vilka andra roller som är viktiga?
Tjänster är viktiga men bör inte blandas ihop med datamängder, de kan visas i t ex olika flikar. Dela med er till DIGG om olika förslag på hur man kan göra.
Exempel https://fellesdatakatalog.brreg.no/
Det är en stor uppgift att modellera begrepp tvärs över sektorer, det vore bra om vi fick till en metadatamodell som skulle kunna hantera begrepp men att ha alla begrepp klara är ett större jobb. Steget är inte så långt att peka på begreppskatalog.

Catrin: SCB har all statistik och skulle behöva begreppsmodellera alla sektorer och det pågår ett jobb, man tar fram en modell som man ska kunna följa. Man skulle vilja jobba ihop med fler som kan. Inera håller på med begreppsmodellering för kommunal verksamhet som kanske kan synkas. Den norska standarden för att beskriva begrepp ligger på github

Sidan 15 Skördning¶

Stöd för att ladda multipla kataloger för en organisation #14
Hur man undviker dubbletter av organisationer på öppnadata.se #15
Multipla kataloger lösningsförslag i #14 det behöver inte vara så stor insats att lösa centralt
Det finns behov av id på lägre nivå än organisation #15
Ett nytt ärende behöver skapas på dubblering av datamängder. Matthias skapar nytt ärende.

Sidan 16 Övrigt¶

3.1.11 Språk - bara vissa språk #28
Koppling mot arkivförteckning #30 (Behov av dct:identifier på katalognivån #3)
Kan vara problem om vi inför våra minoritetsspråk. #28
Det finns två nivåer av språkanvändning dels titeln och dels innehållet, det är innehållslistan som avses här. Ska vi ha en rekommendation att fält ska uttryckas på svenska och engelska och kanske minoritetsspråk i vissa fall. Alla språk man tillhandahåller skördas. Finns det tvingande krav på vilka språk man ska tillhandahålla? Nej inte känt.
Att möjliggöra en koppling till arkivförteckning vore bra. Naturvårdsverket har gjort en begreppsmodellering kring handlingstyp och mappat mot datamängd. #30

Sidan 17 Ny fält / klass / användning¶

Behov av Contactpoint på katalognivån #2
Behov av dct:identifier på katalognivån #3
Indikation om avgift #4
Ska vi ha en rekommenderad förteckning av licenser #22
Behövs en mer förfinad terminologi för kategorisera datamängder #23
Gör det möjligt att peka på visualiseringar #24
Gör det möjligt att associera goda exempel - showcases #25
Gör det möjligt att peka på förslag till användning #26
Associera representativa bilder till en datamängd #27
Kräva contactpoint på katalognivå och en publisher som kanske är en annan än på datamängden, det behöver vara tydligt vad som ska vara vad. Är det lämpligt? Krävs inte på EU-nivå #2
Intressant att ha en markering på avgifter. I Norge har man markering i portalen men inte i standarden #4
I Norge arbetar med en ontologi som man testar använda, finns som standardSKOS vokabulär och ligger på github. Ska man ha en stor eller många små. Kommentera gärna och fyll på med kunskap! #22
I Norge använder man CorePublicService vocabulary som används för att beskriva medborgartjänst oavsett om de är analoga och digitala. Vilka effekter var viktigt att visa och då använde man det. #25
Från geodatasidan finns det redan. #27

Nästa möte¶

Snart kommer ett nytt förslag på tid för nästa referensgruppsmöte och Matthias kommer att uppdatera issues på Github. Ny specifikation finns innan nästa möte.