Oplæg på FDA-konferencen, 9. september 2019
Klavs Helberg Jensen, DigitaliseringsstyrelsenAnders Fausbøll, Omnium Improvement
Grundlag for genbrug af data i selvbetjeningsløsninger
2
Ca.-tid
5 min
20 min
20 min
Emne
1. Baggrund og formål med projektet1. Vejledning i genbrug af data
2. Praktisk tilgang1. Flow for dataanalyse
2. Identifikation af datakilder3. Konkret eksempel på genbrug
4. Integrationsmønstre
3. Diskussion: Behov for genbrug af data – og barrierer
Agenda Grundlag for genbrug af data i selvbetjeningsløsninger
3
1. Baggrund for projektetGrundlag for genbrug af data i selvbetjeningsløsninger
• Formål– Vejledning i genbrug af data i offentlige selvbetjeningsløsninger
– Målgruppe: Projektdeltagere i projekter, der designer/videreudvikler selvbetjeningsløsninger
– Udarbejde en oversigt over integrationsmønstre– Fokusprincipper er Once-only og Overdragelse (dette oplæg fokuserer på Once-only)
• Kontekst– Udløber af Referencearkitektur for Selvbetjening; har ophæng til Referencearkitektur for
deling af data og dokumenter– Bidrag fra arbejdsgruppe med arkitekter fra KL, ERST, Landbrugsstyrelsen, ATP, Danske
Regioner, SKAT og DIGST– Medforfatter Michael Bang Kjeldgaard, chefarkitekt i DIGST– Udarbejdet i samarbejde med PwC og Omnium Improvement
4
3. Once-only
Formål i dag: At komme omkring nogle væsentlige indholdspunkter til Vejledning for Once-only
Delagenda
• Procesflow for dataanalyse i SB-løsningsudvikling (herunder genbrug af data)
• Beslutningstræ for identifikation og håndtering af datakilder
• Link fra Vejledning til integrationsmønstre
5
1. Vejledning: Baggrund for Once-onlyGrundlag for genbrug af data i selvbetjeningsløsninger
• Generelt princip m/ specifikt ophæng i Referencearkitektur for Selvbetjening, princip #3
Princippet skal og kan kun efterleves, såfremt den nødvendige information er tilgængelig for selvbetjeningsløsningen. Princippet bygger på målsætningerne om, at myndigheder skal anvende standarder for data og have snitflader til systemer. I de tilfælde, hvor nødvendig information ikke er tilgængelig, skal myndigheden rejse behovet i relevante samarbejds- og styringsorganer. Rationale • Brugere skal i stadig mindre omfang inddatere information og sjældnere opleve, at det offentlige beder om de samme oplysninger flere gange. • Brugere undgår situationer, hvor de må opgive at gennemføre et selvbetjeningsforløb, fordi de ikke har adgang til den information, der efterspørges. Tilsvarende opnår
myndighederne flere gennemførte selvbetjeningsforløb.
• For udviklings- og supportfunktioner betyder det, at de vil få mere tilfredse brugere og fx færre supporthenvendelser fra brugere, der ikke kan finde ud af at anvende selvbetjeningsløsningen, fordi de ikke kan finde den nødvendige information.
• Dette vil også bidrage til at sikre høj datakvalitet, da data, indsamlet af en myndighed, er underlagt krav til datakvalitet og skal være kvalitetssikrede. Implikationer • Brugere skal i den enkelte selvbetjeningsløsning (som udgangspunkt) kun inddatere information, som det offentlige ikke har i forvejen.
• Det indebærer, at det offentlige skal opbygge løsninger til sikkert og effektivt at lagre og dele inddateret information og anvende aftalte integrationsmønstre (hvilket kræver en langsigtet indsats). Den enkelte selvbetjeningsløsning skal efterleve princippet i det omfang, det er muligt at hente og aflevere data til fællesoffentligt brug.
• Brugere skal have sikkerhed for, at den præsenterede information er korrekt, og der skal være klare regler for, hvad brugeren skal gøre, hvis informationen ikke vurderes at være korrekt. Selvbetjeningsløsningen skal da kunne håndtere at agere korrekt på en sådan påstand og have afklaret, om brugeren henvises til informationskilden, eller om informationen skal rettes i selvbetjeningsløsningen.
• Myndigheder og udviklere skal i tilrettelæggelsen af løsningen kortlægge, hvorfra de nødvendige informationer til selvbetjeningsforløbet og den tilhørende sagsbehandling kan indhentes og dernæst indhente den derfra. Denne kortlægning omfatter både juridiske, tekniske og andre relevante forhold. Den skal også omfatte eventuelle ændringer i indhentet information, hvis selvbetjeningsforløbet gennemføres over længere tid, fx ved afbrydelse og genoptagelse.
• Hvis der kræves samtykke til at indhente oplysninger, skal dette indhentes som del af selvbetjeningsløsningen.
”#3 Brugerne leverer kun information, som det offentlige ikke allerede har”
6
2. Genbrug af data i selvbetjeningsløsninger har mange fordele…
• Øget sammenhæng i offentlige services
• Enklere og mere effektive selvbetjeningsløsninger ved bl.a. at undgå genindtastning af data
Fordele for brugerne (borgere/
virksomheder)
Fordele for myndighederne
• Øget mulighed for automatisering
• Højnet datakvalitet (undgå genindtastninger med mulighed for fejl)
• Brug af mere aktuelle data
• Adressering af GDPR-hensyn (data ligger kun ét sted)
• Mere effektiv systemudvikling
• Nye typer af services baseret på eksisterende data
Kilde: Den Fællesoffentlige Digitaliseringsstrategi 2016-2020
7
2. … men rummer en lang række praktiske udfordringer
Datakvalitet?
Aktualitet?
Valg af datakilde?
Følsomhed?
Hjemmel?
Tilgængelig-hed?
Dataformater?
Krav til logning af brug?
Integrations-mønstre?
Afregning?Samtykke?
8
2. … så det grundlæggende spørgsmål er:
Hvis man nu er med i et projekt om selvbetjeningsløsninger…
… og gerne vil bruge genbruge data…
… hvordan finder man så ud af, hvilke data der findes og kan genbruges…
… og hvor og hvordan, man får fat på det?
9
2. Vejledning: Flow for dataanalyse i SB-løsningsudviklingGrundlag for genbrug af data i selvbetjeningsløsninger
1) Forstå forretningsbehov
• Hvem er ”kunden” i form af slutbrugeren?
• Hvad er målet med selvbetjenings-forløbet? (start- og sluttilstand)
• Hvad er brugerensbehov?
• Er der en naturlig ‘kontekst’ af andre selvbetjeningsforløb?
2) Forstå databehov
• Hvilke data er nødvendige?
• Kvalitet: Komplethed, korrekthed, aktualitet?
• Er data følsomme?• Hvilken hjemmel
haves til at hente/agere på data (lov/samtykke/..)?
3) Identificer datakilder
• Data, der findes og kan genbruges
• Behov for at sammenstille datasæt?
• Data, der kan overdrages fra en anden kontekst
4) Indgå aftaler om anvendelse
af data
• Nødvendige servicekrav (SLA)?
• Afregning for data?• Governance omkring
aftalen?• Bekræft hjemmel• Øvrig jura og
forvaltning
5) Fastlæg teknisk
datahåndtering
• Brug af fælles format?
• Transformation enten hos dataejer, i middleware eller i selvbetjeningsløsning
• Håndtering af evt. sammenstillededata?
• Valg af API/teknisk integration
6) Indarbejd data i flow
• Angiv hjemmel• Indhent/gem
samtykke(r) hvis relevant
• Indarbejd mulighed for korrektion
• Generel UX
Forretningsudvikler/projektlederLøsningsarkitekt/UX designer
Overblik over skridt og aktiviteter:
Involvering og ansvar:
10
2. Beslutningstræ for identifikation og håndtering af datakilderGrundlag for genbrug af data i selvbetjeningsløsninger
Bemærk: Træ gennemgås for hver datatype, hvor man vil understøtte once-only i praksis
Findes datatypen autoritativt/centralt og
i rette kvalitet?
Er data udstillet teknisk hensigts-
mæssigt?
Indgå aftale og benyt API
Kan det udstilles teknisk hensigts-
mæssigt?
Inkluder dataejer i projekt, design
integration
Kan data overdrages fra anden
SB-løsning?
Design evt. løsning til at kunne modtage Overdragelses-data
Slut
Ja
Ja
JaNej
Nej
Ja
NejNej
Start
Er adgang til data økonomisk
acceptabel?
Ja
Nej
Design din SB-løsning til, at bruger
kan angive data
1
2
34
5 6
7 89
11
2. Oversigt over datadistributører vedligeholdes af DIGSTGrundlag for genbrug af data i selvbetjeningsløsninger
Datadistributionsplatform Myndighed Beskrivelse Link
Danmarks Miljøportal Danmarks Miljøportal Opsamler, opbevarer og udstiller natur- og miljødata http://www.miljoeportal.dk
Datafordeleren Styrelsen for Dataforsyning og Effektivisering
Distribuerer fællesoffentlige grunddata via en række webservices, filbaserede udtræk og hændelsesbeskeder https://datafordeler.dk/
Den Nationale Serviceplatform (NSP) SundhedsdatastyrelsenUnderstøtter datadeling mellem en lang række digitale løsninger, der benyttes af borgere, patienter og medarbejdere i hele sundhedsvæsenet
https://sundhedsdatastyrelsen.dk/NSP
Det Fælles Datagrundlag (DFDG) Styrelsen for Arbejdsmarked og Rekruttering
Understøtter deling af nødvendige oplysninger på beskæftigelsesområdet på tværs af relevante parter, herunder jobcentre, a-kasser, borgere og andre aktører
https://star.dk/it/saadan-arbejder-vi-med-it-i-styrelsen/oversigt-over-digitale-platforme-for-eksterne-brugere/styrelsen-for-arbejdsmarked-og-rekrutterings-webservices-og-wiki/webservices-til-dfdg-det-faelles-datagrundlag/
ERST Distribution Erhvervsstyrelsen Distribuerer CVR data og andre erhvervsdata fra Erhvervsstyrelsen, beriget med virksomhedsrelaterede data fra andre offentlige datakilder
https://data.virk.dk/http://datahub.virk.dk/dataset/system-til-system-adgang-til-cvr-data
Generel UdstillingsLøsning (GUL) SKAT Skal efter planen tilbyde én fælles, ensartet og stabil indgang til SKATs data (Under udvikling)
Kortforsyningen Styrelsen for Dataforsyning og Effektivisering Distribution af kort og geodata på internettet. https://kortforsyningen.dk/
Energi Data Service Energinet (Energi-, Forsynings- og Klimaministeriet)
Gratis og åben dataportal, hvor alle kan hente data om det danske energisystem – fx CO2-udledning og forbrugs- og produktionsdata.
https://www.energidataservice.dk/da_DK/about
Serviceplatformen og de fælleskommunale støttesystemer KOMBIT
Giver adgang til, at kommuner og kommunale it-leverandører på en ensartet måde kan få adgang til funktionalitet og data fra offentlige fag- og kildesystemer
https://www.serviceplatformen.dk/
Statistikbanken Danmarks Statistik Indeholder og udstiller officiel statistik, der beskriver det danske samfund http://www.statistikbanken.dk/
Link: https://arkitektur.digst.dk/node/677
12
2. To perspektiver på et selvbetjeningsforløbGrundlag for genbrug af data i selvbetjeningsløsninger
FagsystemFagsystem
Selvbetjenings-forløb
Fagsystemer
Andet selvbetjenings-
forløb
Andet selvbetjenings-
forløb
DatakilderDatakilderDatakilderOnce-only
Tværgående proces(mulighed for Overdragelse)
13
2. Eksempel: Aula – genbrug af DagtilbudsregisteretGrundlag for genbrug af data i selvbetjeningsløsninger
• Aula er kommunernes nye platform til kommunikation i folkeskoler, SFOer og dagtilbud
• Ønskes: Unikt ID på alle daginstitutioner i Danmark
• Haves: Dagtilbudsregister – udviklet til statistiske formål (normering m.m.)
• Kan dette bruges?– Opfylder krav til datakvalitet, Teknik og økonomi– Udfordring: Udviklet af Styrelsen for IT og Læring for Børne- og Socialministeriet på
baggrund af specifik hjemmel – og dermed en hjemmelmæssig udfordring i genbrug af registeret
– Løsning?
14
2. Integrationsmønstre: Skab et fælles katalogGrundlag for genbrug af data i selvbetjeningsløsninger
Opdrag: Vores projekt skulle skabe et katalog af velbeskrevne integrationsmønstre…
… der kan genbruges på tværs af offentlige løsninger (med fokus på selvbetjeningsløsninger)…
… så vi troede, at vi skulle identificere en række mønstre, prioritere de vigtigste og beskrive disse…
… men startede med at gå et halvt skridt tilbage og spørge ”Hvad er egentlig et integrationsmønster?”
15
2. Integrationsmønstre: Inspiration udefra [1/4]Grundlag for genbrug af data i selvbetjeningsløsninger
• Enterprise Integration Patterns – 65 tekniske patterns (Gregor Hohpe et. al)– 4 main styles: File transfer, Shared Database, Remote Procedure Invocation, Messaging
Kilde: https://www.enterpriseintegrationpatterns.com/patterns/messaging/index.html
16
2. Integrationsmønstre: Inspiration udefra [2/4]Grundlag for genbrug af data i selvbetjeningsløsninger
• OIO / IT- og Telestyrelsen – 8 blandede mønstre, problem-/forretningsorienteret
Kilde: http://arkitekturguiden.digitaliser.dk/integrations-moenstre
17
2. Integrationsmønstre: Inspiration udefra [3/4]Grundlag for genbrug af data i selvbetjeningsløsninger
• Offentlige sektors datainfrastruktur – 7 generiske mønstre
Typologi for integrationsmønstre1. Batch-overførsel: Data kopieres i pakker fra én løsning til en/flere løsninger med faste kørsler (fx ved filoverførsler).
2. Request-respond (webservice): En anmodende løsning kalder en udstillende løsning, som sender et svar tilbage.
3. Hændelsesbaseret: En hændelse i en løsning udløser, at en besked sendes til de løsninger, der abonnerer på hændelsen.
4. Screen scraping: Software simulerer menneskelig adfærd ved at hente data fra den ene løsnings brugergrænseflade og indtaste i den anden løsning.
5. ETL: Data hentes fra kilden, transformeres til en ny datamodel og indlejres i den modtagende løsning (fx datavarehuse, der trækker på flere kilder).
6. Direkte skriveadgang: En løsning har adgang til at skrive direkte ned i databasen på en anden løsning.
7. Manuel integration: Data hentes manuelt fra brugergrænsefladen i én løsning og indtastes i en anden løsning.
Andet integrationsmønster: Et mønster, der ikke er dækket af ovenstående muligheder.
Kilde: Rapporten “Dokumentation af den danske offentlige sektors datainfrastruktur”, DIGST, 2018
18
2. Integrationsmønstre: Inspiration udefra [4/4]Grundlag for genbrug af data i selvbetjeningsløsninger
• Referencearkitekturfor deling af data ogdokumenter – 6 implementerings-orienterede mønstre
Kilde: https://arkitektur.digst.dk/referencearkitektur-deling-af-data-og-dokumenter-0
19
2. Integrationsmønstre: … get LOST to find your way?Grundlag for genbrug af data i selvbetjeningsløsninger
Kilde: https://joinup.ec.europa.eu/sites/default/files/distribution/access_url/2017-10/eira_v1_0_0_overview.pdf
Integrationsmønstre skal, fundamentalt set, understøtte interoperabilitet.
EU definerer i EIF (European InteroperabilityFramework) niveauerne LOST:1. Legal – aftaleregimet, hjemmel m.m.2. Organisational – sammenhæng på det
forretningsmæssige og procesmæssige plan3. Semantic – dataformater, transformationer,
valideringsregler4. Technical – protokolvalg - SOAP, REST,
FTP, eDelivery, MQ, Javascript injection, RPA; teknisk sikkerhed, m.m.
20
3. Diskussion og input
Set fra jeres synspunkt – og ud fra jeres erfaring:1) Hvilke data kan skabe værdi for jeres brugere?2) Oplever I barrierer i forhold til at genbruge data?3) Vejledning vs. anbefalinger vs. standarder – hvilket niveau giver mest værdi?
21
Tak for jeres tid!Grundlag for genbrug af data i selvbetjeningsløsninger
Referencearkitekturer: https://arkitektur.digst.dk/rammearkitektur/referencearkitekturer