Begrebsarbejde som
forudsætning for
datamodellering
Højnelse af datakvalitet og øget effektivitet i
it-systemer
Copenhagen Business School, mandag den
5. december 2016
Bodil Nistrup Madsen & Hanne Erdman Thomsen
1
Oversigt
1. Begrebsmodellering
Metode
Når myndigheder taler forskelligt dansk
2. Begrebsmodellering versus
datamodellering
Modellernes formål og indhold
Det ideelle modelleringsforløb
Eksempel på problemer i datamodel
Konklusion
3. Behov for samarbejde
2
Udsnit af Medicineringsbegreber Associativ
relation
Del-
helhedsrelation
Typerelation
Begreb
Inddelingskriterium
6
Tilføjelse af træk v. bnm
INTERVAL:
fastlagt
INTERVAL:
efter behov
ADMINISTRATION:
gentagen dosering
ADMINISTRATION:
enkeltstående dosering
MÅDE:
i henhold til skriftlig anvisning
Karakteristisk træk:
ATTRIBUT:VÆRDI
7
Sammenstilling af begreber fra
Justitsministeriet og Socialstyrelsen
13
myndighedssag sag hvori der træffes en afgørelse
Justitsministiet Socialstyrelsen
myndighedssag sag som ligger inden for en forvaltningsenheds primære forretningsområde reguleret af særlig lovgivning
Problemstilling
Der er mange lighedspunkter mellem
begrebsmodellering og datamodellering.
MEN!
Der er ingen en-til-en korrelation mellem
begrebsmodel og datamodel, dvs. der er ikke
fuldstændig overensstemmelse mellem
henholdsvis begreber og karakteristiske træk
i begrebsmodellen og klasser og attributter i
datamodellen.
18
Illustration af modellernes indhold Terminologisk ontologi:
Klasse
Attribut
Datamodel (UML):
SourceReference
OralSourceReference
WrittenSourceReference
ref: Integer pk
type: String
suppl: String
ref: Integer pk fk
job: String
name: String
ref: Integer pk fk
year: String
publisher: String
author: String
title: String
Typerelation mellem
begreber Begreb
Inddelingskriterium
Trækspecifikation:
attribut-værdi-par
Specialisering Origin
Diskriminator
19
Modellernes formål og
indhold
MODELTYPE FORMÅL INDHOLD
Terminologisk
ontologi
At skabe
begrebsafklaring og
enighed om
indholdet af en term
og brugen af
fagudtryk
Oplysninger om begreber i form af
karakteristiske træk (trækspecifikation)
og begrebsrelationer
Datamodel At fastlægge hvilke
oplysninger, der skal
indgå i et it-system,
og hvordan de
hænger sammen
Oplysninger om databasens klasser i
form af attributter og relationer mellem
klasser
20
Begrebsforvirring - Klip fra
Kriminalforsorgens
modelleringsvejledning
Der er ikke enighed om indholdet af og
betegnelserne for de forskellige
datamodelleringsniveauer.
En ofte anvendt betegnelse er fx
informationsmodel. Denne anvendes både om
konceptuel datamodel og logisk datamodel.
21
• Konceptuel datamodellering Udarbejdelse af en datamodel der afspejler typer af entiteter og deres indbyrdes relationer, og som udgør en abstrakt repræsentation af data.
• Fysisk datamodellering Udarbejdelse af en datamodel der afspejler den fysiske struktur i et it-system
• Terminologisk begrebsmodellering Udarbejdelse af en terminologisk ontologi der indeholder oplysninger om begreber i form af karakteristiske træk og begrebsrelationer - BEGREBSAFKLARING! 1
2
3
4
• Logisk datamodellering Udarbejdelse af en datamodel der specificerer organiseringen af data på en måde, som afspejler den logiske struktur i et it-system.
Ideelt modelleringsforløb
23
Eksempel på ideelt
modelleringsforløb
Udvikling af et it-system med en
bagvedliggende relationel
database til
konferenceadministration
Case fra Mathiassen et al.: Objektorienteret
analyse & design
24
Beskrivelse af databasen - udsnit
• Konferencesystemet skal bruges til forberedelse og administration af
en konference, dvs. udarbejdelse af konferenceprogram og
administration af deltagere og artikler. Det skal ikke bruges i
forbindelse med budgetlægning, regnskab samt hotel- og
lokalereservationer. Målgruppen er programkomiteen,
organisationskomiteen og det administrative personale.
• Personer kan overordnet opdeles i to kategorier: personer, som er
tilmeldt og derfor deltager i konferencens aktiviteter, og personer som
ikke er tilmeldt, men som alligevel kan optræde i forbindelse med
forberedelsen af konferencen. Sidstnævnte personer er typisk
reviewere, som bedømmer artikler indsendt til programkomiteen,
samt forfattere, der har skrevet artiklerne.
• I forbindelse med artikler er det vigtigt at holde styr på, hvem der
bedømmer en given artikel, hvad bedømmelsen er, om artiklen
udvælges til konferencen, og hvornår artiklen skal fremlægges.
25
ledsager, deltager forfatter, reviewer
Inddelingskriterium
bliver til klasse
Her kommer
multipliictet
28
Processen fra terminologisk ontologi til logisk datamodel
Her kommer
multiplicitet på
Kan ‘genereres’ på basis af
terminologisk ontologi
(uden multiplicitet)
30
Jf. den
terminologiske
ontologi
Svarer til typerelation i
terminologisk ontologi
Svarer til to mere specifikke roller:
ROLLE IFT KONFERENCE og
ROLLE IFT ARTIKEL
Den oprindelige konceptuelle datamodel fra Mathiassen et al.
31
Den oprindelige konceptuelle datamodel fra Mathiassen et al.
Versus den konceptuelle datamodel baseret på ontologien
ledsager, deltager forfatter, reviewer
Bliver til de to mere
specifikke roller på
grundlag af den
terminologiske
ontologi
Bliver associativ relation til
to specifikke roller
32
Udsnit af Fødevareministeriets begrebsmodel for Kontrol
Problemer i datamodel
datamodel for Kontrol
http://www.fvm.dk/Files/Filer/Ministeriet/Udvalg%20og%20partnere/Standarder/kontrol/begrebsmodel_kontrol.htm
FVM omtalte den som
begrebsmodel Linket er ikke
længere aktivt
34
35
Oprindelig (logisk) datamodel –
oversat til engelsk
Er her gentegnet i
en mere
overskuelig form
Er ikke typer af
‘control type’ ,
men typer af
‘control’ Se forslag til ændret
konceptuel
datamodel, slide 41
Begreberne ‘sampling’ og
‘analysis’ indgår i ‘on site
control’. De er ikke typer af
‘on site control’.
37
Terminologisk ontologi for kontrol,
engelsk, justeret version
Her er ikke noget begreb ‘control type’, kun
‘control’. Begrebet ‘on site control’ er en
type ‘control’, ikke en type ‘control type’.
Begreberne ‘sampling’ og
‘analysis’ indgår i ‘on site
control’. De er ikke typer af
‘on site control’.
Her er tale om to
begreber:
kontrolansvarlig og
udførende myndighed.
rekvireret
kontrol regelfast
kontrol
prøveudtagning
kontrol på
stedet
40
Oprindelig konceptuel datamodel for kontrol versus
ny konceptuel datamodel baseret på ontologi
Fødevareministeriets model Ny konceptuel datamodel
Fødevareministeriets beskrivelse
af administrativ kontrol
Description
Som udgangspunkt foretages administrativ kontrol på materiale som myndigheden har til
behandling. Dette indebærer kontrol af oplysninger, som kunden har afgivet til en myndighed
gennem en ansøgning, indberetning af produktionsdata eller lignende.
Administrativ kontrol foretages som udgangspunkt udelukkende internt hos myndigheden.
Administrativ kontrol kan foretages på samtlige oplysninger i forbindelse med sagsbehandling
og udbetaling eller anden aktivitet rettet mod kunde, produkt eller aktivitet.
I forbindelse med sagsbehandling af støtteansøgninger foretages både en administrativ kontrol
og en fysisk kontrol.
Den administrative kontrol kan være en systematisk kontrol af alle oplysninger eller en
stikprøveudvalgt del af oplysningerne.
Den administrative kontrol kan ved behandling af eksempelvis ansøgninger opsættes som en
systematisk maskinel udfør kontrol.
Short description
Ved administrativ kontrol forstås den kontrol, der foretages ved at sammenholde modtagne
oplysninger og data vedrørende kunder, produkt eller aktivitet med gældende regler og andre
relevante oplysninger.
Dannede udgangspunkt
for karakteristisk træk i
den terminologiske
ontologi
41
BEGREB FVM DANTERM
kontrol på
stedet
Aktiviteten kontrol på stedet
udføres som en kontrol hos
en kunde eller dennes
leverandør/aftager.
kontrol der udføres hos en
kunde eller dennes
leverandør eller aftager
administrativ
kontrol
Ved administrativ kontrol
forstås den kontrol, der
foretages ved at
sammenholde modtagne
oplysninger og data
vedrørende kunder, produkt
eller aktivitet med gældende
regler og andre relevante
oplysninger.
kontrol der foretages hos
en kontrolmyndighed
DANTERMcentrets definitioner for
kontrol på stedet og administrativ kontrol:
Definitionerne er
ikke diskuteret med
Fødevarestyrelsen.
42
• Konceptuel datamodellering Udarbejdelse af en datamodel der afspejler typer af entiteter og deres indbyrdes relationer, og som udgør en abstrakt repræsentation af data.
• Fysisk datamodellering Udarbejdelse af en datamodel der afspejler den fysiske struktur i et it-system
• Terminologisk begrebsmodellering Udarbejdelse af en terminologisk ontologi der indeholder oplysninger om begreber i form af karakteristiske træk og begrebsrelationer - BEGREBSAFKLARING! 1
2
3
4
• Logisk datamodellering Udarbejdelse af en datamodel der specificerer organiseringen af data på en måde, som afspejler den logiske struktur i et it-system.
Ideelt modelleringsforløb
43
Konklusion
For at kunne udvikle en hensigtsmæssig
database må man kende begrebsmodellen
for det domæne der ligger bag datamodellen
(databasestrukturen).
Viden om begreberne i et domæne findes i
oplysninger om begrebsrelationer,
karakteristiske træk og definitioner
(semantisk viden – terminologisk ontologi).
44
Topontologi - FORVIR
• Udarbejdet af en arbejdsgruppe under FORVIR, Forum
for Videndeling i Offentligt Regi, med deltagelse af mange
medlemmer
• Formål: fælles definition af de generelle begreber, der
bruges i definitioner af mere specifikke fællesoffentlige
begreber
• Vision: udarbejdelse af begrebsmodeller for
fællesoffentlige begreber – ressourcer?
• Work in progress
46
Referencer
• Madsen, Bodil Nistrup (2012): Vejledning for begrebsarbejde i Kriminalforsorgen.
Kriminalforsorgen og DANTERMcentret. Hentet 22-01-2014 på
http://kriminalforsorgen.iterm.dk/search/filer/H%C3%A5ndbog%20i%20begrebsarbejde
%202012-09-18.pdf
• Madsen, Bodil Nistrup, and Hanne Erdman Thomsen (2009). Terminological Concept
Modelling and Conceptual Data Modelling. International Journal of Metadata,
Semantics and Ontologies (IJMSO) 4(4): pp 239-249.
• Madsen, Bodil Nistrup and Hanne Erdman Thomsen (2015): Concept Modeling vs.
Data modeling in Practice. Handbook of Terminology. (eds.) Hendrick J. Kockaert;
Frieda Steurs. Vol. 1 Amsterdam: John Benjamins Publishing Company, pp 250-275.
• Madsen, Bodil Nistrup og Hanne Erdman Thomsen (2015): Når danske myndigheder
taler forskelligt dansk: Begrebsafklaring med terminologiske ontogier, Globe: A Journal
of Language, Culture and Communication, Special Issues 1, 2246-8838, s. 7-25.
https://journals.aau.dk/index.php/globe/issue/download/142/17
50
Links
Sundhedsdatastyrelsen
http://sundhedsdatastyrelsen.dk/da/rammer-og-retningslinjer/om-terminologi/nbs
http://sundhedsdata.iterm.dk/
Kriminalforsorgen
http://kriminalforsorgen.iterm.dk/search/
Socialstyrelsen: find begreb
http://www.socialebegreber.dk/begrebsarbejde/begrebsdatabasen/find_begreb
Forum for begrebsmodellering i offentligt regi (FORVIR)
www.forvir.dk
FORVIRs begrebsbase
http://blog.cbs.dk/forvir/topontologien/
http://forvir.iterm.dk
(Login: FORVIR/FORVIR)
51