大綱• 四個資料分享流程• 六個非用 Darwin core 的理由• 十分鐘教你看懂 Darwin core• 八個使用 Darwin core archive 要注意的事情• 一個好工具分享 --IPT 介紹• 一個用 DwC-A 經典範例 --Data paper 投稿範例
資料發佈流程
52 country participants, 38 international organizations; 417,529,910 indexed records, 10,004 datasets, 464 publishers
Darwin core Archive
資料分享工具
Darwin core Archive 的重要性• 1. 生物多樣性資料分享的國際標準
– ABCD • > 1200 詞彙(欄位)• Shared via BioCase
– Darwin core (v 1.2)• 48 詞彙(欄位)• Shared via by DiGIR
– Darwin Core (v. 1.4) • 46 詞彙(欄位)• Shared via Tapir
– Darwin Core (TDWG Standard, since 2009) • 172 詞彙(欄位 )
BY Kyle Braak
有哪些組織在用 Darwin core
• 美國生物多樣性典藏數位化計畫(Advancing Digitization of Biodiversity Collections)
• 澳洲生物地圖集( Atlas of Living Australia, ALA)
• 台灣數位典藏國家型計畫
Darwin core Archive 的重要性• 1. 生物多樣性資料分享的國際標準• 2. 結構化資料
ScientificName vernacularName taxonRank scientificNameAuthorship
locality threatStatus
Cycas taitungensis 臺東蘇鐵 species C. F. Shen Taiwan
Hemimyzon taitungensis 臺東間爬岩鰍 species Tzeng &
Shen, 1981Tachia River
VU
Pocillopora damicornis 細枝鹿角珊瑚 species Linnaeus,
1758Widely distributed Indo-Pacific
…….. ……….. ……… …………. ………. ………….
Darwin core Archive 的重要性• 1. 生物多樣性資料分享的國際標準• 2. 結構化資料• 3. 回傳一致的搜尋結果• 4. 學術出版• 5. 資料備份
Time
Info
rmat
ion
Con
tent
Time of publication
Specific details
General details
Retirement orcareer change
DeathAccident
after Michener et al., 1997
Time
Info
rmat
ion
Con
tent
Time of publication
Specific details
General details
Retirement orcareer change
DeathAccident
Time
Info
rmat
ion
Con
tent
Time of publication
Specific details
General details
Retirement orcareer change
DeathAccident
after Michener et al., 1997
生物多樣性面臨的危機• 環境破壞、物種滅絕• 累積的資料知識失落
Darwin core Archive 的重要性• 1. 生物多樣性資料分享的國際標準• 2. 結構化資料• 3. 回傳一致的搜尋結果• 4. 學術出版• 5. 資料備份6. 資料可再利用與分析, Ecological Niche Model
Analysis / Applications
10 分鐘看懂 Darwin core類別 說明 詞彙Record-level terms 關於採集或觀測資
料的收藏紀錄Modified 、 Language 、 institutionCode 、collectionCode( 館藏代碼 ) 等
Occurrence 關於物種在自然、館藏、或資料集中的出現紀錄資訊
catalogNumber( 編目號 ) 、 recordedBy 、 individualCount 、 Preparations( 製備過程 ) 等
Event 關於某次採集或觀測行為的事件紀錄
eventDate( 事件日期 ) 、 Habitat( 採集環境描述 ) 等
Location 地理與位置資訊 Country 、 County 、 locality 、 minimumElevationInMeters 、 minimumDepthInMeters 、 decimalLatitude 、 decimalLongitude、 coordinateUncertaintyInMeters 等
Identification 關於採集或觀測資
料的鑑定資訊identifiedBy 、 dateIdentified 等
Taxon 關於採集或觀測資料的分類資訊
scientificName 、 kingdom 、 Phylum 、 Class 、 Order 、 Family 、 genus 、 specificEpithet 、 infraspecificEpithet 等
Darwin core is divided into classes and terms
• http://rs.tdwg.org/dwc/terms/index.htm
dcterms:modified :最後修正日期資料中的任何欄位修正完成時的日期及時間。使用 ISO-8601 格式,如: 1994-11-05
Darwin core is divided into classes and terms
• http://rs.tdwg.org/dwc/terms/index.htm
dcterms:rights :資料授權的方式如:創用 CC 姓名標示、姓名標示─非商業性
Darwin core is divided into classes and terms
• http://rs.tdwg.org/dwc/terms/index.htm
basisOfRecord :資料基底,如:PreservedSpecimen- 標本收藏FossilSpecimen- 化石標本LivingSpecimen- 活體標本HumanObservation- 人為觀測MachineObservation- 機器觀測StillImage- 靜態影像SoundRecording- 錄製聲音OtherSpecimen- 其它標本
Darwin core is divided into classes and terms
• http://rs.tdwg.org/dwc/terms/index.htm
recordedBy :資料記錄者為主要的採集者或觀測者
Darwin core is divided into classes and terms
• http://rs.tdwg.org/dwc/terms/index.htm
samplingProtocol :採集方法如採集時使用方法或步驟的名稱、參考或簡短描述。例如:紫外光陷阱、霧網、底拖網
Darwin core is divided into classes and terms
• http://rs.tdwg.org/dwc/terms/index.htm
eventDate :資料發生日期如採集日期, 1997-12-02
Darwin core is divided into classes and terms
• http://rs.tdwg.org/dwc/terms/index.htm
locality :位置、採集地,如里龍山decimalLatitude :十進位緯度,採集或觀測事件發生地點中心位置的緯度,以十進位表示decimalLongitude :十進位經度,採集或觀測事件發生地點中心位置的經度,以十進位表示
Darwin core is divided into classes and terms
• http://rs.tdwg.org/dwc/terms/index.htm
Darwin core is divided into classes and terms
• http://rs.tdwg.org/dwc/terms/index.htm
scientificName :學名,該分類群最低階層的完整名稱,應採用最近被接受的分類方式,盡可能地精確,包含作者、發表年代、看法引證來源、不確定性的指示。例如: "Coleoptera" ( 目 ), "Vespertilionidae" ( 科 ), "Manis" ( 屬 ), "Ctenomys sociabilis" ( 屬 + 種小名 ), "Ambystoma tigrinum diaboli" ( 屬 + 種小名 + 亞種小名 ), "Quercus agrifolia var. oxyadenia (Torr.) J.T. Howell" ( 屬 + 種小名 + 種下階層 + 種下名 + 學名作者
Darwin core is divided into classes and terms
• http://rs.tdwg.org/dwc/terms/index.htm
taxonRank :分類等級該分類群最低階層的等級,如 "subspecies", "varietas", "forma", "species", "genus“, “family”
Darwin core extension• http://rs.tdwg.org/dwc/terms/index.htm
paleontology - 古生物學常用詞彙已經被整合到 GeologicalContext
Darwin core 的更改記錄• http://rs.tdwg.org/dwc/terms/history/index.htm
8 個運用 Darwin core 要注意的事情 (1)• 對於分享的每一筆記錄,需要產生一個獨特唯一的”核心 ID(core ID)”
– 流水編號– lsid
core ID scientificName vernacularName recordedByurn:lsid:coatbp.sinica.edu.tw:observation:1
Grammoplites scaber 橫帶牛尾魚 邵廣昭
urn:lsid:coatbp.sinica.edu.tw:observation:2
Begonia silletensis (A. DC.) C. B. Clarke
厚壁秋海棠 彭鏡毅
8 個運用 Darwin core 要注意的事情 (2)
• 盡可能使用 Darwin core 欄位name 俗名 collector
Grammoplites scaber 橫帶牛尾魚 邵廣昭Begonia silletensis (A. DC.) C. B. Clarke 厚壁秋海棠 彭鏡毅scientificName vernacularNa
merecordedBy
Grammoplites scaber 橫帶牛尾魚 邵廣昭Begonia silletensis (A. DC.) C. B. Clarke 厚壁秋海棠 彭鏡毅
8 個運用 Darwin core 要注意的事情 (3)
• 不要使用類別名稱,如 Occurrence, Event, MaterialSample, Location, Taxon
Taxon Location EventGrammoplites scaber 台灣 標本採集Begonia formosana (Hayata) Masam. 水鴨腳 自然觀察
scientificName locality basisOfRecordGrammoplites scaber 台灣 標本採集Begonia formosana (Hayata) Masam. 水鴨腳 自然觀察
8 個運用 Darwin core 要注意的事情 (4)
• 使用 Darwin core已經定義的說明scientificName locality basisOfRecordGrammoplites scaber 台灣 標本採集Begonia formosana (Hayata) Masam. 水鴨腳 自然觀察
scientificName locality basisOfRecordGrammoplites scaber 台灣 PreservedSpecimen
Begonia formosana (Hayata) Masam. 水鴨腳 HumanObservation
8 個運用 Darwin core 要注意的事情 (5)
• 盡可能的填上所調查資料屬性scientificName vernacularName recordedBy
Grammoplites scaber 橫帶牛尾魚 邵廣昭Begonia silletensis (A. DC.) C. B. Clarke 厚壁秋海棠 彭鏡毅
scientificName
vernacularName
recordedBy
decimalLongitude
decimalLatitude
eventData
kingdom associatedMedia
right
taxonRank
Grammoplites scaber
橫帶牛尾魚
邵廣昭 121.22 22.46 2001-10-11 動物界 1.Jpg Cc-
byspecies
Begonia silletensis (A. DC.) C. B. Clarke
厚壁秋海棠
彭鏡毅 120.111 24.892 1998-10-23 植物界 2.jpg Cc-
byspecies
8 個運用 Darwin core 要注意的事情 (6)
• 格式需要符合定義的規範scientificName eventData decimalLatitudeGrammoplites scaber 11-11-11 N 22.47
Begonia silletensis (A. DC.) C. B. Clarke
102-11-11 22 。 41’36
scientificName eventData decimalLatitudeGrammoplites scaber 2011-11-11 22.47
Begonia silletensis (A. DC.) C. B. Clarke
2013-11-11 22.68
8 個運用 Darwin core 要注意的事情 (7)
• 若有些資料被想公開,可以用 informationWithheld 來加以說明– 如:此物種為瀕危物種,因此座標隱藏( location
information not given for endangered species )scientificName decimalLongitude decimalLatitude informationW
ithheldGrammoplites scaber
location information not given for endangered species
Begonia silletensis (A. DC.) C. B. Clarke
121.11 22.68
8 個運用 Darwin core 要注意的事情 (8)
• 若有些資料欄位目前對應不到 Darwin core ,這些欄位是可以保留,但發佈的時候,這些資料會被忽略
“Wingspan” is not a Darwin Core term
58
• Basic Metadata• Geographic Coverage• Taxonomic Coverage• Temporal Coverage• Keywords• Associated Parties• Project Data• Sampling Methods• Citations• Collection Data• External Links• Additional Metadata
Ecological Metadata Language (EML)Sections of metadata
Darwin Core Archive: Benefits
• Simple format (text files) • Efficient harvesting (single file) • Efficient storage (compressed) • Easy access (no special software required)
What is 'Data Paper' ?• Searchable / online accessible datasets
– Should always be linked to the published datasets they described.
• Metadata described– Contains facts about data.– Rather than reporting a
research investigation. • Scholarly publication /
scholarly credit67