中文字幕在线中乱码,青青青国产最新视频在线观看,无遮挡免费一级毛片视频,激情国产原创在线观看

 
 

科學基金資助機構視角下的科學數據管理研究

發布時間:2022-01-20 09:45:43  |  來源:中國網·中國發展門戶網   |  作者:趙秋紅 李元睿等  |  責任編輯:楊霄霄
關鍵詞:科學數據,科學基金資助機構,數據匯交,數據共享

中國網/中國發展門戶網訊  科學數據是指將研究對象抽象化和概念化后所形成的、用于科學研究活動的相關事實記錄??茖W數據的形式包括統計數據、實驗結果、觀測結果、訪談記錄、圖像和聲音等,是證實科研發現或支撐學術觀點的證據,也是進行理論推理的基礎。隨著大數據時代的到來,海量科學數據帶來了豐富的基礎性科技資源,科學研究水平逐漸開始依賴于對科學數據的積累,以及將科學數據轉化為知識和科研產出的能力??茖W數據管理是指協調并規范對科學數據的采集、生產、存儲、使用、共享等活動。對科學基金資助機構而言,科學數據管理就是對被資助者設定并監督其科學數據采集、生產、匯交的標準和流程,加強科學數據存儲與共享的軟件系統與硬件設施建設,推動被資助項目所產生的科學數據的開放共享,發揮科學數據所蘊含的價值。

當前,在國家科學數據管理政策的指導下,一些部門特別是國家級科學數據中心制定了具體的科學數據管理方案,有效開展了科學數據管理的實踐。但科學基金資助機構尚未形成成熟的科學數據管理方案??茖W基金資助機構是資助科學研究的主要渠道之一,對科學基金資助機構的科學數據管理具有重要意義:一方面,科學基金資助機構承擔著所資助項目的管理責任,如何把所資助項目產生的數據收集好、管理好、利用好,是一項重要的任務;另一方面,科學基金資助機構掌握大量的科學數據資源和相關信息,與資助方、項目承擔者及其所在工作單位存在緊密和長期的合作關系,具有科學數據管理的先天條件和優勢。因此,提高科學基金資助機構的科學數據管理水平,進一步促進科學數據開放共享,是提升我國科研水平和創新能力的重要途徑,具有重要的戰略意義。 

科學數據管理需求產生的驅動因素

科學研究范式轉變

在科學史中,無論“經驗范式”“理論范式”或“計算范式”,用數據研究科學規律始終扮演著重要的角色。隨著信息技術革命的發展,科學數據越來越容易被生產(收集)、存儲、處理、分析和傳播,科學數據總量呈幾何式增長,這使得任何單一的傳統研究范式都無法有效應對密集型數據的挖掘和整合。因此,科學研究范式開始轉向“第四范式”,即“數據驅動范式”。在此背景下,學科交叉融合與科學數據爆炸式增長相互促進,科學數據管理越發成為整合數據資源的必要手段。

大數據時代推動

近年來,高度連接的世界和迅速發展的電子信息相關的軟、硬件設備使得數據產生的范圍、方式、途徑發生了革命性變化。數據在類型格式、組成結構、存在形態等方面也趨向復雜化。在云計算、大數據分析工具、并行數據庫等技術工具的支撐下,從海量數據中挖掘出新的知識變為可能,科學數據越發成為科學研究的“金礦”;圍繞科學數據的存儲、分析、傳播和應用等要素的科學數據管理正越來越影響著一個國家的科技水平。

開放獲取運動興起

開放獲?。∣pen Access)是致力于推動科研成果共享,借助互聯網自由傳播的特性來促進科研交流,推動便捷出版,提高科研效率的行動。在數據資源領域,科學數據的開放共享能夠減少重復勞動,縮短科研周期。然而,在復雜的科研場景下,數據的展現形式和獲取途徑難以滿足知識共同體的需求,需要科學的激勵機制和質量控制體系來保證科學數據的有效流動,從而形成博弈策略的穩態平衡。因此,實施科學數據管理也是開放獲取運動的必然要求。

除了上述因素以外,不斷擴張的科學數據邊界、數據結構多樣性、數據權益及數據隱私保護等因素也是驅動科學數據管理不斷發展的重要因素。因此,各國政府對科學數據資源提高重視,不斷加強政策引導以推動數據開放共享。 

部分發達國家科學資助機構的科學數據管理實踐

美國主要科學資助機構的科學數據管理實踐

美國國家科學基金會(NSF)要求所資助的科研項目在項目申請階段應提交“數據管理計劃”(Data Management Plan,DMP),以加強對所資助科研項目產出的科學數據的管理。在?DMP?中,項目申請人需要對項目實施中產生的所有科學數據及其元數據的格式、內容標準、訪問權限、共享計劃等內容進行闡述。該計劃是項目審核的先決條件和重要評判依據。美國國立衛生研究院(NIH)同樣制定了科學數據管理相關政策,并要求項目產生的科研數據要符合?FAIR?原則,即:可檢索(findable)、可訪問(accessible)、可交互使用(interoperable)和可重復使用(reusable)。

英國主要科學資助機構的科學數據管理實踐

英國研究理事會(RCUK)等科學資助機構是英國科學數據管理政策的主要制定者。RCUK?發布了多項科學數據管理政策,提出了包括數據成長、長期存儲、共享和開放等方面的數據管理政策的基本原則,指出科學數據管理需要遵循的?5?項原則:明確研究人員、研究機構和資助者的責任和義務;在收集和篩選科學數據時,應保證數據質量;數據共享時應提高科學數據的查詢效率,提供訪問的權限;科學制定科學數據管理政策辦法,提高公共科研基金的使用效率和使用效益;對具有長期價值的科學數據進行妥善保存。

澳大利亞主要資助機構的科學數據管理實踐

澳大利亞國家數據服務局(ANDS)為科研工作者提供數據管理服務,以致力于提高科學數據的價值。ANDS?對科學數據管理中需要考慮的關鍵步驟進行了研究,并明確了在這些步驟下的責任劃分。澳大利亞研究理事會(ARC)、澳大利亞國家衛生和醫學研究理事會(NHMRC)等科學資助機構認同?ANDS?所擬定的科學數據管理計劃,要求所資助的項目遵循這些規定,并鼓勵研究團隊將項目產出的科學數據及出版物存儲在指定的數據庫中以便于開放共享。 

基于全生命周期的科學基金資助機構科學數據管理思路

基于上述分析,部分發達國家科學數據管理實踐注重從宏觀角度把握科學數據生命周期內的各項管理環節,尤其圍繞?DMP?展開對科學數據從產生到再利用的各階段的把關控制。以?DMP?為抓手的管理思路值得我國科學數據管理實踐借鑒。然而,現行科學數據管理活動往往限制于數據生命周期的各個離散的發展階段中,不利于將各階段有機聯結。

根據科學數據生產前、中、后?3?個時期,可將科學數據的生命周期劃分為:數據的計劃、數據的生成/收集、數據的處理、數據的存儲、數據的共享、數據的再利用?6?個階段。由于科學數據的產生和應用具有連續性特征,需要執行科學數據管理的環節不能完全與數據生命周期的各階段一一對應。因此,本文提出全生命周期視角下的科學數據管理的總體思路(圖?1)。

全生命周期視角下的科學數據管理強調管理環節對數據生命周期各階段的延伸影響和長期支持。在職責劃分上,依托單位指導并管理科研團隊,共同承擔對科學數據產生前和產生中的任務,即制定并按照?DMP?產出和匯交符合要求的科學數據。第三方共享平臺負責數據匯交完成后的數據存儲、共享和再利用等階段的工作??茖W基金資助機構的職責貫穿數據的全生命周期:在科學數據的計劃階段,應推動?DMP?的制定、實施和考核;在數據產生的初期,應著手啟動科學數據匯交管理,從軟、硬件設施為科學數據匯交存儲提供先決條件,并從利于數據共享的角度設計匯交流程和匯交模式;在數據產生后,應啟動科學數據開放共享和科學數據的可持續維護,建立高效的共享機制,不斷發掘數據的價值,直至科學數據過于陳舊,不再被人使用,即科學數據生命周期終結。 

全生命周期視角下的科學基金資助機構科學數據管理方案

DMP?的制定和實施

DMP?的制定和實施應該在數據產生前和初期產生階段進行,對應的是科研團隊準備和提交項目申請書階段??茖W基金資助機構應要求科研團隊提交詳盡的?DMP,并嚴格按照?DMP?對科學數據生命周期各階段進行評估。項目團隊需要通過?DMP?描述在項目研究過程中將要收集或產生的數據,并且明確在項目研究過程中如何管理和儲存這些科學數據,以及在項目結題后如何共享。作為貫穿科學數據全生命周期的綱領,DMP?為數據倫理論證、追溯科學基金數據責任人提供了透明化路徑和依據。科學基金資助機構應建立先匯交項目科學數據、再驗收項目的機制,將?DMP?執行的情況作為項目結題評審的重要考核指標,并把基于數據全生命周期的?DMP?執行情況作為申請新項目資質的條件。

科學數據匯交管理

科學數據的產生具有階段性和持續性特點。因此,數據的匯交應發生在一定時間段內,即數據生成/收集到數據處理階段。科學基金資助機構可設置靈活機制,允許科研團隊隨時將成熟的科學數據進行匯交,以提高數據的時效性,使其盡快被共享,提升其價值。應建立基于元數據的科學數據匯交模式(圖?2)。元數據即“數據的數據”,是對科學數據進行規范化的描述數據??茖W數據產生后,以依托單位為數據匯交單元,將下屬各項目團隊的科學數據和元數據匯交至科學數據匯交共享平臺;平臺進行初步驗收和分揀,將元數據進行存儲,并將科學數據存放至相應學科的科學數據中心。各學科科學數據中心在科學基金資助機構的指導下對科學數據進行匯交質量評價。評價結果反饋后,對于不合格的數據,科學數據匯交共享平臺應要求依托單位和項目團隊進行整改和重新提交。


科學數據開放共享

科學數據進行匯交后,基于元數據的存儲模式為科學數據的共享和再利用提供了便捷和開放的途徑。科學數據的共享交由第三方進行,應平衡利益相關者的利益訴求,引導各方積極推動科學數據的開放共享??茖W數據共享的利益相關者包括:政府、科學基金資助機構、科學數據中心、依托單位、數據生產者、數據使用者、同行評審專家、受試者和出版者??茖W數據的共享需要數據全生命周期利益相關者共同參與,可構建科學數據共享機制體系(圖?3);各利益相關者應該通過制度和利益協調來實現科學數據共享的目標。政府作為資金提供者和管理政策的頂層設計者,應該建立全方位的政策引導體系,規范監督和引導各利益相關者的行為;科學基金資助機構作為科學數據共享組織系統的中樞,應聯結各利益相關者團結協作,與科學數據共享平臺、數據出版商建立合作聯盟的管理模式。

科學數據的可持續維護

科學數據的可持續維護貫穿數據的存儲、共享和再利用階段。對科學數據的可持續維護是數據全生命周期管理的重要組成,是實現科學數據不斷發揮價值的重要保障。應建立面向用戶的數據獲取技術體系,構建高效合理的存儲層次結構,對熱數據進行緩存或預取,將冷數據遷移至低速存儲設備,從而優化系統性能分配,提高用戶的數據獲取便利程度。在數據溯源方面,應對提交的數據建立唯一標識,確保科學數據能夠按照統一的標準進行整合,從而保證科學數據能夠依據標識進行溯源,進一步確保科學數據可以被應用、比對。同時,建立基于身份證號碼或開放研究者與貢獻者身份(ORCID)的身份標識體系,用于確定科學數據與數據負責人的對應關系,保障科學數據的回溯和追蹤。 


科學數據是科技創新和經濟發展中不可或缺的基礎性資源。在科學研究范式變革、大數據時代發展等因素的推動下,科學數據對科學研究的重要意義日益凸顯。科學基金資助機構作為主要的科研項目資助和管理實體,需要提高科學數據管理水平,推動科學數據的開放共享。本文從數據生命周期的各階段入手,提出聯結和推動數據生命周期健康發展的科學數據管理的關鍵環節,包括:DMP?的制定與實施、科學數據匯交管理、科學數據開放共享和科學數據的可持續維護。其中,DMP?作為科學數據管理的綱領性文件,伴隨科學數據生命周期的各個階段。科學數據匯交管理應以發揮科學數據的最大價值為目標;應通過數據庫的建立和數據匯交流程和模式的設計,為數據的特色化匯交和便捷共享打下良好的軟、硬件基礎。科學數據開放共享延續科學數據匯交的管理體系,通過多方共同參與的共享機制提高用戶和數據共享中心的良性互動。同時,為延長科學數據壽命,應對科學數據進行可持續維護,通過數據唯一標識、數據溯源、優化數據存儲等手段,最大化科學數據價值,以持續推進科學數據開放共享,不斷增強科技創新能力。


(作者:趙秋紅、李元睿、鄧修權、張楚、張保豐,北京航空航天大學 經濟管理學院;《中國科學院院刊》供稿)


返回頂部