期刊VIP學(xué)術(shù)指導(dǎo) 符合學(xué)術(shù)規(guī)范和道德
保障品質(zhì) 保證專業(yè),沒有后顧之憂
來源:期刊VIP網(wǎng)所屬分類:綜合論文時間:瀏覽:次
摘 要:[目的]建設(shè)可長期使用和保存的數(shù)據(jù)監(jiān)護平臺是開展科研數(shù)據(jù)監(jiān)護服務(wù)的核心環(huán)節(jié)和關(guān)鍵。[方法]文章針對機構(gòu)知識庫科學(xué)數(shù)據(jù)監(jiān)護平臺存在的數(shù)據(jù)規(guī)范性、可信任度、安全性和隱私問題,利用區(qū)塊鏈技術(shù)的安全、公正和去中心化等特性,提出融入?yún)^(qū)塊鏈技術(shù)的機構(gòu)知識庫科學(xué)數(shù)據(jù)監(jiān)護模型。[結(jié)果/結(jié)論]本模型能夠?qū)崿F(xiàn)機構(gòu)知識庫科學(xué)數(shù)據(jù)監(jiān)護的基本功能,保障數(shù)據(jù)存儲的安全,提高科學(xué)數(shù)據(jù)共享的效率、利用率和知識產(chǎn)權(quán)保護力度。
關(guān)鍵詞:區(qū)塊鏈;機構(gòu)知識庫;數(shù)據(jù)監(jiān)護;科學(xué)數(shù)據(jù);數(shù)據(jù)管理

20世紀90年代開始,開放獲取運動(Open Access,OA)在圖書情報、編輯出版和新聞傳播領(lǐng)域快速興起[1]。這種旨在消除科學(xué)數(shù)據(jù)間的價格壁壘和許可壁壘,促進科學(xué)數(shù)據(jù)共享和廣泛使用的倡議很快獲得了廣泛關(guān)注。在開放獲取理念的倡導(dǎo)下,國內(nèi)外的高校和科研機構(gòu)紛紛將機構(gòu)知識庫的建設(shè)作為其科研信息服務(wù)的重點。設(shè)立機構(gòu)知識庫的初衷主要是為實現(xiàn)兩點:其一是實現(xiàn)機構(gòu)知識庫中科研成果的開放獲取,打破傳統(tǒng)的數(shù)據(jù)共享壁壘,促進知識的交流和再生產(chǎn);其二是可以長期保存建設(shè)機構(gòu)的科研成果,提升機構(gòu)的學(xué)術(shù)影響力和成果展示度,彰顯機構(gòu)的學(xué)術(shù)聲望、學(xué)術(shù)水平和社會價值[2]。
機構(gòu)知識庫在被提出來后發(fā)展迅速,但是在廣泛關(guān)注和快速發(fā)展的背后,機構(gòu)知識庫的建設(shè)和應(yīng)用也遇到了一些問題:一方面,承擔(dān)機構(gòu)知識庫建設(shè)的高校和科研機構(gòu)容易受制于自身知識資源儲備、專業(yè)人才儲備和資金及技術(shù)上的制約,服務(wù)范圍面向單一機構(gòu)本身容易限制機構(gòu)知識庫的可持續(xù)發(fā)展;另一方面機構(gòu)知識庫與傳統(tǒng)的學(xué)科庫相比,用戶認知度和用戶參與度都并不理想,這主要是由于機構(gòu)知識庫定位模糊而且服務(wù)理念尚不完善所致。針對這兩方面問題,需要由圖書館員通過協(xié)助學(xué)者完善數(shù)據(jù)和元數(shù)據(jù)來促進共享,積極幫助形成向各自領(lǐng)域的學(xué)科庫發(fā)布數(shù)據(jù)成果,建設(shè)可長期使用和保存的數(shù)據(jù)監(jiān)護平臺[3]。
當(dāng)前數(shù)據(jù)監(jiān)護平臺在數(shù)據(jù)組織的持續(xù)性和可擴展性方面存在不足,存儲數(shù)據(jù)遭到破壞、更改、泄露或丟失風(fēng)險[4],數(shù)據(jù)內(nèi)容揭示與服務(wù)方式深讀不夠[5],數(shù)據(jù)的異構(gòu)性與數(shù)據(jù)格式標(biāo)準(zhǔn)化技術(shù)之間矛盾突出[6]等多種懸而未決的實際問題,方興未艾的區(qū)塊鏈技術(shù)則因其安全、公正、去中心化等特性為以上問題提供了一個可能的解決方案。本文嘗試將雙鏈?zhǔn)絽^(qū)塊鏈技術(shù)的相關(guān)思想融合到數(shù)據(jù)監(jiān)護服務(wù)中,并提出相應(yīng)的模型架構(gòu),以此為未來的數(shù)據(jù)監(jiān)護服務(wù)開展提供思路。
1 區(qū)塊鏈技術(shù)理論基礎(chǔ)及構(gòu)建機構(gòu)知識庫科學(xué)數(shù)據(jù)監(jiān)護模型的可行性
1.1 區(qū)塊鏈技術(shù)理論基礎(chǔ)
區(qū)塊鏈(Blockchain)是由多個獨立節(jié)點參與的分布式數(shù)據(jù)庫系統(tǒng),也可理解為由這些獨立節(jié)點共同維護的分布式賬簿(DLT,Distributed Ledger Technology),這是一種基于去中心化、去信任思想的數(shù)據(jù)記錄方式。由此延伸可知區(qū)塊鏈技術(shù)是一種不依賴任何第三方、通過自身分布式節(jié)點進行數(shù)據(jù)交互、驗證、存儲的技術(shù)方案[7]。
區(qū)塊鏈技術(shù)之所以備受矚目,很大程度上是因為這種技術(shù)方案從根本上改變了人們的信任模式。傳統(tǒng)的信息交流和價值交換過程必須通過中介進行,中介作為信息交流和價值交換中的第三方,為網(wǎng)絡(luò)中互不信任的各個節(jié)點搭建橋梁,信息和價值被集中至中心節(jié)點,再由中心節(jié)點甄別后分配給目標(biāo)節(jié)點。這種中心化的組織形式為信息和價值的交流活動增加了成本、降低了效率,且中心節(jié)點一旦遭受攻擊,就將會威脅到整個網(wǎng)絡(luò)的安全。而區(qū)塊鏈技術(shù)則提供了一種無需信任單個節(jié)點,并能創(chuàng)建共識網(wǎng)絡(luò)的方法解決了點對點通信中的基本問題,即拜占庭將軍問題(Byzantine Failures)。
區(qū)塊鏈的工作原理(見圖1)是將數(shù)據(jù)分成不同的區(qū)塊(Block),每個區(qū)塊的塊身(Body)存儲項目(Item),塊頭(Header)包含對前一區(qū)塊的塊頭進行哈希函數(shù)(Hash Function)計算所得到的哈希值,各個區(qū)塊之間都由其塊頭的哈希值與先前的區(qū)塊緊密相連成為一個鏈條(Chain)[8]。
圖1 區(qū)塊鏈工作原理示意圖
這種塊鏈結(jié)構(gòu)是完全時序的,每一個區(qū)塊在創(chuàng)建之時都會被賦予一個無法篡改和偽造的時間戳,這使得整個數(shù)據(jù)庫擁有可回溯的完整歷史;網(wǎng)絡(luò)中的每個節(jié)點獨立作業(yè),它們享有同樣的權(quán)利和義務(wù),這保證了網(wǎng)絡(luò)中絕不存在有特殊權(quán)力的中心節(jié)點,真正實現(xiàn)了去中心化;整個網(wǎng)絡(luò)中的所有數(shù)據(jù)都是開放的,所有節(jié)點都存儲著相同的信息,同時它們也在監(jiān)督和驗證其他節(jié)點所存儲信息的可靠性,并通過投票形成共識網(wǎng)絡(luò),當(dāng)網(wǎng)絡(luò)中少于1/3的節(jié)點惡意作弊或遭到攻擊時,系統(tǒng)仍然可以正常工作,這種分布式記錄、傳播和存儲技術(shù)為網(wǎng)絡(luò)構(gòu)建了高容錯的安全環(huán)境。區(qū)塊鏈技術(shù)的上述關(guān)鍵要素和特性使得它在數(shù)字貨幣和金融領(lǐng)域異彩紛呈,而在本文著重探討的科學(xué)數(shù)據(jù)監(jiān)護服務(wù)領(lǐng)域,區(qū)塊鏈的上述特性也能夠幫助解決科學(xué)數(shù)據(jù)的組織、共享、保存、增值以及涉及知識產(chǎn)權(quán)保護和信息安全的相關(guān)問題。
1.2 區(qū)塊鏈技術(shù)構(gòu)建機構(gòu)知識庫科學(xué)數(shù)據(jù)監(jiān)護模型的可行性
目前,機構(gòu)數(shù)據(jù)庫建設(shè)成為高校圖書館管理和服務(wù)模式創(chuàng)新的重要領(lǐng)域,功能完備的機構(gòu)知識庫可以不斷擴展圖書館資源,提供專業(yè)的科學(xué)數(shù)據(jù)管理和知識共享服務(wù)。運用機構(gòu)知識庫進行數(shù)據(jù)監(jiān)護在取得明顯成績的同時也存在很多問題。主要體現(xiàn)在各部門、各科研人員所提交的科學(xué)數(shù)據(jù)組織規(guī)范性不夠,數(shù)據(jù)提交質(zhì)量參差不齊[9],科學(xué)數(shù)據(jù)間互聯(lián)互通困難,信息共享和協(xié)同困難;存在中心化困擾,大多數(shù)機構(gòu)知識庫由單一機構(gòu)中心化管理,若數(shù)據(jù)被篡改,用戶無法驗證真實性[10];缺乏對數(shù)據(jù)內(nèi)容深度標(biāo)引,無法為科學(xué)研究者提供一站式檢索服務(wù);知識庫建設(shè)和管理過程中,存在安全性和隱私問題,知識產(chǎn)權(quán)問題亟需得到保障[11]。
區(qū)塊鏈技術(shù)對解決機構(gòu)數(shù)據(jù)庫中存在的問題具有可行性。作為由多個獨立節(jié)點參與的分布式數(shù)據(jù)庫系統(tǒng),區(qū)塊鏈本身就是一種數(shù)據(jù)庫技術(shù),它的應(yīng)用、存儲對象和技術(shù)要素本身與機構(gòu)知識庫就是相同的。科學(xué)數(shù)據(jù)具有數(shù)據(jù)的生命周期,區(qū)塊鏈技術(shù)的時間鏈特性也完全匹配這一期望,可見用區(qū)塊鏈技術(shù)解決機構(gòu)知識庫科學(xué)數(shù)據(jù)監(jiān)護中存在的問題是完全可行的[12]。
融合區(qū)塊鏈技術(shù)構(gòu)建機構(gòu)知識庫科學(xué)數(shù)據(jù)監(jiān)護模型具有以下優(yōu)勢。一是區(qū)塊鏈去中心化的特點,能夠使構(gòu)建的機構(gòu)知識庫平臺更具安全性和可信任度,使收集的科研數(shù)據(jù)更加準(zhǔn)確規(guī)范。二是區(qū)塊鏈技術(shù)中的分布式賬本、塊鏈?zhǔn)綌?shù)據(jù)結(jié)構(gòu)、非對稱性加密算法和智能合約的技術(shù),能保證機構(gòu)數(shù)據(jù)庫中的科學(xué)數(shù)據(jù)不可篡改,為保障機構(gòu)數(shù)據(jù)庫中的數(shù)據(jù)存儲安全提供保障。三是區(qū)塊鏈技術(shù)的去中心化,使得網(wǎng)絡(luò)中的信息傳播速度和資源利用效率大大提高,可以為用戶一站式檢索和使用提供極大方便。四是運用區(qū)塊鏈中的全民記賬和非對稱加密算法,可以對上傳科學(xué)數(shù)據(jù)的用戶提供知識產(chǎn)權(quán)保護,只有得到用戶提供者解密許可才能下載使用信息,數(shù)據(jù)安全性和隱私問題能夠得到解決。因此,下文就結(jié)合區(qū)塊鏈的基本思想對機構(gòu)知識庫科學(xué)數(shù)據(jù)監(jiān)護模型的功能需求及工作原理進行闡述。
2 科學(xué)數(shù)據(jù)監(jiān)護模型的功能需求
以機構(gòu)知識庫為基礎(chǔ)的科學(xué)數(shù)據(jù)監(jiān)護服務(wù)需要按照特定的目標(biāo)、遵循特定的流程、設(shè)置相應(yīng)的功能,再根據(jù)功能需求設(shè)定功能模塊和層次架構(gòu),并進一步闡述模型的工作原理和過程。
一個完整的科學(xué)數(shù)據(jù)監(jiān)護平臺應(yīng)涉及數(shù)據(jù)生命周期的各個環(huán)節(jié),涵蓋從數(shù)據(jù)產(chǎn)生之初到數(shù)據(jù)存儲、數(shù)據(jù)利用的循環(huán)過程。英國數(shù)據(jù)監(jiān)護中心(DCC,Digital Curation Centre)提出的數(shù)據(jù)監(jiān)護模型從全局上將數(shù)據(jù)生命周期劃分為4個階段,分別為信息描述和表示、數(shù)據(jù)保存計劃、組織觀察和參與、數(shù)據(jù)監(jiān)護和保存;并提出了數(shù)據(jù)監(jiān)護服務(wù)的一般工作和具體工作,涉及數(shù)據(jù)生產(chǎn)、數(shù)據(jù)組織、數(shù)據(jù)共享、數(shù)據(jù)存儲等多個環(huán)節(jié),其服務(wù)范圍遍及從科研項目構(gòu)思到科研成果利用的整個循環(huán)過程[13]。
參照DCC的流程劃分和功能設(shè)定,本文將科學(xué)數(shù)據(jù)監(jiān)護劃分為數(shù)據(jù)采集與評價、數(shù)據(jù)組織與處理、數(shù)據(jù)存儲與發(fā)布、數(shù)據(jù)共享與利用四大基本功能,其中的每一項都可以進一步詳細劃分為幾個相互關(guān)聯(lián)的具體功能,融合雙鏈?zhǔn)絽^(qū)塊鏈技術(shù)的相關(guān)原理,將能夠?qū)崿F(xiàn)特定功能的基本模塊按照工作流程有機整合,即可獲得整體的科學(xué)數(shù)據(jù)監(jiān)護模型。本文所構(gòu)建的科學(xué)數(shù)據(jù)監(jiān)護模型擬具備的具體功能如表1所示。
3 融合區(qū)塊鏈技術(shù)的科學(xué)數(shù)據(jù)監(jiān)護模型的構(gòu)建及功能闡述
服務(wù)項目,它會在其原有的服務(wù)理念范疇內(nèi)不斷融合新的技術(shù),以實現(xiàn)對科學(xué)數(shù)據(jù)更好地保存、共享和增值。以上四大基本功能和15種具體功能,需要依靠融合了各種技術(shù)的不同功能模塊加以實現(xiàn),其中許多環(huán)節(jié)在現(xiàn)實中已經(jīng)有較為成功的實踐案例。因而本文在之后的模型構(gòu)建環(huán)節(jié),將著重從總體上闡釋雙鏈?zhǔn)絽^(qū)塊鏈技術(shù)在面向機構(gòu)知識庫或機構(gòu)知識庫聯(lián)盟的科學(xué)數(shù)據(jù)監(jiān)護服務(wù)中的作用方式,較大程度上保持科學(xué)數(shù)據(jù)監(jiān)護平臺在具體功能選擇上的靈活性和可擴展性。
推薦閱讀:大數(shù)據(jù)挖掘的論文投刊指導(dǎo)