數(shù)字經(jīng)濟(jì)時(shí)代,數(shù)據(jù)、信息、大數(shù)據(jù)等概念逐漸被大家熟悉,那么什么是大數(shù)據(jù),數(shù)據(jù)與信息又有什么區(qū)別,數(shù)字的功能又有哪些呢。
下面就我學(xué)習(xí)中國(guó)科學(xué)院研究生院孫毅博士的《數(shù)字經(jīng)濟(jì)學(xué)》(機(jī)械工業(yè)出版社)所了解的“數(shù)據(jù)”與“信息”及大數(shù)據(jù)的概念和數(shù)據(jù)的功能與大家分享,希望老師和同行們多多批評(píng)指正。
國(guó)際標(biāo)準(zhǔn)組織的定義:數(shù)據(jù)是指搜集到的、原始的、未經(jīng)處理的關(guān)于客體的事實(shí);信息是指對(duì)人們有意義的數(shù)據(jù),是數(shù)據(jù)經(jīng)過提煉、加工、整合后形成的關(guān)于事實(shí)、事件、事物、過程的思想和知識(shí),其在特定語(yǔ)境中有特定的含義。大數(shù)據(jù)是指一種規(guī)模大到在獲取、存儲(chǔ)、管理、分析方面大大超出了傳統(tǒng)數(shù)據(jù)庫(kù)軟件工具能力范圍的數(shù)據(jù)集合,具有數(shù)據(jù)規(guī)模海量(volume)、數(shù)據(jù)流轉(zhuǎn)高速(velocity)、數(shù)據(jù)類型多樣(variety)和價(jià)值(value)密度低四大特征,簡(jiǎn)稱“4V”特征。
“數(shù)據(jù)”不等同于“信息”,二者之間存在著一個(gè)梯次關(guān)系?!皵?shù)據(jù)”強(qiáng)調(diào)“信息”的一種更加原始的狀態(tài),保留了更多原始的“信息”,人們通過“數(shù)據(jù)”可以挖掘更多的“信息”?!皵?shù)據(jù)”比“信息”更為根本,而信息則是經(jīng)過加工后,有邏輯、有意義的數(shù)據(jù)?!皵?shù)據(jù)”是純粹的“事實(shí)”,具有無(wú)修飾的、獨(dú)立的性質(zhì),通過上下文和周圍環(huán)境的相互作用,這些“數(shù)據(jù)”(或“事實(shí)”)在一個(gè)具體的、特定的背景環(huán)境下,進(jìn)行釋義后成為人類所定義的“信息”。比如在網(wǎng)絡(luò)治理語(yǔ)境下,經(jīng)常使用的“違法有害信息”,以及在個(gè)人信息保護(hù)語(yǔ)境下的“個(gè)人信息”,都是指向內(nèi)容意義本身。2021年6月10日,第十三屆全國(guó)人民代表大會(huì)常務(wù)委員會(huì)第二十九次會(huì)議通過了《中華人民共和國(guó)數(shù)據(jù)安全法》,其中關(guān)于“數(shù)據(jù)”的定義是“本法所稱數(shù)據(jù),是指任何以電子或者其他方式對(duì)信息的記錄”,強(qiáng)調(diào)數(shù)據(jù)是信息的存在形式或記錄本身。
數(shù)據(jù)可以從不同的角度分成多種類型。例如,我們可以從數(shù)據(jù)主體(指數(shù)據(jù)或信息在網(wǎng)絡(luò)中以各種方式加以披露的自然人)的角度把數(shù)據(jù)分為個(gè)人數(shù)據(jù)(涉及財(cái)務(wù)、健康、文化、生物特征以及能辨識(shí)出特定自然人的多種類別的數(shù)據(jù))和非個(gè)人數(shù)據(jù)(商業(yè)、政府等相關(guān)數(shù)據(jù))。目前國(guó)家間協(xié)議、國(guó)內(nèi)法規(guī)等,在談及數(shù)據(jù)時(shí),主要內(nèi)容是指?jìng)€(gè)人數(shù)據(jù)。隨著數(shù)字經(jīng)濟(jì)的快速發(fā)展,數(shù)據(jù)的內(nèi)容不斷豐富,逐步擴(kuò)展到商業(yè)數(shù)據(jù)、政府?dāng)?shù)據(jù)等方面。
盡管“數(shù)據(jù)”和“信息”兩個(gè)概念的語(yǔ)義是有所區(qū)別的,但值得注意的是,在特定的討論語(yǔ)境下,“數(shù)據(jù)”和“信息”兩個(gè)概念可以互換,如個(gè)人信息和個(gè)人數(shù)據(jù)、政府信息和政府?dāng)?shù)據(jù)等表述互換一般不會(huì)使人產(chǎn)生誤解。近年來(lái)我國(guó)有關(guān)部門在發(fā)布有關(guān)個(gè)人數(shù)據(jù)的相關(guān)規(guī)定和標(biāo)準(zhǔn)規(guī)范時(shí),一直使用“個(gè)人信息”而非“個(gè)人數(shù)據(jù)”的稱謂,例如價(jià)值密度是單位數(shù)據(jù)所產(chǎn)生的有價(jià)值的信息量。價(jià)值密度低是指大數(shù)據(jù)雖然規(guī)模龐大(價(jià)值巨大),但是有價(jià)值的信息所占比例較小?! ?/div>
最新的《信息安全技術(shù)一個(gè)人信息安全規(guī)范》(GB/T35273—2020)。從國(guó)內(nèi)外對(duì)于這些件的界定來(lái)看,我國(guó)實(shí)際上并沒有區(qū)分“個(gè)人數(shù)據(jù)”和“個(gè)人信息”。
數(shù)據(jù)的功能:在數(shù)字經(jīng)濟(jì)的發(fā)展歷程中,數(shù)據(jù)起到了核心和關(guān)鍵作用,人們對(duì)數(shù)據(jù)功能的認(rèn)識(shí)也由淺入深、由簡(jiǎn)單趨向復(fù)雜??傮w來(lái)看,人們對(duì)數(shù)據(jù)功能的認(rèn)識(shí)主要分為三個(gè)階段:
第一階段是數(shù)據(jù)資源階段,數(shù)據(jù)是記錄、反映現(xiàn)實(shí)世界的一種資源;第二階段是數(shù)據(jù)資產(chǎn)階段,數(shù)據(jù)不僅是一種資源,還是一種資產(chǎn),是個(gè)人或企業(yè)資產(chǎn)的重要組成部分,是創(chuàng)造財(cái)富的基礎(chǔ);第三階段是數(shù)據(jù)資本階段,數(shù)據(jù)的資源和資產(chǎn)的特性得到進(jìn)一步發(fā)揮,與價(jià)值進(jìn)行結(jié)合,通過交易等各種流動(dòng)方式,最終變?yōu)橘Y本。
數(shù)據(jù)作為生產(chǎn)要素。在信息社會(huì)中,數(shù)據(jù)已經(jīng)成為信息技術(shù)和網(wǎng)絡(luò)空間賴以生存和發(fā)展、不可或缺的物質(zhì)基礎(chǔ)。在數(shù)字化環(huán)境中,所有要素只能以數(shù)據(jù)的形式外化。它和資本、勞動(dòng)力、土地和能源等生產(chǎn)要素一樣具有很高的價(jià)值,是一種新型的戰(zhàn)略性社會(huì)資源,這意味著任何主體對(duì)數(shù)據(jù)的非法干預(yù)都可能構(gòu)成對(duì)國(guó)家核心利益的損害。但是,數(shù)據(jù)與這些傳統(tǒng)生產(chǎn)要素不同,它具有可再生、無(wú)污染、無(wú)限性的特征??稍偕侵笖?shù)據(jù)資源不是從大自然獲得的,而是人類自己生產(chǎn)出來(lái)的,通過加工處理后的數(shù)據(jù)還可以成為新的數(shù)據(jù)資源;無(wú)污染是指數(shù)據(jù)在獲得與使用的過程中不會(huì)污染環(huán)境;無(wú)限性是指數(shù)據(jù)在使用過程中不會(huì)變少,而是越用越多,這與傳統(tǒng)資源越用越少的特征不同。
數(shù)據(jù)作為資產(chǎn)。隨著數(shù)字經(jīng)濟(jì)的發(fā)展,人們發(fā)現(xiàn)數(shù)據(jù)不僅僅是資源,還具備資產(chǎn)的特質(zhì)。所謂資產(chǎn),是指由企業(yè)過去經(jīng)營(yíng)交易或各項(xiàng)事項(xiàng)形成的、被企業(yè)擁有或控制的、預(yù)期會(huì)給企業(yè)帶來(lái)經(jīng)濟(jì)利益的資源。從資產(chǎn)的界定來(lái)看,它具有現(xiàn)實(shí)性、可控性和經(jīng)濟(jì)性三個(gè)基本特征?,F(xiàn)實(shí)性是指資產(chǎn)必須是現(xiàn)實(shí)已經(jīng)存在的,還未發(fā)生的事物不能稱為資產(chǎn);可控性是指企業(yè)要對(duì)資產(chǎn)有所有權(quán)或控制權(quán);經(jīng)濟(jì)性是指資產(chǎn)預(yù)期能給企業(yè)帶來(lái)經(jīng)濟(jì)效益。結(jié)合資產(chǎn)的特征,數(shù)據(jù)資產(chǎn)便是指企業(yè)在生產(chǎn)經(jīng)營(yíng)管理活動(dòng)中形成的,可擁有或可控制其產(chǎn)生及應(yīng)用全過程的、可量化的、預(yù)期能給企業(yè)帶來(lái)經(jīng)濟(jì)效益的數(shù)據(jù)。實(shí)現(xiàn)數(shù)據(jù)可控制、可量化與可變現(xiàn)屬性,體現(xiàn)數(shù)據(jù)價(jià)值的過程,就是數(shù)據(jù)資產(chǎn)化過程。但要注意數(shù)據(jù)并不等于數(shù)據(jù)資產(chǎn),也就是說(shuō),并非所有的數(shù)據(jù)均有經(jīng)濟(jì)效益,除非同時(shí)滿足可被計(jì)量、可被控制、可被變現(xiàn)的屬性。當(dāng)前,數(shù)據(jù)已經(jīng)滲入各行各業(yè),逐步成為企業(yè)不可或缺的戰(zhàn)略資產(chǎn),企業(yè)所掌握的數(shù)據(jù)規(guī)模、數(shù)據(jù)的鮮活程度,以及采集、分析、處理、挖掘數(shù)據(jù)的能力決定了企業(yè)的核心競(jìng)爭(zhēng)力。
數(shù)據(jù)作為資本。資本是用于投資得到利潤(rùn)的本金或資產(chǎn)。在數(shù)據(jù)資產(chǎn)不斷為企業(yè)獲取大量經(jīng)濟(jì)效益的同時(shí),數(shù)據(jù)已經(jīng)成為一種資本,和金融資本一樣,能夠產(chǎn)生新的產(chǎn)品和服務(wù)。但是,與實(shí)物資本不同,數(shù)據(jù)資本也有自身的特性,例如,數(shù)據(jù)資本具有不可替代性,即實(shí)物資本是可以替換的,人們可以用一袋米替換另一袋米,而數(shù)據(jù)資本則不行,因?yàn)椴煌瑪?shù)據(jù)包含著不同的信息,其包含的價(jià)值也是不同的。數(shù)據(jù)資本化的過程,就是將數(shù)據(jù)資產(chǎn)的價(jià)值和使用價(jià)值折算成股份或出資比例,通過數(shù)據(jù)交易和數(shù)據(jù)流動(dòng)變?yōu)橘Y本的過程。也就是說(shuō),數(shù)據(jù)作為資本的價(jià)值要在數(shù)據(jù)交易和流通中才能得到充分體現(xiàn)。
在數(shù)據(jù)變成資產(chǎn)前數(shù)據(jù)必須進(jìn)行確權(quán),只有確定了那些數(shù)據(jù)誰(shuí)擁有產(chǎn)權(quán),誰(shuí)擁有加工使用權(quán),誰(shuí)擁有經(jīng)營(yíng)銷售權(quán),這樣是數(shù)據(jù)交易的基礎(chǔ)和前提。
舉報(bào)