欧美老妇性午夜小视频_国产97最新在线视频_亚洲精品免费Ww久久_日韩三级在线成人网站

中國西藏網(wǎng) > 即時(shí)新聞 > 文化

你的隱私,大數(shù)據(jù)怎知道?我們又該如何自我保護(hù)?

發(fā)布時(shí)間:2023-01-12 11:15:00來源: 光明日報(bào)

  在網(wǎng)絡(luò)上,每個(gè)人都會(huì)或多或少,或主動(dòng)或被動(dòng)地泄露某些碎片信息。這些信息被大數(shù)據(jù)挖掘,就存在隱私泄露的風(fēng)險(xiǎn),引發(fā)信息安全問題。面對洶涌而來的5G時(shí)代,大眾對自己的隱私保護(hù)感到越來越迷茫,甚至有點(diǎn)不知所措。那么,你的隱私,大數(shù)據(jù)是怎么知道的呢?大家又該如何自我保護(hù)呢?

  1.“已知、未知”大數(shù)據(jù)都知道

  大數(shù)據(jù)時(shí)代,每個(gè)人都有可能成為安徒生童話中那個(gè)“穿新衣”的皇帝。在大數(shù)據(jù)面前,你說過什么話,它知道;你做過什么事,它知道;你有什么愛好,它知道;你生過什么病,它知道;你家住哪里,它知道;你的親朋好友都有誰,它也知道……總之,你自己知道的,它幾乎都知道,或者說它都能夠知道,至少可以說,它遲早會(huì)知道!

  甚至,連你自己都不知道的事情,大數(shù)據(jù)也可能知道。例如,它能夠發(fā)現(xiàn)你的許多潛意識(shí)習(xí)慣:集體照相時(shí)你喜歡站哪里呀,跨門檻時(shí)喜歡先邁左腳還是右腳呀,你喜歡與什么樣的人打交道呀,你的性格特點(diǎn)都有什么呀,哪位朋友與你的觀點(diǎn)不相同呀……

  再進(jìn)一步說,今后將要發(fā)生的事情,大數(shù)據(jù)還是有可能知道。例如,根據(jù)你“飲食多、運(yùn)動(dòng)少”等信息,它就能夠推測出,你可能會(huì)“三高”。當(dāng)你與許多人都在獨(dú)立地購買感冒藥時(shí),大數(shù)據(jù)就知道:流感即將暴發(fā)了!其實(shí),大數(shù)據(jù)已經(jīng)成功地預(yù)測了包括世界杯比賽結(jié)果、股票的波動(dòng)、物價(jià)趨勢、用戶行為、交通情況等。

  當(dāng)然,這里的“你”并非僅僅指“你個(gè)人”,包括但不限于,你的家庭,你的單位,你的民族,甚至你的國家等。至于這些你知道的、不知道的或今后才知道的隱私信息,將會(huì)把你塑造成什么,是英雄還是狗熊?這卻難以預(yù)知。

  2.數(shù)據(jù)挖掘就像“垃圾處理”

  什么是大數(shù)據(jù)?形象地說,所謂大數(shù)據(jù),就是由許多千奇百怪的數(shù)據(jù),雜亂無章地堆積在一起。例如,你在網(wǎng)上說的話、發(fā)的微信、收發(fā)的電子郵件等,都是大數(shù)據(jù)的組成部分。在不知道的情況下被采集的眾多信息,例如被馬路攝像頭獲取的視頻、手機(jī)定位系統(tǒng)留下的路線圖、駕車的導(dǎo)航信號(hào)等被動(dòng)信息,也都是大數(shù)據(jù)的組成部分。還有,各種傳感器設(shè)備自動(dòng)采集的有關(guān)溫度、濕度、速度等萬物信息,仍然是大數(shù)據(jù)的組成部分??傊?,每個(gè)人、每種通信和控制類設(shè)備,無論它是軟件還是硬件,其實(shí)都是大數(shù)據(jù)之源。

  大數(shù)據(jù)利用了一種名叫“大數(shù)據(jù)挖掘”的技術(shù),采用諸如神經(jīng)網(wǎng)絡(luò)、遺傳算法、決策樹、粗糙集、覆蓋正例排斥反例、統(tǒng)計(jì)分析、模糊集等方法挖掘信息。大數(shù)據(jù)挖掘的過程,可以分為數(shù)據(jù)收集、數(shù)據(jù)集成、數(shù)據(jù)規(guī)約、數(shù)據(jù)清理、數(shù)據(jù)變換、挖掘分析、模式評(píng)估、知識(shí)表示等八大步驟。

  不過,這些聽起來高大上的大數(shù)據(jù)產(chǎn)業(yè),幾乎等同于垃圾處理和廢品回收。

  這并不是在開玩笑。廢品收購和垃圾收集,可算作“數(shù)據(jù)收集”;將廢品和垃圾送往集中處理場所,可算作“數(shù)據(jù)集成”;將廢品和垃圾初步分類,可算作“數(shù)據(jù)規(guī)約”;將廢品和垃圾適當(dāng)清潔和整理,可算作“數(shù)據(jù)清理”;將破沙發(fā)拆成木、鐵、布等原料,可算作“數(shù)據(jù)變換”;認(rèn)真分析如何將這些原料賣個(gè)好價(jià)錢,可算作“數(shù)據(jù)分析”;不斷總結(jié)經(jīng)驗(yàn),選擇并固定上下游賣家和買家,可算作“模式評(píng)估”;最后,把這些技巧整理成口訣,可算作“知識(shí)表示”。

  再看原料結(jié)構(gòu)。大數(shù)據(jù)具有異構(gòu)特性,就像垃圾一樣千奇百怪。如果非要在垃圾和大數(shù)據(jù)之間找出本質(zhì)差別的話,那就在于垃圾是有實(shí)體的,再利用的次數(shù)有限;而大數(shù)據(jù)是虛擬的,可以反復(fù)處理,反復(fù)利用。例如,大數(shù)據(jù)專家能將數(shù)據(jù)(廢品)中挖掘出的旅客出行規(guī)律交給航空公司,將某群體的消費(fèi)習(xí)慣賣給百貨商店等??傊髷?shù)據(jù)專家完全可以“一菜多吃”,反復(fù)利用,而且時(shí)間越久,價(jià)值越大。換句話說,大數(shù)據(jù)是很值錢的“垃圾”。

  3.大數(shù)據(jù)挖掘永遠(yuǎn)沒有盡頭

  大數(shù)據(jù)挖掘,雖然能從正面創(chuàng)造價(jià)值,但是也有其負(fù)面影響,即存在泄露隱私的風(fēng)險(xiǎn)。隱私是如何被泄露的呢?這其實(shí)很簡單,我們先來分解一下“人肉搜索”是如何侵犯隱私的吧!

  一大群網(wǎng)友,出于某種目的,利用自己的一切資源渠道,盡可能多地收集當(dāng)事人或物的所有信息;然后,將這些信息按照自己的目的提煉成新信息,反饋到網(wǎng)上與別人分享。這就完成了第一次“人肉迭代”。

  接著,大家又在第一次人肉迭代的基礎(chǔ)上,互相取經(jīng),再接再厲,交叉重復(fù)進(jìn)行信息的收集、加工、整理等工作,于是,便誕生了第二次“人肉迭代”。如此循環(huán)往復(fù),經(jīng)過多次不懈迭代后,當(dāng)事人或物的畫像就躍然紙上了。如果構(gòu)成“滿意畫像”的素材確實(shí)已經(jīng)證實(shí),至少主體是事實(shí),“人肉搜索”就成功了。

  幾乎可以斷定,只要參與“人肉搜索”的網(wǎng)友足夠多,時(shí)間足夠長,大家的毅力足夠強(qiáng),那么任何人都可能無處遁形。

  其實(shí),所謂的大數(shù)據(jù)挖掘,在某種意義上說,就是由機(jī)器自動(dòng)完成的特殊“人肉搜索”而已。只不過,這種搜索的目的,不再限于抹黑或頌揚(yáng)某人,而是有更加廣泛的目的,例如,為商品銷售者尋找最佳買家、為某類數(shù)據(jù)尋找規(guī)律、為某些事物之間尋找關(guān)聯(lián)等。總之,只要目的明確,那么,大數(shù)據(jù)挖掘就會(huì)有用武之地。

  如果將“人肉搜索”與大數(shù)據(jù)挖掘相比,網(wǎng)友被電腦所替代;網(wǎng)友們收集的信息,被數(shù)據(jù)庫中的海量異構(gòu)數(shù)據(jù)所替代;網(wǎng)友尋找各種人物關(guān)聯(lián)的技巧,被相應(yīng)的智能算法替代;網(wǎng)友們相互借鑒、彼此啟發(fā)的做法,被各種同步運(yùn)算所替代。

  各次迭代過程仍然照例進(jìn)行,只不過機(jī)器的迭代次數(shù)更多,速度更快,每次迭代其實(shí)就是機(jī)器的一次“學(xué)習(xí)”過程。網(wǎng)友們的最終“滿意畫像”,被暫時(shí)的挖掘結(jié)果所替代。之所以說是暫時(shí),那是因?yàn)閷Υ髷?shù)據(jù)挖掘來說,永遠(yuǎn)沒有盡頭,結(jié)果會(huì)越來越精準(zhǔn),智慧程度會(huì)越來越高,用戶只需根據(jù)自己的標(biāo)準(zhǔn),隨時(shí)選擇滿意的結(jié)果就行了。

  當(dāng)然,除了相似性外,“人肉搜索”與“大數(shù)據(jù)挖掘”肯定也有許多重大的區(qū)別。例如,機(jī)器不會(huì)累,它們收集的數(shù)據(jù)會(huì)更多、更快,數(shù)據(jù)的渠道來源會(huì)更廣泛??傊?,網(wǎng)友的“人肉搜索”,最終將輸給機(jī)器的“大數(shù)據(jù)挖掘”。

  4.隱私保護(hù)與數(shù)據(jù)挖掘“?!薄皺C(jī)”并存

  必須承認(rèn),就當(dāng)前的現(xiàn)實(shí)情況來說,大數(shù)據(jù)隱私挖掘的“殺傷力”,已經(jīng)遠(yuǎn)遠(yuǎn)超過了大數(shù)據(jù)隱私保護(hù)的能力;換句話說,在大數(shù)據(jù)挖掘面前,當(dāng)前人類有點(diǎn)不知所措。這確實(shí)是一種意外。自互聯(lián)網(wǎng)誕生以后,在過去幾十年,人們都不遺余力地將碎片信息永遠(yuǎn)留在網(wǎng)上。其中的每個(gè)碎片雖然都完全無害,可誰也不曾意識(shí)到,至少?zèng)]有刻意去關(guān)注,當(dāng)眾多無害碎片融合起來,竟然后患無窮!

  不過,大家也沒必要過于擔(dān)心。在人類歷史上,類似的被動(dòng)局面已經(jīng)出現(xiàn)過不止一次了。從以往的經(jīng)驗(yàn)來看,隱私保護(hù)與數(shù)據(jù)挖掘之間總是像“走馬燈”一樣輪換的——人類通過對隱私的“挖掘”,獲得空前好處,產(chǎn)生了更多需要保護(hù)的“隱私”,于是,不得不再回過頭來,認(rèn)真研究如何保護(hù)這些隱私。當(dāng)隱私積累得越來越多時(shí),“挖掘”它們就會(huì)變得越來越有利可圖,于是,新一輪的“挖掘”又開始了。歷史地來看,人類在自身隱私保護(hù)方面,整體處于優(yōu)勢地位,在網(wǎng)絡(luò)大數(shù)據(jù)挖掘之前,“隱私泄露”并不是一個(gè)突出的問題。

  但是,現(xiàn)在人類需要面對一個(gè)棘手的問題——對過去遺留在網(wǎng)上的海量碎片信息,如何進(jìn)行隱私保護(hù)呢?單靠技術(shù),顯然不行,甚至還會(huì)越“保護(hù)”,就越“泄露隱私”。

  因此,必須多管齊下。例如從法律上,禁止以“人肉搜索”為目的的大數(shù)據(jù)挖掘行為;從管理角度,發(fā)現(xiàn)惡意的大數(shù)據(jù)搜索行為,對其進(jìn)行必要的監(jiān)督和管控。另外,在必要的時(shí)候,還需要重塑“隱私”概念,畢竟“隱私”本身就是一個(gè)與時(shí)間、地點(diǎn)、民族、文化等有關(guān)的約定俗成的概念。

  對于個(gè)人的網(wǎng)絡(luò)行為而言,在大數(shù)據(jù)時(shí)代,應(yīng)該如何保護(hù)隱私呢?或者說,至少不要把過多包含個(gè)人隱私的碎片信息遺留在網(wǎng)上呢?答案只有兩個(gè)字:匿名!只要做好匿名工作,就能在一定程度上,保護(hù)好隱私了。也就是說,在大數(shù)據(jù)技術(shù)出現(xiàn)之前,隱私就是把“私”藏起來,個(gè)人身份可公開,而大數(shù)據(jù)時(shí)代,隱私保護(hù)則是把“私”公開(實(shí)際上是沒法不公開),而把個(gè)人身份隱藏起來,即匿名。

  (作者:楊義先、鈕心忻,均為北京郵電大學(xué)教授)

(責(zé)編:常邦麗)

版權(quán)聲明:凡注明“來源:中國西藏網(wǎng)”或“中國西藏網(wǎng)文”的所有作品,版權(quán)歸高原(北京)文化傳播有限公司。任何媒體轉(zhuǎn)載、摘編、引用,須注明來源中國西藏網(wǎng)和署著作者名,否則將追究相關(guān)法律責(zé)任。