你的隐私,大数据怎知道?我们又该如何自我保护?******
在网络上,每个人都会或多或少,或主动或被动地泄露某些碎片信息。这些信息被大数据挖掘,就存在隐私泄露的风险,引发信息安全问题。面对汹涌而来的5G时代,大众对自己的隐私保护感到越来越迷茫,甚至有点不知所措。那么,你的隐私,大数据是怎么知道的呢?大家又该如何自我保护呢?
1.“已知、未知”大数据都知道
大数据时代,每个人都有可能成为安徒生童话中那个“穿新衣”的皇帝。在大数据面前,你说过什么话,它知道;你做过什么事,它知道;你有什么爱好,它知道;你生过什么病,它知道;你家住哪里,它知道;你的亲朋好友都有谁,它也知道……总之,你自己知道的,它几乎都知道,或者说它都能够知道,至少可以说,它迟早会知道!
甚至,连你自己都不知道的事情,大数据也可能知道。例如,它能够发现你的许多潜意识习惯:集体照相时你喜欢站哪里呀,跨门槛时喜欢先迈左脚还是右脚呀,你喜欢与什么样的人打交道呀,你的性格特点都有什么呀,哪位朋友与你的观点不相同呀……
再进一步说,今后将要发生的事情,大数据还是有可能知道。例如,根据你“饮食多、运动少”等信息,它就能够推测出,你可能会“三高”。当你与许多人都在独立地购买感冒药时,大数据就知道:流感即将暴发了!其实,大数据已经成功地预测了包括世界杯比赛结果、股票的波动、物价趋势、用户行为、交通情况等。
当然,这里的“你”并非仅仅指“你个人”,包括但不限于,你的家庭,你的单位,你的民族,甚至你的国家等。至于这些你知道的、不知道的或今后才知道的隐私信息,将会把你塑造成什么,是英雄还是狗熊?这却难以预知。
2.数据挖掘就像“垃圾处理”
什么是大数据?形象地说,所谓大数据,就是由许多千奇百怪的数据,杂乱无章地堆积在一起。例如,你在网上说的话、发的微信、收发的电子邮件等,都是大数据的组成部分。在不知道的情况下被采集的众多信息,例如被马路摄像头获取的视频、手机定位系统留下的路线图、驾车的导航信号等被动信息,也都是大数据的组成部分。还有,各种传感器设备自动采集的有关温度、湿度、速度等万物信息,仍然是大数据的组成部分。总之,每个人、每种通信和控制类设备,无论它是软件还是硬件,其实都是大数据之源。
大数据利用了一种名叫“大数据挖掘”的技术,采用诸如神经网络、遗传算法、决策树、粗糙集、覆盖正例排斥反例、统计分析、模糊集等方法挖掘信息。大数据挖掘的过程,可以分为数据收集、数据集成、数据规约、数据清理、数据变换、挖掘分析、模式评估、知识表示等八大步骤。
不过,这些听起来高大上的大数据产业,几乎等同于垃圾处理和废品回收。
这并不是在开玩笑。废品收购和垃圾收集,可算作“数据收集”;将废品和垃圾送往集中处理场所,可算作“数据集成”;将废品和垃圾初步分类,可算作“数据规约”;将废品和垃圾适当清洁和整理,可算作“数据清理”;将破沙发拆成木、铁、布等原料,可算作“数据变换”;认真分析如何将这些原料卖个好价钱,可算作“数据分析”;不断总结经验,选择并固定上下游卖家和买家,可算作“模式评估”;最后,把这些技巧整理成口诀,可算作“知识表示”。
再看原料结构。大数据具有异构特性,就像垃圾一样千奇百怪。如果非要在垃圾和大数据之间找出本质差别的话,那就在于垃圾是有实体的,再利用的次数有限;而大数据是虚拟的,可以反复处理,反复利用。例如,大数据专家能将数据(废品)中挖掘出的旅客出行规律交给航空公司,将某群体的消费习惯卖给百货商店等。总之,大数据专家完全可以“一菜多吃”,反复利用,而且时间越久,价值越大。换句话说,大数据是很值钱的“垃圾”。
3.大数据挖掘永远没有尽头
大数据挖掘,虽然能从正面创造价值,但是也有其负面影响,即存在泄露隐私的风险。隐私是如何被泄露的呢?这其实很简单,我们先来分解一下“人肉搜索”是如何侵犯隐私的吧!
一大群网友,出于某种目的,利用自己的一切资源渠道,尽可能多地收集当事人或物的所有信息;然后,将这些信息按照自己的目的提炼成新信息,反馈到网上与别人分享。这就完成了第一次“人肉迭代”。
接着,大家又在第一次人肉迭代的基础上,互相取经,再接再厉,交叉重复进行信息的收集、加工、整理等工作,于是,便诞生了第二次“人肉迭代”。如此循环往复,经过多次不懈迭代后,当事人或物的画像就跃然纸上了。如果构成“满意画像”的素材确实已经证实,至少主体是事实,“人肉搜索”就成功了。
几乎可以断定,只要参与“人肉搜索”的网友足够多,时间足够长,大家的毅力足够强,那么任何人都可能无处遁形。
其实,所谓的大数据挖掘,在某种意义上说,就是由机器自动完成的特殊“人肉搜索”而已。只不过,这种搜索的目的,不再限于抹黑或颂扬某人,而是有更加广泛的目的,例如,为商品销售者寻找最佳买家、为某类数据寻找规律、为某些事物之间寻找关联等。总之,只要目的明确,那么,大数据挖掘就会有用武之地。
如果将“人肉搜索”与大数据挖掘相比,网友被电脑所替代;网友们收集的信息,被数据库中的海量异构数据所替代;网友寻找各种人物关联的技巧,被相应的智能算法替代;网友们相互借鉴、彼此启发的做法,被各种同步运算所替代。
各次迭代过程仍然照例进行,只不过机器的迭代次数更多,速度更快,每次迭代其实就是机器的一次“学习”过程。网友们的最终“满意画像”,被暂时的挖掘结果所替代。之所以说是暂时,那是因为对大数据挖掘来说,永远没有尽头,结果会越来越精准,智慧程度会越来越高,用户只需根据自己的标准,随时选择满意的结果就行了。
当然,除了相似性外,“人肉搜索”与“大数据挖掘”肯定也有许多重大的区别。例如,机器不会累,它们收集的数据会更多、更快,数据的渠道来源会更广泛。总之,网友的“人肉搜索”,最终将输给机器的“大数据挖掘”。
4.隐私保护与数据挖掘“危”“机”并存
必须承认,就当前的现实情况来说,大数据隐私挖掘的“杀伤力”,已经远远超过了大数据隐私保护的能力;换句话说,在大数据挖掘面前,当前人类有点不知所措。这确实是一种意外。自互联网诞生以后,在过去几十年,人们都不遗余力地将碎片信息永远留在网上。其中的每个碎片虽然都完全无害,可谁也不曾意识到,至少没有刻意去关注,当众多无害碎片融合起来,竟然后患无穷!
不过,大家也没必要过于担心。在人类历史上,类似的被动局面已经出现过不止一次了。从以往的经验来看,隐私保护与数据挖掘之间总是像“走马灯”一样轮换的——人类通过对隐私的“挖掘”,获得空前好处,产生了更多需要保护的“隐私”,于是,不得不再回过头来,认真研究如何保护这些隐私。当隐私积累得越来越多时,“挖掘”它们就会变得越来越有利可图,于是,新一轮的“挖掘”又开始了。历史地来看,人类在自身隐私保护方面,整体处于优势地位,在网络大数据挖掘之前,“隐私泄露”并不是一个突出的问题。
但是,现在人类需要面对一个棘手的问题——对过去遗留在网上的海量碎片信息,如何进行隐私保护呢?单靠技术,显然不行,甚至还会越“保护”,就越“泄露隐私”。
因此,必须多管齐下。例如从法律上,禁止以“人肉搜索”为目的的大数据挖掘行为;从管理角度,发现恶意的大数据搜索行为,对其进行必要的监督和管控。另外,在必要的时候,还需要重塑“隐私”概念,毕竟“隐私”本身就是一个与时间、地点、民族、文化等有关的约定俗成的概念。
对于个人的网络行为而言,在大数据时代,应该如何保护隐私呢?或者说,至少不要把过多包含个人隐私的碎片信息遗留在网上呢?答案只有两个字:匿名!只要做好匿名工作,就能在一定程度上,保护好隐私了。也就是说,在大数据技术出现之前,隐私就是把“私”藏起来,个人身份可公开,而大数据时代,隐私保护则是把“私”公开(实际上是没法不公开),而把个人身份隐藏起来,即匿名。
(作者:杨义先、钮心忻,均为北京邮电大学教授)
学习实习两不误 “线上留学”他们有了更多选择******
疫情时期跨国留学 有人边学习边实习 有人重归国内校园
“线上留学” 他们有了更多选择
随着各国疫情防控政策的调整,受疫情影响的留学生群体,终于回归了正常生活。
他们有人正忙着办理新的签证,为的是去陌生校园参加毕业典礼;也有人已迅速回归“正轨”,完美融入线下学习;还有人正为过去的线上学习清理积弊,为未来的学业方向做好规划……
回望过去三年,特殊的跨国求学过程中,这批留学生也有自己的独特收获。
三年“线上留学” 学习实习两不误
近来,Mia正忙着筹备申请新的澳洲签证,以赶赴悉尼大学参加毕业典礼。不久后,她将第一次踏入悉尼大学校园,在那里穿上硕士服,戴上硕士帽,告别自己的研究生生涯。
Mia本科就读于南澳大学电影学专业。2020年年初受疫情影响,澳大利亚政府规定,禁止持有学生签证的境外人员入境。彼时,正读大二的Mia在圣诞假期返回中国,开启了“线上留学”生活。
Mia的每一门课均需要同时参与两种形式的课程:一种是讲座类大课,另一种是20人左右的讨论课。“网课期间,讨论在线上平台进行,讲座类课程的教授则会将课程录制好上传系统,供学生自主观看。直至现在,即使大部分学校已经恢复了线下面授,一些教授仍会沿用当年的录播课程,供新一届选课的学生观看学习。”Mia说。
本科毕业后,Mia拿到了悉尼大学一年制的研究生offer。与从前本土学生居多的南澳大学相比,悉尼大学多数研究生来自世界各地。为解决大量学生的网课问题,学校设置了24小时国际热线,对远程服务也进行了显著优化。
虽然有部分拍摄课因条件受限无法照常进行,Mia只得换成理论类课程,但其他实操课程,Mia可以在共享屏幕观看导师的演示。有操作困惑时,还可以请求导师远程操控自己的电脑,示范剪辑、特效等。所以Mia觉得“线上留学”进行得颇为顺利。
于是,当疫情形势有所变化时,Mia做了一个不同于其他同学的选择:她没有返回澳洲,而是选择留在国内继续上网课,“一是考虑到租房等事宜会耗费额外的时间以及金钱成本,二是对于传媒专业的学生来说,实习经历更重要。”
而过去三年持续的“线上留学”,算是给Mia带来了绝佳的实习体验。
整个疫情期间,Mia一边完成澳洲的网课学业,一边在互联网大厂进行较长时间的实习。Mia负责的大多是海外运营工作,通过分析公司在国内业务上的成功经验,制定适配海外用户的方案,用英语输出给海外负责市场的同事。除了娴熟的英语,在海外两年半的跨文化经历也使Mia在处理实习工作时较易上手。
“我所在的岗位办公时间比较灵活,一般每周到岗3天至4天,有课时我会停下工作在工位上上课,下课后再继续完成实习老师布置的工作。” Mia说,如果课程时间较长,她就顺延自己的下班时间,或用午休时间赶工作进度。
学业和实习平衡,需要强大的时间管理能力。Mia每学期至少修读四门课,每门课都需要撰写大量论文。“论文的查重和评审十分严格,一旦写不好可能导致整门课挂掉,还要支付将近3万人民币的重修费,所以要特别认真完成。”Mia说。
悉尼时间比北京早两个小时,为避免因时差导致自己错过提交论文的deadline,Mia的手机锁屏上醒目显示着两个时间。由于工作中需要频繁联络身处印尼地区的同事,Mia的手机上也会另外标注雅加达(印尼当地)时间。在三个时区间切换,拥有“双重身份”的Mia忙得不亦乐乎。
三年的“线上留学”,Mia折叠了自己的时空,超额收获了专业知识和实习经验。在尝试了海外运营、本土电商运营等实习工作后,Mia确定了今后的就业方向:在海外运营领域深耕。“这三年一边学习一边实习,我看到自己的核心优势:一是作为留学生,有丰富的跨文化经验;二是在实践中,深刻感受到海外市场拓展的可行性;三是结识了很多行业人脉,较易获得内推机会,有利于春招时顺利入职。”
为防“自闭” 到手机维修店兼职
英国全面放开后,再希恢复了正常的留学生活。由于之前线下课上的积极发言,这个申请季,再希拿到了教授的推荐信,她正在准备申请读研的学校,也开始期待下一段精彩的留学之旅。
从再希的住处步行到学校,大约需要15分钟。格拉斯哥地势起伏大,往常去学校上课,再希都要攀爬一座陡峭的山坡,赶到教室时总会气喘吁吁,这也加重了她“早八”上课的疲惫。网课期间,再希省去了大体力消耗,甚至都不必起床梳洗,躲在被窝里、捧着电脑就可以开始上网课了。
再希回忆,在网课阶段,教授会将lecture大课录播上传校内系统,供学生自行观看。再希一般会选择在下午时段开设的互动课,而在晚上时段听录播课。那段时间,她的生物钟完全处于昼夜颠倒状态。“下午醒来后参与一节持续一两个小时的讨论课,下课玩玩手机,晚上10点钟左右再开始观看教授上传的lecture,然后写写论文,学习到早晨六七点,再去睡觉。”再希说。
幸运的是,教授上传的录播课都有添加字幕,“我会在自己的电脑上安装插件,将字幕翻译成中文,帮助自己理解教授讲述的内容。”此外,再希也可以随时暂停老师的课程,多次观看回放。再希调侃,线上听录播课,能听懂的内容是线下课的两倍,所以她希望录播课永远存在。
那段时间,唯一能让再希在早晨醒来的事情,就是补充生活物资。封控期间,再希无法前往超市买菜、购物,一切需要在手机上先预约,提前几天甚至几周,预定某一时间段由超市工作人员配送上门。而那也成了封控期再希与外界打交道的唯一机会。
网课期间,由于无法出门聚餐,再希的娱乐时间也基本靠手机打发。“这是我第一次觉得,手机也有玩腻的一天。”来回滑动小小的屏幕,没有任何一个软件能刷出感兴趣的内容,这种生活让再希觉得有些“自闭”。
为了充实自己,再希决定前往伦敦实习。在通过投简历、面试等关卡后,再希坐上了火车,辗转6个小时来到了伦敦的住处,可公司却通知她,目前尚未恢复线下工作,线上完成实习即可。
为了缓解烦闷,机缘巧合下,再希在伦敦大学学院附近找到了一份手机维修店的兼职。因为时常有中国留学生光顾,开店的印度老板希望可以找中国留学生来“撑住店面”。再希主要负责前台中文客服兼新媒体运营,时常要在店里与顾客面对面沟通,帮顾客和老板扫清语言上的障碍。
在这里,再希重新感受到了线下生活的“立体感”,也度过了来英国以来最温暖的一段时光。印度老板会在再希生日时给她准备惊喜,还会把自家做的传统印度美食带到店里邀请她一同享用。下班聚餐后的深夜,老板会在伦敦空无一人的街道上骑半个小时的摩托,把再希送回住处。
英国全面放开后,再希也恢复了正常的生活。心血来潮时,她会和男友一起自驾去格拉斯哥郊外看流星、去伦敦参加脱口秀比赛、去爱丁堡做朋友纪录片的主角……由于线下课堂上的积极发言,这个申请季,再希拿到了教授的推荐信,她正在准备申请读研的学校,也开始期待下一段精彩的留学之旅。
为和同学线下交流 决定交换回国内大学
李屹染目前正在美国一所公立大学读大三。而过去,她曾因为疫情选择过“曲线”留学,即交换回国内,以国外网课+国内线下学习的模式,完成学业。疫情下,这段特殊的“中美切换”留学经历,李屹染觉得很珍贵。
“大一开学,还没来得及经历校园生活,就直接上网课了。”那段经历,李屹染历历在目:因为网课不受时间地点束缚,起初的一个月,她住在海口,有电脑就能上课,这让她感觉很自由。“有一部分课程是录播,可以随时看,其余的是直播课,到点上就可以了。”李屹染习惯每次把录播课攒到要做作业前一起看,可以连续看好几节课。
渐渐地,“打开电脑是学校,关上电脑就是家。”李屹染有些抵触这种“真空”的学习环境。“大部分时间都是家里留学,又因为我们都是小班教学,没有太多的中国课友,一开始也不太会和美国同学社交,感觉自己就像是一匹孤狼在学习。”
“小组作业,同学们大都不太情愿说话,也不愿意开摄像头,只有一个名字摆在线上会议屏幕上,一两个人张罗作业,其他人能闭麦就闭麦。”这样的情况让李屹染感到完全和外界“零交流”。“我和大学同学都是网友,很渴望和真实的他们进行线下交流。”于是当李屹染看到学校开始留学交换报名时,她果断报名,到北京的一所高校留学半学期。
美国学校当时给选择交换的学生两种选择:完全(中国)线下上课,或者美国网课+中国线下。她选择了后者——在国内大学完成两门课程,在线上完成其他课程。“我所就读的这所高校心理学很出色,我报名了社会心理学,还有一门是艺术类课程电影赏析。”
于是,李屹染开启了“中美切换”的留学模式:她和室友以留学生身份住在昌平校区的学校宿舍里,每天乘坐学校的班车到市区上课,晚上回到宿舍,8点打开电脑链接美国课堂。虽然在学费上有点“不划算”,但这次交换,给了她体验中美大学不同教学文化的机会。
国内校园给了李屹染期待已久的校园体验。这段交换经历,李屹染觉得很珍贵:“上高中时,摆在面前的是要么出国,要么高考。而这个特别的经历让我体验到了自己没有选的路到底是什么样的,我觉得很有意义。”
在国内自建“留学空间” 度过“没有上午”的一年
回归正常的线下学习生活后,雨文在校园里偶然碰到了自己的政治学科教授,一番面对面地沟通后,雨文不但解决了积攒已久的困惑,还获得了宝贵的建议,调整了未来的专业方向。
随着2020年全球疫情暴发,美国校园采取线上同步网课教学模式。尽管有少部分中国留学生为了抵达校园选择辗转到第三国入境,但考虑到疫情的严重性,雨文还是“随大流”,决定在中国的家里“线上留学”,以完成第一学年的学业。
2020年开学前,考虑到线上留学的昼夜颠倒会影响到家人的正常生活,于是她和几名同样需要“线上留学”的好友一起租了个房子。暑假末,她和朋友们一起忙活装修。9月一开学,四个人一起搬进了亲手打造的“留学空间”。
开学后,雨文开始在北京的晚间,上美国的早课。每晚8点开始上课,下课后并不能马上休息,她要继续写论文、交作业,和美国同学跨时区完成小组作业,在后半夜甚至是天亮去睡觉。睡到中午11点起床,是雨文第一学年的常态。“没有上午,下午除了准备晚上的课程也做不了什么,所以感觉每天都过得很短。”雨文一度感觉很煎熬,“很难保证有一个规律睡眠和固定的学习状态的话,也没法把生活规划得很好。”
大二这年,雨文终于回到了真实的校园:在校园里邂逅丰富的留学生活;和同学在图书馆里完成小组作业。她的主修课程之一是数学,“因为之前一年,很多数学课不提供线上直播,所以就没法选课。”回到校园,雨文才上了第一节线性代数课。
一天,雨文在校园里偶遇了政治学科的教授,聊到自己在一门课上的线上经历:这所学校的人文课程很多是为美国政治系统设计,政治学科设置更偏向于对未来在联邦政府工作的学生,作为国际学生,她对课程的设置、关注点和观点存在困惑。“老师非常耐心,他建议我考虑把研究重点换成亚洲问题研究。”雨文觉得自己非常幸运:“这次偶遇的交谈让我调整了更适合自己的专业方向,线下面对面的交流氛围是线上很难实现的。”
与此同时,雨文认为线上留学网课也给她带来了经验的增长:一方面,隔着屏幕上课,压力会有点大,很难确定自己的真实水平,也不了解同学们都听懂了多少;另一方面,雨文也明白,网课帮助她相对顺利地拥有了课堂展示和演讲等必备技能,“尽管线上课程有大家注意力不聚焦的问题,但这也给发表意见提供条件。做展示时,我可以写好文字内容,网课让我有充足的时间背诵稿件,在线上会议上点击‘举手’,心理压力不会太大,促使我在大一上网课的这一年养成了在课堂上多做分享的习惯。”
(文中受访者均为化名)
文/本报记者 张知依
实习生 王伊朵 孙显龙
供图/受访者 统筹/林艳 张彬