首页 理论教育 大数据时代的担忧:误导结果与语境挑战

大数据时代的担忧:误导结果与语境挑战

时间:2023-11-18 理论教育 版权反馈
【摘要】:大数据有误导结果的可能。大数据面临处理语境问题的挑战。大数据时代,来自硬件的数字鸿沟在缩小,而来自软件的数字鸿沟在扩大。在大数据时代,非结构化数据往往占有很大的比例,同样,拥有数据并不代表着能够利用数据。在技术大步前进时,这个问题更加令人担忧。大数据技术对全球科技治理、中国科技治理现代化的能力提出挑战。大数据存在隐私安全的伦理问题。数据、密集型数据是信息时代的产物,大数据是互联网时代的产物。

大数据时代的担忧:误导结果与语境挑战

大数据深受当今社会各界关注,不仅因为概念处于形成过程中的模糊性,而且因为技术正处于应用过程中的不确定性。大数据日益广泛深入的应用让人们对大数据的反思从对技术不确定性的担心上升到技术的伦理价值判断,甚至是国家治理安全。

大数据有误导结果的可能。大数据时代,“让数据说话”的盛行使更多的社会空间被量化,定量科学和客观方法的地位在一定程度上模糊了主观与客观之间的界限。美国微软研究院首席研究员克劳福德(Kate Crawford)在其《对大数据的再思考》文章中认为:“数字无法自己说话。不论其规模有多大,数据集归根到底是人类设计的产物,而大数据的工具并不能使人们摆脱曲解、隔阂和错误的成见。”也就是说,大数据存在着偏见与盲区,“先天不足”。因此,一部分人认为,不仅某些数据并非中性,而且大数据测量对象的测量设计决策也源于设计者的主观诠释,大数据并不能完全准确地推出客观规律,被神化的大数据极有可能误导结果。

大数据不一定是好数据。互联网和各种社交媒体每时每刻都提供巨量的数据,这些数据掺杂着大量冗余的、混乱的、虚假的甚至是有害的内容,数据对象的价值密度被不断降低。但是,大数据倡导者仍努力从不确定中寻找确定性的结论,热情地拥抱着这种“混乱”。百度公司董事长兼首席执行官李彦宏在百度联盟大会上就曾表示:“现在每天产生大量数据,但很多是没有价值的数据,没有显示出足够的威力。”数据分析不可能不经过筛选而维持其完全原始的状态,这些数据尽管已经覆盖了数以百万计的用户群体,但依然有其局限性,真正需要的数据可能被更多混乱的海量“大”数据所掩盖和淹没。诸如此类的“魏则西事件”加剧了人们对数据“真伪”的担心。著名导演尤小刚在谈到利用大数据进行创作时就提醒说:“如果仅仅把浮于表面上的炒作结果放进去,很可能对文化建设造成某些破坏和误导。”

被剥离语境的大数据将毫无意义。数据在经过筛选简化套入模型时,其语境常常难以评估和保留。过去的社会学家和人类学家是通过问卷调查、访谈、观察以及对照实验来搜集关于人类关系的数据,并用这些数据来描述人类的“个人关系网络”。社交网站兴起后,大量研究者则常常是通过社交媒体去收集分析用户信息,借此描述人们的社交关系。尽管社交网络大数据是建立在联系的紧密度上,但联系的紧密度不等同于关系的紧密度,两个没联系的人也不一定没关系,两个有关系的人也不一定有联系。舍恩伯格在《大数据时代》一书中就提到:“只有能够想象并重建人们行为的发生语境,你所观察到的行为才有意义,缺乏对行为语境的了解,就不可能推出任何因果关系,也无法理解人们的行为原因。”大数据面临处理语境问题的挑战。(www.xing528.com)

大数据造成新的“数字鸿沟”。大数据时代,来自硬件的数字鸿沟在缩小,而来自软件的数字鸿沟在扩大。一是拥有数据的差别。例如:一些数据免费使用,一些数据有偿使用,还有一些数据严禁流出,这就导致了数据获取的差别;一些数据资源丰富且使用权限较大,另一些却很少有机会拿到“数据通行证”,这就造成了数据储备使用的差别。二是公众利用数据的能力不同。在大数据时代,非结构化数据往往占有很大的比例,同样,拥有数据并不代表着能够利用数据。大数据时代,数据产业遍地开花,但“数据垄断”不可避免。世界经济论坛发布的《2015年全球信息技术报告》指出,各国之间的数字鸿沟正在扩大。在技术大步前进时,这个问题更加令人担忧。欠发达国家有可能会更加落后,必须尽快采取具体行动,以应对这样的局面。大数据技术对全球科技治理、中国科技治理现代化的能力提出挑战。

大数据存在隐私安全的伦理问题。技术进步不可避免会带来一些社会问题,大数据也不例外。大数据分析不仅面临传统的物理安全、网络安全、数据安全等问题,还面临新的隐私保护和信任安全问题。360公司董事长周鸿祎说过:“大数据时代可以不断采集数据,当看起来是碎片的数据汇总起来,每个人就变成了透明人。每个人在干什么、想什么,云端全部都知道。”大数据让我们时刻暴露在“第三只眼”之下。京东商城、天猫商城在时刻监视着我们的购物习惯,谷歌公司、360公司在监视着我们的网页浏览习惯,微信、QQ在监视着我们的社交关系,我们无时无刻不在被监视、被数据化。尽管许多大数据的提供者尽力消除数据中的个人信息,但身份重新被确认的风险仍然很大,不法分子仍可以从大量的公共数据集中推断出个人信息并进行售卖。

从数、数据、密集型数据到大数据的概念演变,实质上是观察或研究对象的属性随时代变化的结果。数据、密集型数据是信息时代的产物,大数据是互联网时代的产物。随着大数据的广泛应用,大数据已然引发了人类工作、生活和思维的一次革命,正在成为推动人类社会转型的一种重要力量。正如中国科学院自然科学史研究所研究员刘益东所讲:“大数据是信息、资产和疆域,已成为涉及国家安全的头等大事,意义非凡。”大数据作为区别于小数据的范式,具有格雷“第四范式”所说方法论上的重要意义。正如北京师范大学哲学学院教授董春雨所讲:“强调范式的认识论和纲领意义在于它可以聚焦科学共同体的研究方向和问题,从而推动大数据研究向更加深入、完善的方向发展。”大数据技术是一种新兴的正在成长的技术,具有两面性,不仅给社会带来正面的积极的影响,同时也带来许多负面的消极的影响。大数据时代伦理问题显得格外突出,小到个人隐私、大到国家治理都受到极大挑战。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈