您好,欢迎来到爱go旅游网。
搜索
您的当前位置:首页大数据时代的社会科学研究

大数据时代的社会科学研究

来源:爱go旅游网
大数据时代的社会科学研究

摘要:大数据时代已经来临,如何从海量数据中发现知识,寻找隐藏在数据中的模式、趋势和相关性,揭示社会现象与预知社会发展规律,需要我们拥有更好的数据洞察力。社交网络、移动互联网和物联网的兴起为社会科学研究提供了新的科学发展观和方。大数据对社会生活、媒介生态和商业带来机遇与挑战是性的,大数据同时带来了社会科学研究的春天,我们必须拥抱大数据,拓展射虎科学研究界,勇于创新,迎接挑战。

关键词:大数据、社会科学研究、影响

社会科学是在近代以来逐渐形成的,它以社会现象为研究对象,力求揭示社会生活的本质和发展规律,对社会生活做出科学的说明与合理的评价。人类文明的进步为社会科学的发展提供了前提条件,而社会科学的发展又为人类文明的进步提供了思想指导。社会科学研究通过对社会历史的回溯与反思,对现实社会的批判与构建,力求提升社会的自我认识能力,使人类文明发展行进在正确的方向和轨道上。

马克思主义社会科学方是在实践基础上的辩证的、唯物的方,是批判地继承了以往优秀学说的新产物,有其重要的理论和实践作用,开创了科学认识人类社会的新路径。马克思主义社会科学方是从马克思主义学说中提炼出来的,以辩证唯物主义和历史唯物主义为根本方法。

近年来,信息技术的快速发展,特别是信息获取技术、物理信息系统、互联网、物联网、社交网络等技术的突飞猛进,引发了数据规模的爆炸式增长,大数据已经普遍存在,能源、制造业、交通运输业、服务业、科教文化、医疗卫生等领域都积累了TB级、PB级乃至EB级的大数据,这些数据已经开始造福于人类,成为信息社会的重要财富。大数据蕴含着巨大的价值,对社会、经济、科学研究等各个方面都具有重要的战略意义,为人们更深入地感知、认识和控制物理世界提供了前所未有的丰富信息,为社会研究提供了更广阔的发展空间。

一、大数据的定义与特点

1、大数据的定义

当今社会,数据量正在以爆炸方式迅猛增长,数据表示形式千变万化,标志着我们已经进入了大数据时代。云计算、三网融合、物联网、移动互联网的出现,更加催生了大数据时代的产生。维基百科对大数据的定义是:数据增长如此之快,以至于难以使用现有的数据库管理工具进行快速的数据获取、存储、搜索、共享、分析和可视化等操作,这些数据量是如此之大,已经不是以传统的GB和TB为单位来衡量,而是以PB(1PB=1024TB)、EB(1EB=1024PB),甚至是以ZB(1ZB=1024EB)、YB(1YB=1024ZB)为计量单位,所以称之为大数据。

2、大数据的特点 (1)“多带来不同”

大数据具有最显著特征之一就是多带来不同。传统的思维方式更倾向于线性思维,线性的就是直线的,直线的就是简单的因果关系。我们已经进入一个复杂科学领域,随着云计算、云存储、物联网、二维码技术和LBS(基于位置的服务)的互联网技术广泛应用,人类的各种社会互动、沟通设备、社交网络和传感器正在生成海量数据。商业自动化导致海量数据存储,但用于决策的有效信息又隐藏在数据中,如何从数据中发现知识,以数据挖掘为代表的大数据分析技术应运而生。

(2)重发现非实证

传统的实证研究,强调在理论的前提下建立假设,收集数据,证伪理论的适用性,采用随机抽样的定量调查问卷获取数据,验证假设。这是一种自上而下的决策和思维过程。大数据时代的社会科学研究重在发现知识,预知未来,为探索未知的社会现象带来机遇。这种预见性是一种自下而上的知识发现过程,是在没有理论假设的前提下去预知社会和洞察商业趋势、规律。

(3)重关系非因果

大数据重关系而不关心因果,问什么而不问为什么是另一个重要特征。因果关系并非来自统计,而是来自研究者的理论和假设。但是大数据分析更关注数据的相关性测量和商业应用价值。大数据是发现那些不能靠直觉发现的信息和知识,甚至是违背直觉的,有时候越是出乎意料可能越有商业价值。

(4)重全体轻抽样

大数据是商业自动化存储的数据,在软硬件满足的条件下可以分析海量数据。随着存储和软硬件的经济性和工具的先进,海量数据的处理能力得到提升,数据挖掘算法不断改进和丰富,特别是统计分析和机器学习的神经网络建模技术发展,抽样并非是必要的手段和方。尽管大数据不一定是总体,理论上讲再大的局部也没有随机抽样更具代表性,但是大数据分析技术也需要抽样,随机抽样和过度抽样也是必要的建模过程和方。

二、大数据对社会科学研究的影响

1、大数据对社会科学研究的积极影响 (1)提高预测和决策的准确率

凯恩斯与哈耶克的市场与之争是20世纪经济学界最为重要的论战之一。这两位经济学家在理论和主张上的差异,深刻影响了20世纪各国经济制定和改革。比如,在20世纪早期,哈耶克的自由市场理念一度占据支配地位。二战后到20世纪70年代凯恩斯主义的干预更多地被采纳。在哈耶克批评计划经济的非可行性和低效率过程中,一个立足点就是“有限理性”:哈耶克从认识论角度提出计划制定者无法了解经济运行中每一个阶段的最终均衡状态。这种

经济运行过程中信息的瞬息万变,会导致不可能建立全能式的生产、决策和分配等。

不过,大数据的出现有可能对“有限理性”的观点形成新的挑战。尽管目前大数据并不能实时提供市场运行中的全部信息,但大数据的方向和现代信息技术的指数式增长,有可能为哈耶克的论敌以及凯恩斯主义者提供新的反驳证据:当未来大数据对市场运行中的信息捕捉达到了空前的覆盖和密度,那么预测和决策就有了比哈耶克时代甚至当代高得多的准确率。

(2)拓展社会科学经典理论的验证空间

大数据作为一种全新的资料,以其超越传统调查数据的样本量和时间跨度,为社会科学经典理论的验证和拓展提供了更多空间。因此,大数据在延伸和重新检视经典学说方面有着相当大的潜力。比如说,经典时期的社会学家以其深刻的洞察力为人们留下了丰富的理论遗产,不过由于理论的宏观性和复杂性,通过传统的截面数据、面板数据等抽样样本的分析,无法在经验层次上对这些理论进行检验。而大数据的出现为当今的社会科学界提供了前所未有的大跨度范围的社会数据、资料和信息,使得重新审视和延伸经典理论,尤其是宏观理论成为可能。

(3)或缓解定量与定性之间的分歧

定量研究与定性研究是两种不同取向的研究策略,其背后蕴含着本体论、认识论和方上的差异。定量研究者和定性研究者常常相互指责对方的局限性,然而大数据的出现为他们提供的数据规模和全新的数据特征,在某种程度上可能会缓解分歧,甚至重构两者的关系。对定性研究者而言,大数据可以通过海量规模的样本直接展示和发现出社会现象的规律,既不需要控制变量来检验关联,更避免了定性方法在案例选择方面的样本偏差。对于定量研究者而言,目前的可用大数据往往并非专门为回归分析而设计,因此依据大数据很难进行传统意义上的回归分析和因果推断。但由于数据的海量甚至全样本的性质,一旦把基于大数据的简单关联分析或时间序列分析结果与文献中的传统回归分析进行比对,就能形成具有说服力的证据链。

(4)为学科融合提供机遇

近代科学在理性化的指引下不断提升专业化程度,以至于不同学科之间形成了鲜明的边界。尽管这种进程大大提高了研究效率和学术领域内的交流评估质量,但也逐渐形成了各自为政的不足。研究者在获得相当的深度的同时,往往失去了对广度的把握,并且学科边界之间形成了许多空白地带。而大数据则为学科融合提供了难得的机遇。这主要是因为,大数据的获取和分析,往往需要有别于传统社会科学训练的方法和工具。这使得原本在计算机、人工智能甚至物理、数学等领域具有专长的学者,在有意无意中不断参与到社会现象的分析队伍中来。

(5)社会科学或出现“重返描述”潮流

当代社会科学尤其是定量分析致力于进行因果推断、提供机制性解释。由于社会人的异质性,基于非实验数据的定量分析很难避免内生性问题(遗漏变量、样本偏误、联立性等问题)。目前,社会科学研究者通过固定效应模型、倾向性匹配、工具变量等方法来加以解决以改进因果推断。从现存可用来进行社会科学分析的大数据看,它所能提供的变量有限,因此社会科学研究者很难通过大数据进行变量控制来进行传统的因果推断。然而,大数据的出现对于学术目标的进一步丰富和发展却无疑是深远的。首先,基于信息技术而兴起的大数据扩展了人类的经验范围,从而使得简单的统计描述就可以达到发现规律、展示规律的目的。其次,大数据的信息具有在时空上传统抽样数据所无法比拟的广度和深度。在大数据时代,社会科学尤其是定量社会科学可能在一定程度上将不再单纯以进行反事实因果推断、探求机制性解释为主要学科发展目标,而是出现一种“重返描述”的潮流。

2、大数据对社会科学研究的消极影响

毫无疑问,在社会科学研究中大数据有其特殊的价值和重要性。相对于人文取向的研究,数据对状态及其变化趋势的呈现更为直观,不同数据间的统计相关为人们合乎逻辑地推断和求证社会现象背后或许存在的关系提供了可能。但在此有必要说明的是:社会科学研究中数据分析结论的可靠性端赖于统计分析方法、技术和工具使用的妥当性以及理论逻辑推演的严密性,然而,如果仅止于此,就有可能陷人形式主义、技术主义和工具主义的陷阱。其实,所谓严格规范的社会科学研究,并非仅仅指涉实证研究所要遵循的一系列如确定问题、文献、理论假设、抽样、测量、数据分析和结论等等刻板化程序和形式,即彭玉生所言的“洋八股”。规范固然有其必要的形式化要求,但形式总是要为内容服务。

无论统计技术取得如何进展,数据之于社会科学与数据之于自然科学,似乎永远不可同日而语。尽管对于后实证主义、后结构主义以及科学知识社会学的学者而言,精确的自然科学也未必那么靠谱,但至少它基于数据演绎而对大多自然现象所做出的预测及其在技术领域所提供的功用价值,能够让人感到基本可信和可靠。然而,在社会科学领域即使最偏好于数理分析的经济和金融等学科,恐怕也不敢妄言它对于现实的理论解释与对未来趋势的预测取得了令人信服的成果。

当个体生活经验和意义完全为数据洪流所湮没,甚至逻辑推断和理论模型建构被抛弃,大数据时代的社会科学研究很可能不仅让我们再也无法体会个体和特定群体生活经验的生动和鲜活,而且让求知过程的知识旨趣和智慧之美就此消散,如此社会科学研究恐怕仅仅成为满足和商业“功用”的工具,研究是否还有其精神意义和价值?更何况,当数据的获取和处理都丢给了计算机,数据和技术自己会“说话”,那么人又在哪里?

另外,大数据不仅仅带来商业和社会正能量,也同时带来了一系列重大社会问题,网络安全和个人隐私成为大数据时代人们极为关心的个人和社会问题。个人隐私,不同的人可能有不同的理解,每个人都有自己的容忍限度。一些人不愿意让别人知道自己的任何信息,希望自己的隐私孤立于社会或公众的注意之外,免受打扰,不想被公开或不受大众控制,而另一些人却希望自己生活的每一个细节都展示给世界。在一个相互联系的网络社会,完全自由的那个人是不存在的。在大数据时代面对新技术的出现,需要制定更为明确和严格的法规条例,规定每个公民必须服从一套简单的规则,这些规则必须被强制执行。每个人必须受到社会规范和制度控制,且公民要树立隐私保护意识。大数据和相关技术在定义隐私、保护隐私和侵犯隐私方面都扮演着重要角色。

三、总结与思考

“技术主导、数据为王”的大数据时代,是否将在根本上“改变人类社会认知的研究范式”,即一种“代表着全新的研究视野和理论基础,依据截然不同的操作方法,它将重组探索世界的学科分布,从而成为人类继定性研究、定量研究和计算机仿真研究之后的第四种探索世界的研究范式”?目前我们尚不得而知,但是很值得人们疑虑。

在保持基本的理性和谨慎的同时,值得我们报以乐观期待的是:大数据只不过是社会科学研究所面临的一个新的境遇和背景,它通过技术处理所直观呈现的结果(趋势或各种相关性)并非结论本身或者研究的终点,而是构成我们进一步探究诸如是什么、为什么和应该是等问题的经验素材,通过降噪、去冗和分类等处理环节,大数据可以还原为可揭示其因果关联机制的小数据,可以成为人类甚至个体去反思自身行为和意义的信号预警。这也意味着所谓大数据时代的社会科学研究更具有跨学科、跨领域的特征,需要技术专家、社会科学以及人文学者三方面的有机结合,因而更凸显其研究有品味、合乎专业规范、有亲切感、富于智慧性且有效用的多重特征。

开放的社会,美好的心灵,大数据时代的崛起,作为社会科学研究者,我们必须勇于面对,热情拥抱大数据,迎接大数据的挑战。

参考文献

[1]T·S·库恩.科学的结构[M].李宝恒,纪树立译.上海:上海科学技术出版社,1980

[2]克托·迈尔·舍恩伯格,肯尼思·库克耶.大数据时代[M].盛杨燕,周涛,译.杭州:浙江人民出版社,2013

[3]李建中,刘显敏.大数据的一个重要方面:数据可用性[J].计算机研究与发展,2013(06).

[4]阎光才.教育及社会科学研究中的数据—兼议当前的大数据热潮[J].北京大学教育评论:2013(10)

[5]宗威,吴锋.大数据时代下数据质量的挑战[J].西安交通大学学报(社会科学版):2013(09)

[6]韩锐锋.社会科学研究中慎用统计数据[J].七色论坛:2011(06) [7]方璐.浅析大数据时代的科学研究方法[J].信息通信:2014(05)

[8]沈浩,黄晓兰.大数据助力社会科学研究:挑战与创新[J].现代传播:2013(08). [9]陈云松,黄超.大数据推动社会科学研究深挖潜力.中国社会科学网

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- igat.cn 版权所有 赣ICP备2024042791号-1

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务