复杂社会讨论中计算及局限探析借助于互联网、人工智能和计算机科学的进展,计算社会科学的兴起确实为社会讨论带来了很大的技术和方法上的突破和拓展。利用网络媒体和云计算等新方法来猎取与分析数据,尤其是实时猎取数据并通过“机器学习”赋能的“计算机算法”,为讨论与解释社会以及预测社会提供了一种前所未有的新范式或思维方式。这也是计算社会科学作为跨学科的新兴领域进展如此迅猛的主要原因。然而,对复杂社会进行讨论,计算仍然难以避开一些局限,理解这些局限对于利用计算来进展社会讨论的理论和方法都有帮助。第一,计算利用的数据难以涵盖复杂社会的各个构成要素和要素之间的关系。在传统的社会调查讨论中存在数据难以涵盖社会中各类人的问题,比如社会学家埃里克·奥林·赖特在其《后工业社会中的阶级》一书序言中就专门指出,“具有讽刺意义的是,在马克思主义传统内,对资本主义的批判首先是直接对准资本家阶级中最富有的部分,对资本主义的道德责备很大程度上是基于它使贫穷永久存在”。而抽样调查恰因条件有限,把阶级结构内的两个极端给漏掉了:资本的真正所有者大资本家)和边缘的“底层阶级”(失业者和丧失劳动能力的人)。这种遗漏重要样本的情况,信任做数据调查的学者们不会陌生。现在利用新的猎取数据的方法也存在这样的问题,比如,穷人买车买房更需要借贷,但银行里没有他们的记录,假如根据算法提供的信用来实施借贷,那么这些人就得不到贷款;对于不使用脸书、微博、推特、微信等社交媒体的人员,在利用这些社交媒体记录的数据进行计算和分析时,同样会被漏掉;虽然谷歌书库已经有了世界多国数百年书籍的海量数据,但也只是其中的一部分,究竟有多大代表性,分析结果会有多大偏差依旧是难以解决的问题。据《2024年全球数字概览报告》(Digital2024:GlobalOverviewReport),截至 2024 年 1 月,全球有 52.2 亿人使用手机,相当于世界总人口的66.6%,也意味着还有三分之一的人口没有使用手机。全球使用互联网的人数达到了 46.6 亿,比手机使用者还少,社交媒体用户数量占全球总人口的一半多一点。另外,有些社会特征很重要,但很难量化,也难以进入计算范围。以互联网为主要渠道搜集的信息,虽然样本量大,但覆盖范围的代表性比传统社会调查方法更难以把控。第二,计算的算法是处理信息的逻辑,即使假定数据有了,实行何种算法依旧是一大挑战。传统上的定量讨论方法重在解释某个自变量与因变量的关系,尤其是...