大数据技术的迅速普及,很多城市与媒体积极引入大数据舆情技术辅助舆情监测、管理与应对决策。那么大数据舆情监测分析的局限性有哪些呢?
大数据舆情监测分析的局限性:
一、样本截断问题
大数据舆情获取的信息来源于网络平台,主要集中于网站及自媒体平台的公开意见表达。第一,由于网络、自媒体平台的使用存在一定的门槛,从而天然的排除了很多年长不能使用网络媒体或者经济地位较低无法负担网络媒体者的意见。第二,虽然网络存在一定的匿名性,但网络意见的表达会受到因素的影响,并非所有的意见均会呈现在网络空间中。
二、系统性偏误
大数据舆情技术宣称进行全网信息采集,一般不存在样本容量扩大的问题。但在实际操作中,受限于抓取能力和时间成本,大数据舆情平台的数据抓取也局限于双微、新闻客户端、媒体网站等。由于技术能力限制会导致样本产生系统性偏误,进而影响大数据舆情预警和决策能力。
三、情绪衡量偏误
由于情绪的高度复杂性和汉语的语义模糊性,对情绪进行精确的区分的努力,即使是引入强大的机器学习技术,对情绪分词处理仍存在一定的困难。近年新产生的一些情绪词汇,由于语言的约定俗成性、新词的不断涌现会给情绪判断带来极大的困难。
四、遗漏变量偏误
一方面,当个人意见与主流意见不一致时,个体会倾向于改变自己的意见或者干脆选择沉默。另一方面,网络上发表意见的人,隶属于不同小团体进而在舆论领域进行竞争,群体中的个体会表达趋同的意见,进而隐藏个体的不同意见。这两种机制的存在导致个体的意见表达并不能反映个体的真实意见,而在大数据分析中又难以对这两种机制的影响进行剔除,可能会导致对舆情估计的偏大或偏小,也会导致舆情风险评估模型出现遗漏变量偏误。
以上便是大数据舆情监测分析的局限性相关内容,<识微商情>专业舆情监控软件_免费试用入口>>>
【文章声明】识微科技网倡导尊重与保护知识产权。本网站文章发布目的在于分享舆情知识。部分内容仅是发稿人为完善客观信息整理参考,不代表发稿人的观点。未经许可,不得复制、转载、或以其他方式使用本网站的内容。如发现本网站文章、图片等存在版权问题,请及时联系并发邮件至zhangming@civiw.com,电话:4008299196,我们会在第一时间删除或处理相关内容。