聚焦可信AI与产业应用百度联合发起千言计划实现情感分析20升级
发布一年多以来,“千言”已针对开放域对话、阅读理解和情感分析等8个任务,汇集了来自11所高校和企业的28个开源数据集。其中,情感分析作为自然语言处理技术的基本任务之一,涵盖了句子级情感分类、评价对象级情感分类、观点抽取三个经典任务数据集,吸引了来自京东、网易、小米、平安、OPPO、新浪等多家知名企业的近300支团队参加打榜。
近日,为了更好地推动情感分析技术在大规模产业化的应用,中文信息学会情感计算专业委员会、美团与百度共同发布千言-情感分析2.0,实现两方面的重大升级。首先,在继续关注模型准确率效果的同时,加强对模型是否“可信”的评估,发布业界首个中文情感可信数据集DuTrust;其次,针对产业化中面临的任务类型、数据模态多样化的难题,提供面向真实应用场景的大规模、高质量、多模态的情感分析数据,发布业界更大规模的中文评论分析数据集ASAP和面向推荐场景的多模态情感标签数据集DuVideoSenti。
“可信AI”的概念在近几年提出,并且逐渐成为全球共识。可信AI,就是保证AI系统的可解释性、鲁棒性和公平性,确保算法可被人信任。在情感分析技术的科学研究和产业落地中,可信情感分析系统需要具备较强的鲁棒性和可解释能力,也就是要求模型针对各种不同表达,既能给出精准的预测结果,还能给出其判断依据,从而保证模型的预测结果更加置信。
作为业界首个中文情感可信数据集,DuTrust基于人工标注的扰动数据和情感证据,全部来源于真实用户评论数据,同时测试模型的鲁棒性和可解释性,全面评估模型的可信能力。
以上述评论数据为例,DuTrust首先为每个样例对应标注一个扰动样本,并且标注原始样本和扰动样本的情感类别,通过计算模型在原始样例和扰动样例上预测的准确率(Accuracy)作为模型鲁棒性的评估指标。
此外,DuTrust还分别为原始样例以及扰动样例人工标注了情感的判断依据,在可解释性评估时,需要用户同时给出模型的情感判别依据,最终通过计算其与人工标注结果在字粒度上重合度F1值(F1-measure)作为模型可解释性的评估指标。
此次“千言”与美团联合发布的业界更大规模中文评论分析数据集ASAP,首次实现对评论得分预估和对象级情感分类两个任务的联合标注,数据全部源于真实的电商场景,从数据规模和标注质量上都远超其他数据集。
该数据集针对输入的评论文本,人工标注整体的评论得分(1-5分),以及对应不同评价对象的情感类别(积极、消极、中性三种),并且使用准确率(Accuracy)评估模型的预测效果。
在真实的应用场景中,往往存在大量内容题材、质量相同,但却能给用户带来不同视觉冲击和情感感受的资源。针对这类资源,需要构建能够刻画用户不同的视觉和情感感受的完备的标签体系,才能将其更好地应用于推荐系统,提升用户的体验。
千言面向推荐场景推出多模态情感标签数据集DuVideoSenti,引入视频情感泛标签预测任务,构建了视频情感泛标签体系。该体系由人工定义的“文艺清新”、“时尚炫酷”、“舒适温馨”等11个情感泛标签组成,用以刻画用户浏览视频后的视觉和情感方面的感受。数据集为每个小视频标注了情感泛标签,并且提供了视频的标题、帧图特征用于模型的训练和预测。在测试中使用准确率(Accuracy)用于评估模型的预测效果。本数据集聚焦情感分析技术在个性化推荐场景中的应用,同时有助于推动多模态学习技术的发展。
据悉,本次比赛就以千言-情感分析2.0为核心,全面评估情感分析模型在多种模态场景下的预测准确率、模型的鲁棒性和可解释性指标。除了有挑战性的赛题,百度飞桨 AI Studio 将为选手提供免费的Tesla V100 GPU算力,千言数据集还将为优胜团队颁发证书,并发放精美的定制礼品。
未来,希望有更多的情感分析领域科研学者、领域专家参与共建千言-情感分析榜单,共同推动中文情感分析技术的进步,建设世界范围内的中文情感分析影响力。
上一篇:速度提升2倍,超强悍CPU级骨干 *** PP-LCNet出世!下一篇:AI Studio 精品项目合集 | Transformer在CV领域的实践相关动态百度AI技术赋能,产业级AI落地强化营开营上半年新增用户量翻倍!AI简历神器助“求职萌新”重塑应聘竞争力统一多场景自动编译加速——支持动态shape场景,一套架构搞定训推需求PaddleX图像分类赋能野生动物保护,打造濒危物种守护官百度AICA再开课!已为业界输送410名首席AI架构师
标签: 百度飞桨情感分析
相关文章
-
天极资讯频道_IT行业资讯_互联网资讯_电商资讯_打造科技行业权威资讯坐看渠道风云变迁详细阅读
暑假即将余额耗尽,你准备好迎来2025下半学年的开学季了吗?无论是即将开启接送“生涯”的学生家长,还是即将步入校园生活的大学新生,新学...
2025-08-26 7 百度飞桨情感分析
-
13英寸笔记本评测详细阅读
群星纪元由北海卡布姆科技有限公司开发,北京儒意景秀网络科技有限公司负责发行与运营,其核心团队曾参与鸿图之下等SLG项目开发,游戏于20...
2025-08-24 6 百度飞桨情感分析
- 详细阅读
-
2025年5月18日十二生肖运势全解析详细阅读
在初夏温柔的微风中,5月18日悄然到来。不同生肖在这一天的生活画卷会如何展开?从情感交流到职场打拼,从财务管理到健康维护,让我们以理性...
2025-08-07 8 百度飞桨情感分析
-
百度文心体育解决方案入选2024年度智能体育典型案例详细阅读
近日,工业和信息化部、国家体育总局联合发布了2024年度智能体育典型案例,百度“文心体育解决方案:3D+AI跳水辅助训练系统”凭借其技...
2025-08-07 7 百度飞桨情感分析
-
百度CTO王海峰:飞桨产业级深度学习平台大幅降低应用门槛详细阅读
近日,在北京信息科学与技术国家研究中心系列交叉论坛(第45期)上,百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰博士作了...
2025-08-04 10 百度飞桨情感分析
发表评论