8月10日,在中文语言理解领域最为权威的CLUE榜单中,蚂蚁集团保险科技团队以92.475的得分,打破了CLUE阅读理解榜的历史纪录,排名第一。
一直以来,机器阅读理解技术由于难度高、理解复杂,是语义理解领域最为关键的能力之一。机器阅读理解技术不仅要求AI对内容进行阅读和理解,还需要针对相关问题,推理总结出正确答案。简单的说,就是既要让机器能读懂,更要让机器会思考。
据了解,凭借多年来在自然语言处理方面的深耕,蚂蚁保险科技团队自主研发了预训练语言模型—AntInsBert,该模型仅包含十亿参数量,却一举登顶CLUE阅读理解榜,刷新历史纪录。
之所以AntInsBert仅使用1/10的参数量便取得了比肩甚至超越百亿大模型的成绩,主要是在两个技术上进行了升级。首先,AntInsBert对传统语言模型预训练方案做了改进,设计了基于Prompt的知识增强预训练方案,将海量知识图谱内容引入到预训练模型当中。
其次,为进一步挖掘AntInsBert在机器阅读理解算法上的潜力,该方案将文本分类、信息抽取、指代消解等常见的中文语义理解任务,通过模板转化为阅读理解任务,模型的范化性得到了进一步提升。
更重要的是,AntInsBert模型已经在蚂蚁保“金选”和“安心赔”等保险服务环节得到了应用。例如,为了降低消费者决策难度,蚂蚁保险团队借助机器阅读理解系统对保险条款进行阅读,将用户最关心的投保门槛、保障范围、价格等因素进行结构化,并组织专家团队横向对比了市场上数千款保险产品,尽量保证蚂蚁保“金选”筛选出平台上综合竞争力最强的保险产品。
与此同时,机器阅读理解也运用在蚂蚁保“安心赔”服务中,通过对用户上传的理赔材料的理解,实现了理赔流程的自动化与智能化,大幅缩短传统人工审核的耗时。以人保健康承保的好医保长期医疗险为例,对于理赔金额小于2万元的理赔案件,90%以上都可保证实现安心赔“2日快赔”。