京东云:言犀在复杂任务导向智能对话实现技术创新 将成为产业升级最佳推手 环球要闻

2023-05-06 15:18:57     来源:中国网科技

中国网科技5月6日(记者 安青)今日,2022年度吴文俊人工智能科学技术奖颁发,京东云旗下的言犀团队凭 “任务型智能对话交互关键技术及大规模产业应用”,斩获吴文俊人工智能科学技术奖科技进步奖。同期,京东集团副总裁、京东科技智能服务与产品部负责人何晓冬博士荣获吴文俊人工智能科学技术奖杰出贡献奖。

据悉,吴文俊人工智能科学技术奖经科学技术部核准设立,由国家级学会—中国人工智能学会发起主办,被誉为“中国智能科技最高奖”,是国内人工智能领域最高荣誉象征。


(相关资料图)

针对此次获奖,何晓冬表示,京东的智能对话技术源于解决零售、物流等实体行业大规模客户服务人力不足带来的效率问题。不同于一般对话场景,客服是任务型对话,需解决真实世界深度复杂的任务。言犀项目实现了复杂任务导向智能对话关键技术的技术创新;研制出系列技术产品与解决方案,技术成果规模化推广在多个行业应用,产生了逾20亿元的直接经济效益和良好的社会效益;促进了零售、物流、金融、政务等相关产业的快速发展。

从ChatGPT到言犀,看大模型发展历程

如今,我们正从黄页时代、搜索引擎时代转向“大交互”时代,技术的突破将带来用户体验和商业模式的革命性变迁。

据何晓冬介绍, Chat AI经历了过去几十年发展,于近几年迎来爆发式增长。从技术角度来看,上世纪50年代是基于规则,80年代是基于统计模型,本世纪深度学习崛起以后,开始向神经网络、替代模型发展。特别是2017年Google的Transformer发表以后,之后又分出一系列的模型,直到今天的GPT4。

ChatGPT是第一款真正意义上的AI原生产品,最大创新在于文本内容生成,通过交互式对话逐步理清用户意图。尤其针对比较复杂的意图,ChatGPT能够通过几轮的人机交互,让用户讲清楚诉求,ChatGPT也能完全理解用户意图并给出相应的回答。

人工智能下一步将走向融合性智能技术。何晓冬提到,当下人工智能技术的三要素“数据”、“算法”、“算力”,未来会升级为“场景”、“系统”、“算力”:包括复杂的交互智能场景及其产生的动态数据、多任务协同和多算法融合的系统、能支撑这样的场景与系统的新型算力,从而让计算机能深度理解真实世界,并解决重大的真实问题,提升智能系统的通用性、适应性和任务完成率,更好地支撑各种关键应用,“ChatGPT的出现也正好验证了我们的推测。”

AI需要在真实场景,特别是产业场景中深度应用、不断打磨,才能创造价值,并不断提升自身的技术水平。京东优势在于真实场景、明确应用、丰富精准的数据、长时间的实践打磨,这一内生能力已从京东内部实践走向外部产业,在城市、金融、零售、交通等领域产生价值。

京东云旗下言犀人工智能应用平台,拥有世界领先的语音识别、计算机视觉、机器学习、知识图谱、语义理解、多轮对话6大关键技术,9大类50余个成熟API日均调用量达百亿次。自诞生之际,言犀便自带“产业”属性,技术可用性强、复用度高、迁徙成本低,通过智能客户服务系统支持辅助20000+客服坐席,累计服务数十万商家,5.8亿终端消费者,是探索智能对话交互技术产业落地的前沿阵地。

言犀实现三大技术突破,赋能多场景应用

不同于普通闲聊对话场景,任务型对话以解决真实世界深度复杂的任务为目的,与体验强相关。在用户与客服对话中,通常带有明确的目的指向,需完美解决客户售前售后咨询、价保、交易、支付、配送、退换货服务等各环节需求。

在此实践中,言犀沉淀了4层知识体系、40多个独立子系统、3000多个意图以及3000万个高质量问答知识点,覆盖超过1000万种自营商品的电商知识图谱,用以提升任务型对话技术能力,保障可用、可控、可信的智能对话体验。

本次任务型智能对话交互关键技术及大规模产业应用,主要涵盖了三个方向的技术突破。

创新一:知识指导的多模态可控对话生成。针对生成语音时对上下文的建模不足,导致生成的声音缺乏表现力,提出了多颗粒度韵律增强的语音合成技术,提高语音的韵律丰富度和可控性,提出的语音合成技术获ACM Multimedia 2021最佳演示奖。针对对话内容的生成,还提出了知识融合的预训练语言模型和多模态可控对话文本生成模型,提升生成文本的专业度丰富度。

创新二:极简条件下智能行为感知与数字外观重建。针对极简条件下人体感知与重建技术存在感知重建精度与系统复杂度的固有矛盾,言犀团队与清华大学等一起提出了一系列高精度人体外观感知与重建方法,达到国际领先水平,算法效率提升了1个数量级,应用于数字人交互服务场景。

创新三:多轮对话决策推理。针对在用户口语化、不规律停顿等问题情况下的人/机话语权决策问题,提出了多轮对话决策推理技术,达到国际领先水平,获国际竞赛Wikihop、HotpotQA冠军,应用于客服对话场景。同时,针对对话中数值推理和决策证据依赖等问题,言犀团队提出了基于离散算子的数值决策推理、基于证据选择的决策推理等方法。

上述技术创新在2022年7月通过中国人工智能学会组织的科技成果鉴定,评价认为:“该项目技术复杂,研制难度大,创新性强,项目成果整体处于国际先进水平,其中知识指导的多模态可控对话生成、极简采集条件下三维数字人体感知重建、以及可解释的多轮对话推理决策三项技术达到国际领先水平。成果应用产生了重大的经济和社会效益,推广应用前景广阔。”

目前京东云正筹备产业版GPT——言犀大规模预训练语言模型,并以“125”计划作为落地应用路线图,包含1个平台、2个领域、5个应用,加速人工智能技术在产业落地。1个平台指言犀智能人机对话平台,即自然语言处理中理解和生成任务的对话平台,预计参数量达千亿级。2个领域包含零售与金融领域。5个应用包含内容生成、人机对话、用户意图理解、信息抽取、情感分类,涵盖零售和金融行业复用程度最高的应用场景。

不仅仅在京东内部,言犀还在大量外部场景中得到应用。京东云言犀团队打造了包括京东智能客户服务系统、言犀智能外呼、京小智平台商家服务系统、智能金融服务大脑、智能政务热线、言犀数字人等系列产品和解决方案,助力山西大同、河北保定、广东东莞、北京通州等多地政务服务热线智能化升级,与江南农商银行联合推出国内首个能独立、全程办理银行真实交易的VTM数字员工等,帮助零售、政务、金融、交通等多个行业数智化转型。

何晓冬表示,ChatGPT及智能交互相关技术突破有望带来革命性的、里程碑式的新机遇,言犀持续深耕的任务型智能对话关键技术,已在AIGC技术落地的最后一公里取得重大突破,成为产业升级的最佳推手。

标签:

包装