基于AI技术的知识服务工具研发应用

发表时间:2020/11/3   来源:《当代电力文化》2020年16期   作者:樊浩 王羽凝 王茜 王新娜
[导读] 本文论述了一种知识服务工具的研发应用情况,该工具基于人工智能(AI)语音语义服务技术,依据现有的“台区经理工作能力标准”,采集电网企业基层人员典型工作场景,通过建设知识标签库,进行科学精准开发。
        樊浩  王羽凝  王茜  王新娜
        国网冀北电力有限公司技能培训中心    河北  保定     071051
        摘要:本文论述了一种知识服务工具的研发应用情况,该工具基于人工智能(AI)语音语义服务技术,依据现有的“台区经理工作能力标准”,采集电网企业基层人员典型工作场景,通过建设知识标签库,进行科学精准开发。通过应用该工具,可大幅提高工作效率,有效提升相关岗位人员业务技能,推动电网企业实现高质量发展。
        一、概述
        随着技术的提升和时代的进步,用户对知识服务的要求越来越高,知识服务需要向智能化和多元化方向发展。其一,服务内容需要智慧化,用户需要知识服务根据其需求和特征提供知识内容;其二,服务对象需要多元化,知识服务需要面对不同的用户提供不同的知识内容。特别是面向学科多元交叉,对从基础业务到应用研究再到市场拓展整个创新价值链的文献情报知识梳理充满渴求,并且科技培训研发活动也面临海量数据分散孤立、知识价值难以判断的问题,这意味着技术与专业知识培训信息服务手段需要创新,知识服务的内涵需要拓展,打造新型精准的技术与专业知识培训信息服务能力,提升科研知识生产率和竞争力。
        对于电网企业,现阶段正在尝试利用移动互联、人工智能(AI)等现代信息技术、先进通信技术,实现电力系统各环节万物互联、人机交互,搭建具有状态全面感知、信息高效处理、应用便捷灵活等特征的智慧服务平台。
        基于AI技术的知识服务,能够帮助用户解决真实场景中遇到的问题,帮助用户快速确定学习目标,提供可靠、系统的知识服务,从而避免用户在花费大量时间做好本职工作的同时,还需要花费大量时间去学习领域知识。对个人来说,从实际应用开始领域知识的学习,会更有效率;企业利用AI技术,可以节省大量的培训费用;对知识服务机构而言,可以提高知识服务质量。
        二、研发步骤
        基于AI和大数据技术的智能知识服务工具主要按照以下步骤进行研发。首先,基于电网企业技能培训知识库成果数据,建设知识服务标签库,创建知识索引快速检索知识;其次,开发知识服务功能模块,建立用户画像,在移动端通过语音、文字等方式发送服务请求,经过语义分析检索知识,推送知识列表;第三,通过个人画像能力要素不断完善与提升,反向促进技能培训知识库的升级迭代,实现集成知识检索、精准推送、智能分析、学习交流、资源共享等的开放学习生态系统。
        借鉴云端智能的相关研究成果,构建主要由用户主体、人工智能“黑箱”以及超大型数据库组成的AI知识服务的应用模式。用户主体是AI的服务对象和数据来源之一。用户通过语音、文字等形式,向AI服务端提出知识服务请求,AI服务端则根据接收到的已知需求,充分收集、调用相关信息,对用户的请求进行反馈。此外,AI服务端会主动收集用户主体的日常数据,在合适的时间和场合主动响应用户的潜在需求;AI“黑箱”,是指机器通过语音识别以及文字识别等AI技术,自主收集、处理、管理及分析数据,最后给出解决方案,整个过程完全没有外在人为干预;超大型数据库是AI决策的基础,主要包含周边场景信息、用户信息和知识库等3方面的数据库,是知识服务决策准确性和专业性的来源。其中:周边场景信息是用来判断用户所处的环境,用于给出即时性的方案;用户信息包含用户的基本属性信息,以及历史行为数据,用于给出个性化方案;知识库包含专业知识、案例等,是解决方案的理论基础。
        三、建设知识标签库
        对于知识服务来讲,一套完备的知识服务工具是其提供优质服务的核心,知识标签库的构建对于整个知识服务解决方案来说更是重中之重。依托于精准培训模块建立中“台区经理工作能力标准”的成果知识库,建立知识标签库。
        (一)知识库
        选取农电相关专业的知识数据,按照大数据标签规范进行存储,包含非结构化知识、结构化知识及热点知识数据,优化知识检索时效。
        本次建设知识库数据来源于计量专业12个培训项目,包括高低压电能计量装置的安装、调换、校验与故障处理等典型工作场景,覆盖从中级工到高级技师四个技能等级。
        (二)知识标签
        依托知识库数据,建立知识标签,用于对知识库中的海量知识进行分类,并提供类比依据;同时建立标签对应的知识内容。其他琐碎元数据,例如创建人,创建时间,知识摘要,知识内容时间等。
        (三)知识索引
        知识索引包含标签索引和知识分类,其中,知识分类依赖于知识元数据中的标签;标签索引根据知识标签库定义标签的层级和结构,用以确认知识的存储位置。
        (四)知识检索
        目前知识检索包括了标题检索、创建者检索、全文检索、时间检索等不同形式。其中,标题检索基于知识元数据,根据知识标题进行检索;创建者检索同样基于知识元数据,根据知识创建者进行检索;全文检索通过引入solr全文检索引擎或ES,对知识数据进行全文检索;时间检索则是根据知识时效性进行检索,并生成检索热点,存入热点数据。
        (五)对象存储技术
        为了实现高效存储,快速检索的的海量知识,拟采用对象存储技术来存储海量知识数据。对象存储是一种将数据作为对象进行管理的计算机数据存储体系结构,每个对象通常包括数据本身,可变数量的元数据和全局唯一标识符。对象存储具备较高的可靠性,如果其中一个或多个磁盘或设备故障,所有集群中的其他磁盘可以进行替代并保证系统照常运行。对象存储系统还可以在一个集群内以ScaleOut方式线性扩展,可以直接根据储存数规模增减储存节点,甚至跨地域实现一个集群,而不受文件数量、文件大小和文件系统容量的限制。对象存储软件相当于一个专门的文件系统,提供服务化的接口,因此能够很方便地实现数据共享。此外,对象存储空间可以统一管理,基于单一的平面地址空间,可以实现数据合理自动路由的存储,省去了使企业存储系统时刻处于生产工作状态的复杂和昂贵的管理成本。
        四、实现智能语音语义服务
        (一)语音智能识别转换技术
        目前,语音智能识别转换技术已达到先进水平,语音识别准确率已经达到实用标准。该技术支持个性化热词后台管理,可将一些非常见词汇上传至识别引擎,当实时转写的音频流中出现该词汇时,引擎可将其识别出来,从而提高专业用语识别准确率。此外,该技术运用超大规模的语言模型,对语境进行智能预测,提供智能断句和标点符号。
        (二)自然语言处理技术
        在词法分析方面,粒度更灵活,保证了基本词汇的原子性,又保证了大粒度词汇,对领域新词、专有名词的识别尤其有效。该技术具备海量训练样本,拥有百亿级的点击反馈,提高了算法在复杂多变的应用场景下的效果稳定性和适配性。另外,该技术还可根据需求自主干预和定制分词效果,自由定制专名实体类目,打造个性化的分词和专名识别系统。
        在词义相识度方面,通过词语间语义相关性计算寻找专业相关词,扩大专有名词的词典,更好地辅助应用。通过寻找搜索查询中词语的相似词,进行合理的替换,从而达到改写查询语句的目的,提高查询搜索的准确性和多样性。
        在短文本相识计算方面,该技术能够对两个短文本之间的语义相似度进行计算,输出的相似度是一个介于0到1之间的实数值,输出数值越大,则代表语义相似程度相对越高。此外,还可提供短文本相似聚合功能,通过语义相似度计算,判断两个短文本的语义表述是否相近,从而实现相似短文本的聚合或去重。
        五、开发知识服务工具
        以掌上小程序为前端载体,适配电网企业用户进行内部注册,依托云服务技术研发工具后台,实现知识服务请求推送。知识服务工具具体功能见表1。
        (一)服务请求
        用户通过语音、文字等方式在小程序端发送句子级别的知识服务请求,提交知识服务工具后台进行服务分析。
        (二)服务推送
        知识服务工具后台将用户发送的服务请求,经过语义分析,转为词语式标签,到知识服务标签库检索知识,检索到知识服务内容后推送知识列表到小程序,响应用户的服务请求。
        (三)用户画像
        基于用户基本信息、请求信息等各种数据,形成其用户画像,用户通过画像浏览历史请求知识服务。
表1  基于AI技术的知识服务工具功能清单
       六、结语
        基于AI技术的知识服务,正是立足电网企业发展的新要求,面向电网基层人员对知识服务的新需要,依托知识图谱与深度学习技术,建立了集成文献检索、精准推送、智能分析、学习交流、资源共享等功能的开放学习生态系统,实现了海量培训大数据在广度与深度上的计算组织,大幅度提高了工作质效,成为了电网企业基层人员的得力助手。
投稿 打印文章 转寄朋友 留言编辑 收藏文章
  期刊推荐
1/1
转寄给朋友
朋友的昵称:
朋友的邮件地址:
您的昵称:
您的邮件地址:
邮件主题:
推荐理由:

写信给编辑
标题:
内容:
您的昵称:
您的邮件地址: