百度智能云曦灵发布“AI手语平台”及“一体机”,可实现手语主播实时直播功能
3月4日消息(李文朋)百度智能云曦灵正式发布“AI手语平台”,可实现分钟级生成手语合成视频、手语主播实时直播等能力,同时百度智能云曦灵还发布了“AI手语平台一体机”,可以通过规模化部署快速建立无障碍窗口,适用于医院、银行、车站等多种公共场合,缓解无障碍窗口短缺困境。
据了解,AI手语平台一体机可将普通服务窗口转换为“无障碍窗口”,听障人士在医院可实现挂号、看诊、缴费、取药等全系列流程,在车站、机场可独立完成值机、托运、改签、中转,在法院、警局等特殊场景中也可对各类紧急情况进行实时平等的沟通。
线上场景方面,“AI手语平台”具备“视频手语合成”、“直播手语合成”、“文本转手语”、“语音转手语”四大功能,可实现普通视频合成为手语视频、实时直播中增加手语画面、文字翻译为手语、语音实时翻译为手语等多种效果。线下场景方面,全离线一体机V3以及端云结合一体机P3,搭载了“AI手语平台”的核心功能,可实现ASR语音识别、语音翻译、人像渲染等多功能。
在语音识别清晰度上,百度智能云曦灵-AI手语平台通过SMLTA语音识别算法模型,实现声学、语言一体化端到端建模语音识别,在手机端近场语音识别率可达98%以上。可针对诸如旅游、医院、司法等不同领域的词准率进行针对性训练,词准率可达96%,这使得AI手语平台一体机能更好地应用于不同场景中。
在手语翻译准确度及精炼度上,百度研发首个基于神经网络的精炼度可控手语翻译模型,联合手语语言学专家、特殊教育专家以及天津理工大学聋人工学院等制定了自然手语标注规范,建设大规模自然手语翻译语料库,使模型可以从真实数据中学习手语翻译知识,如语序的调整、词语的映射以及长度控制等,从而生成符合听障人群习惯的自然手语。
在手语动作的流畅度上, AI手语平台通过“动作融合算法”, 基于《国家通用手语词典》规范精修11000多个手语动作,让每一个动作起落之间自然衔接,带来真人手语地连贯性表达。再配合4D扫描技术训练,使得AI手语数字人表情自然生动,口型生成准确度高达98.5%。
百度集团副总裁吴甜表示,人工智能呈现融合创新和降低门槛的新特点,综合运用多技术的数字人带来新体验,AI加持使数字人制作和运营成本与门槛降低,AI手语平台将让更多听障人士享受科技带来的便利。