• 功能特点

  2019年数字生态大会于5月21日23日在昆明举办,在AI分论坛上,腾讯优图实验室联合负责人、出色科学家贾佳亚共享了优图近期在AI手语辨认上获得的打破推出根据自研算法的“优图AI手语翻译机”。

  据贾佳亚介绍,AI手语翻译机以一般摄像头作为手语收集设备,依托高性能计算机进行后台运算,用户只需正对摄像头完结手语表达,翻译机就能快速运算出成果并把手语翻译成为文字。未来有望在机场、民政窗口等公共场所布置和落地,助力信息无妨碍城市建造。

  手语辨认(SLR),就是指经过计算机算法,主动辨明手语表达中的各类手势、动作以及这些手势和动作之间的切换,最终将表达的手语翻译成文字。不过比较于其他AI视觉辨认技能的研讨,手语辨认的研制却存在更大的困难和应战。手语表达所特有的地域性、杂乱性和多样性极大地添加了数据收集与清洗的难度和本钱,而受限于数据量的巨细和人工规划特征的缺点,许多传统研讨的研讨办法在适应性、泛化性及鲁棒性上都非常有限。

  据贾佳亚介绍,此次腾讯优图推出的AI手语翻译机,结合听障人士手语表达的习气收集手语数据,参阅先进的手势辨认、动作辨认和序列翻译等技能,经过自研算法完结了对杂乱手语表达的辨认技能打破。相较于其他办法,优图AI手语翻译机的数据集覆盖了近千句日常表达,900个常用词汇,一同对数据来进行进一步的剖析和概括,具有现在最大的中文手语辨认数据集,并支撑整句手语表达的辨认,可直接判别用户是否完毕并完结实时翻译。

  据北京听力协会2017年揭露数据,估量我国残疾性听力妨碍人士已达7200万,相当于北京市非流动人口(约2200万,2015年数据)的3倍多。虽然我国在信息无妨碍范畴的投入逐步添加,但现在国内的听障人群需求仍然得不到满意。优图AI手语翻译机的推出将某些特定的程度地缓解听障人士的健谈妨碍。

  在讲演中,贾佳亚表明,“未来,咱们我们都期望经过与聋哑人士或手语使用者的深化触摸,测验在公共事物场所为听障者供给更好的服务,更好地助力信息无妨碍的建造。”下一步,优图实验室将对AI手语翻译机打开优化和晋级,测验在日常服务窗口、手语教育等场景中落地,为听障人士带来实实在在的便当。

  现在,优图实验室现已和深圳市信息无妨碍研讨会建立AI手语辨认联合项目组,就手语数据收集、产品算法优化等方面打开长时间深度协作,并经过与听障者或手语使用者进一步触摸,扩大数据容量,完善数据标准,致力于推进后续的产品和服务布置,推进信息无妨碍建造。

  此次的数字生态大会展现的优图AI手语翻译机,并不是腾讯在信息无妨碍建造上的初次测验。早在2009年腾讯便开端了信息无妨碍方面的探究,到现在,旗下QQ、QQ空间、微信、腾讯网、腾讯新闻、使用宝、企鹅FM等大部分产品已针对妨碍用户完结专门优化,致力于为妨碍人士构建信息友爱社会。2013年,腾讯优图团队和手机QQ一同打磨了OCR引擎技能,根据计算机视觉算法及自然语言处理才能,可将图片上的文字直接转换为可修改的结构化文本,协助视障集体完结信息沟通无妨碍化。

  与本次露脸数字生态大会AI分论坛的跨年纪人脸辨认技能自如,优图AI手语翻译机同样是腾讯饯别“科技向善”的重要表现。而优图实验室也将持续秉承“科技向善”这一理念,推进前沿技能在社会场景中的使用,实在让更多的实际问题得以处理。做有温度的AI,让科技发生更大的社会价值。

相关产品