cn

数据解决方案

请输入姓名

手机号码格式错误

请输入联系电话

请输入公司名称

请输入正确的工作邮箱

请输入数据需求

提交成功!感谢您支持数据堂。

填写格式错误请重新填写

确定

数据需求不能小于5个字且不能为纯数字

https://www.datatang.com

https://www.datatang.ai

m.datatang.ai

齐红威先生应邀作“人工智能数据要素建设与服务”主题演讲

作者:数据堂 发布时间:2021-12-13

近期,应中国科学院大学的邀请,数据堂(北京)科技股份有限公司创始人、CEO齐红威先生给中国科学院大学的同学们带来了题为“人工智能数据要素建设与服务”的主题分享。


齐红威先生首先对人工智能数据产业的发展概况作了详细解读,数据产业发展第一阶段是2011年至2017年,大数据、数据交易等在这一阶段起到了核心作用。2017年在提出数字经济、数据要素智能化后,在法律法规的约束下,数据产业进入第二轮的发展期。


随后,齐红威先生对数据的智能化应用场景作了介绍,并表示智能数据在现在的产业发展中无处不在,未来将会有更多的机会和场景看到人工智能的应用。



自动驾驶

通过摄像头、雷达等传感器采集路面场景,如指示牌、路灯等信息,将这些大规模数据进行标注、处理、训练模型,在一些特定场景下,自动驾驶安全性能可以超越人类。此外,还可以通过驾驶员的行为及人脸属性训练数据,实时监测驾驶员状态。



生物识别

通过对一人多照的数据、跨年龄段及不同摄像头下人脸数据进行识别训练,可以应用在各种各样的人脸识别、检测场景中,比如各大手机厂商的face ID、智能安防、高铁及机场安检、酒店的身份核验等场景。



语音识别、语音合成

齐红威先生以数据堂举例,目前数据堂采集了全球50多个国家近200000万小时各种各样的语音数据,比如欧洲语系的法语、西班牙语,亚洲语系的日语、越南语,以及各个国家的英语语音、我国不同口音的普通话语音数据,通过对这些语音数据进行精细处理,结果可以应用于智能音响、语音输入法、智能家居、智能车载、客服语音助手等场景。



智能安防

智能安防的核心是分析监控下的人、物、异常状况等。从应用场景来看,可以分为三类,分别为大场景、中场景、小场景。大场景包括道路监控等的城市级智能安防,典型特点摄像头位置较高,识别清晰度低。中场景包括4S店、银行营业厅及政府办公大厅等,典型特点场景相对受限,摄像头位置较低,清晰度较高。小场景包括家庭内、电梯间安装监控,场景更受限,摄像清晰度更高。




光学字符识别(OCR)

通过OCR技术支撑,智能化识别办公场景中的票据、单据,还有我们常用的手写输入法、文档的扫描,以及学校使用的考卷分析。齐红威先生表示,自动识别考卷内容都是智能化手段和技术的应用场景。



智能制造

通过对缺陷品数据采集标注,用智能化手段辅助人工或代替人工,提高工作效率及精细度,此类技术可应用在高铁检修、手机屏幕的检测等场景。



智能医疗

通过足够多的训练样本进行学习,人工智能可以实现自动诊断。虽然现阶段一些法律法规的要求未能大规模的铺开使用,但在未来的医疗领域是有一定的发展趋势。



在介绍完数据产业发展阶段及智能数据的应用场景后,齐红威先生以数据堂为例对智能数据生产与处理进行了介绍。


齐红威先生表示目前数据堂拥有多套专业数据采集设备、工具和环境可以满足多种场景与类型的数据采集需求。在数据标注方面,数据堂在国内有3大数据标注基地,近5000名专业的数据标注员,可以满足不同种类的数据标注需求,同时数据堂的数据标注平台数加加Pro还可以进行人机交互半自动标注,可提升30%的标注效率。为确保数据质量,数据堂全程进行质量监控,并设置探针自动检查标注数据质量,层层检测,多轮质检,保障数据质量万无一失。



目前随着国家与社会层面对数据安全与个人隐私保护要求越来越高,数据安全与保护变得愈发重要。针对这一发展趋势,齐红威先生在联邦数据与联邦智能这一部分作了详细的讲解,他表示联邦数据作为一种新的数据服务模式,可以使得各方在不披露原始数据的情况下建立联邦共享,联邦模式的本质在于,就是利用算法或模型对数据进行分析,得到有价值的结果。


最后,齐红威先生对数据要素市场的发展现状和问题作了分析,他表示数据产业作为朝阳产业,经过未来不断的调整,将会成为企业智能化升级的重要助力。


口音英语语音识别技术研讨会暨挑战赛-数据堂