回顾丨“CCF语音对话与听觉专业组走进企业系列活动”第十三期之“走进数据堂”

作者：数据堂发布时间：2023-03-30

“CCF语音对话与听觉专业组走进企业系列活动”第十三期之“走进数据堂”于2020年10月11日上午9:30-11:30在线展开，本期活动有幸邀请到四位专家介绍数据堂语音及对话领域的最新成果。

数据堂是全球领先的人工智能数据服务提供商。依托自身的数据资源、技术优势及丰富的数据处理经验，自2011年成立以来，数据堂为国内外1000多家人工智能企业和科研机构提供了优质的数据服务。数据堂于2014年完成新三板挂牌，成为中国人工智能数据服务行业第一家上市企业。

主持人

王东，博士，清华大学北京国家信息研究中心副研究员，语音语言技术中心副主任，APSIPA SLA主席。曾就职于IBM、Oracle、法国EURECOM、美国Nuance等公司，2012年回清华大学任教，在领域主流期刊和会议上发表论文150余篇，著有《人工智能》、《机器学习导论》、《语音识别基本法》等著作。

关于讲者

讲者：齐红威

题目：《数据堂业务定位及服务模式》

简介：齐红威，数据堂创始人、董事长、CEO，斯坦福大学访问学者，中科院自动化所工学博士。曾任职于NEC中国研究院，智能信息处理研究部部长，主要从事文本信息处理，自然语言理解，数据挖掘领域的研发工作，丰富的大型项目设计、开发、管理及运作经验。在科研杂志及国际会议上发表专著1篇、科研论文近20篇，并申请专利20项。曾主持包括智能移动信息服务平台，移动购物平台，大规模用户数据挖掘，智能客服中心等商业项目的设计开发及运营。2011年-2015年度中国计算机学会科技论坛（YOCSEF）学术委员会委员。2015年获得中关村高端领军人才聚集工程认定，2016年获得北京市高创人才计划，2017年获评海英人才-创业领军人，2019年被认定为园区类博士后科研工作站数据堂分站负责人，2019年12月获评中青企协第十二届会员。

摘要：数据堂的是一家专业的人工智能数据服务提供商。专注于为国内外人工智能技术和应用企业提供版权数据服务以及数据采集、处理定制服务。通过9年多的发展，数据堂形成了规模化、智能化、高效率化、高品质化的采集及生产平台，同时，积累了数据规模为3PB的版权数据库，主要覆盖智能语音、生物认证、无人驾驶、智能安防、智能家居、手机娱乐、新零售、智能制造、智能医疗等领域。本次报告主要介绍数据堂的业务定位，生产平台和数据资产的能力，以及对外服务的模式。

讲者：何鸿凌

题目：《AI数据的加工艺术》

简介：何鸿凌，数据堂副总裁。曾任职于中国移动、亚信数据等。2006年在中国移动集团公司业务支撑系统部任信息管理处副经理，2015年9月离开中国移动集团公司，加入到新成立的亚信集团的子公司——亚信智慧数据公司，担任大数据云平台部总经理并兼任公司技术委员会主席。曾获得全国通信行业企业管理现代化创新成果一等奖、中国移动集团公司科技进步三等奖等多项荣誉和奖项，申请专利20余项。

摘要：AI数据集的生产平台、工艺和流程。监督学习是目前深度学习用于人工智能的“感知智能”领域的主要技术，监督学习离不开高质量的训练数据，算力、算法和数据构成了深度学习的三大要素。但是这些数据的生成和加工通常需要耗费大量的人力资源，成本高、时间长。数据堂通过多年的实践，打造了一条用于人工智能数据生产的柔性平台，为公司内部产品部门和客户进行数据的采集和标注，同时也将这套生产平台提供给客户使用。在这个主题中，会详细介绍数据生产平台的关键技术、数据生产的工艺、数据质量保障的流程等。

讲者：丰强泽

题目：《数据堂语音数据产品介绍》

简介：丰强泽，数据堂联合创始人，2006年获中国科学院计算技术研究所博士学位，曾任NEC中国研究院高级研究员。20年语音识别和自然语言处理的研发经验，在中国、美国、日本申请专利28项，在知名会议和期刊上发表论文20余篇。目前负责数据堂版权数据产品的规划设计。

摘要：随着语音技术在各种应用场景的落地，对训练数据也提出了更多样化的需求。本讲座将从语音技术的应用场景出发，讲述数据堂版权语音数据产品的建设情况及数据标准。满足语音识别、语音合成、声纹识别、语音唤醒等语音技术需求，对通用语音识别、智能家居、智能车载、智能会议等应用场景设计了针对性的数据产品服务方案，语种涵盖普通话、各种方言、英语及其他几十个外语语种。

讲者：马艳

题目：《数据堂高校数据支撑计划》

简介：马艳，数据堂市场总监，曾多次发起、主办人工智能技术交流活动、数据竞赛，拥有丰富的人工智能技术交流活动管理协调经验。整合数据产品面向科研高校发起多次数据开源活动，拥有一定的高校及研究所合作资源。

摘要：数据堂作为国内专业的人工智能数据服务提供商，积极带头响应中央政策，自2011年成立至今，开源语音数据达2000小时，积极发起、主办参与多次人工智能各领域专业会议及数据竞赛，并筹办专门针对高校发起的人工智能数据助研计划，积极引领人工智能数据服务行业快速发展。未来，数据堂将开源更多、更大、更丰富的科研数据集，持续以推动人工智能发展为己任，为企业需求提供更好的AI数据解决方案，积极推动我国科研进步，助力人工智能基础和应用人才培养，为我国的人工智能产业发展贡献力量。

阅读更多内容

深度学习与语音识别

相对系统地介绍语音识别的基本原理和多种深度模型是如何运用在语音识别当中的，也会对现在语音识别技术所面临的问题加以阐述。

声纹识别靠谱吗？准确率已超过99%

声纹识别靠谱吗？通过苹果手机在中国市场的大热，国人对于指纹识别已经是应用娴熟，继“刷脸”之后，声纹识别也已悄然进入我们的生活。

回顾丨“CCF语音对话与听觉专业组走进企业系列活动”第十三期之“走进数据堂”

上一篇

深度学习与语音识别

下一篇

声纹识别靠谱吗？准确率已超过99%

回顾丨“CCF语音对话与听觉专业组走进企业系列活动”第十三期之“走进数据堂”

近期内容

AI助手：重塑办公生态，携手数据力量共创智能未来

AI定制化时代：小模型与数据深度融合的未来图景

AI手机的浪潮：数据驱动下的智能竞赛

上一篇

深度学习与语音识别

下一篇

声纹识别靠谱吗？准确率已超过99%