中新网12月18日电 12月17日,由鹏城实验室主办的新一代人工智能院士高峰论坛在深圳举行。会上,王海峰发表了“百度AI开源与开放”主题演讲,阐述百度人工智能技术开源、开放的发展路径。
王海峰认为,开源开放对于人工智能时代至关重要。一方面,人工智能技术的发展和突破需要所有人齐心协力、共同推动,因此开源、开放就尤为重要;另一方面,人工智能技术会赋能各行各业,开源、开放让各行各业可以便捷地使用人工智能,让社会各界都受益。
人工智能受到国家的高度重视,被视为新一轮科技革命和产业变革的重要驱动力量。促进人工智能与社会经济发展深度融合,是当前人工智能发展的重点。
王海峰表示,人工智能技术已经在互联网领域得到广泛应用。比如把答案直接呈现给用户的搜索引擎、通过语音与用户交互的智能音箱、为用户出行提供路径规划的地图等等,这些互联网应用的背后,是自然语言处理、知识图谱、语音、图像、深度学习等人工智能技术在发挥作用。
百度在人工智能领域已经有近20年的积累。从2000年开始,百度的搜索业务已自带人工智能基因,比如理解用户需求、网页内容时,需通过自然语言处理技术实现;2010年,百度已预见到人工智能对未来行业发展的推动作用,开始全面布局;2016年,百度宣布对外开放AI核心能力。
经过多年的积累与沉淀,百度形成了包括基础层、感知层、认知层、平台层的完整AI技术布局,既有基础的算法、数据和算力,也有语音、图像等感知技术,自然语言处理、知识图谱、用户理解等认知技术,还包括对外开源、开放AI核心技术的AI技术开放平台。
深度学习框架是当前人工智能技术发挥作用的底层基础,它相当于是AI体系结构的“操作系统”。王海峰介绍,百度从2012年1月份开始深度学习的研究,先后将深度学习应用于搜索等业务,取得很好的效果。2016 年8月,百度PaddlePaddle正式开源,成为中国首个、也是当前国内唯一开源开放的,完整、全套的深度学习框架,并在百度信息流推荐等场景中得到广泛应用与验证。
完整、全套的深度学习框架包含什么?王海峰解读了百度的深度学习全功能套件PaddlePaddle Suite,它由技术领先的核心框架、适用于企业应用的丰富配套模块与组件、以及降低应用门槛的服务平台组成。
“这个完整、全套的深度学习框架,其关键仍在于核心框架,”王海峰表示。核心框架层包括PaddlePaddle Fluid训练和预测框架,同时有面向服务器端和移动端的预测引擎,并开源了智能文本处理、智能视觉、智能推荐等针对不同人工智能应用的专用模型。PaddlePaddle核心框架具备5大特点,可支持大规模异构计算集群,支持大规模的并行训练——PaddlePaddle同时支持稠密参数和稀疏参数的并行训练,稀疏参数可达千亿规模,以及提供多种算法、使用多路通讯、适于多端部署。
灵活、简单、易用,是开发者对深度学习框架的诉求。基于此,百度开发了AutoDL、VisualDL、PARL、EasyDL、AI Studio等一系列辅助工具和服务平台。AutoDL支持深度学习设计、迁移、适配,AutoDL自动设计生成的模型甚至优于人工设计的一些典型模型;VisualDL可实现全程可视化的深度学习训练和预测,帮助开发者更好地把控全局;PARL强化学习工具,在NIPS 2018 AI假肢挑战赛上助力百度以极大优势赢得冠军;一站式开发平台AI Studio,可以为开发者提供更加完善便捷的编程环境;EasyDL帮助用户基于自定义的图片数据、对话数据、声音数据等实现自动加工、学习,快速完成部署,降低使用门槛。王海峰以地板瑕疵自动检测为例,介绍了PaddlePaddle相关平台为开发者带来的便利,“这家生产地板的公司完全没有人懂深度学习,但基于EasyDL平台,他们上传有瑕疵的地板数据,就能自动产生数据模型,自动检测地板的瑕疵问题,让每天的地板质检处理量提升了一倍以上。”
底层深度学习框架的开源,只是百度布局AI、发展AI技术生态的一小部分。王海峰表示,为了让AI渗透各行各业、步入千家万户,百度已全面开放语音、视觉、自然语言处理、知识图谱等140余项AI核心技术。比如,在自然语言处理领域,百度不仅开源了大量基于PaddlePaddle重构的自然语言处理经典模型,而且全面开源开放了百度自主研发的词法分析、语义匹配、情感分析、主题模型、对话系统等。在视觉、语音等技术方面,百度持续开源开放,助力行业应用的变革与创新。
让每一位开发者都能平等便捷地获取AI能力是百度AI开源开放的动力和愿景。如今,越来越多的开发者和合作伙伴受益于开源开放的百度AI技术,加速行业转型和升级。
郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。