2018年09月30日
评论数(0)历时一个通宵,两个白天,60多G的数据终于分发到上百台计算机。200多平米的实验室空荡荡,只能听见计算机运行的声音。数天后,这里将坐满学生,键盘声此起彼伏。
实验室里100多台电脑搭载了PaddlePaddle,静静等待第一批使用的学生
边教边学,大学教师也需打怪升级
许云峰是河北科技大学信息学院计算机系的副教授,负责教授本科的人工智能和大数据课程,他与同事李媚、白宇和张妍同为大数据课程组的老师。在各高校陆续开设人工智能专业,AI领域加速快跑的时候,两个问题一直困扰着许云峰:师资力量严重不足,缺乏实验环境。
这两个问题同样困扰着其他高校教师。今年上半年,教育部印发《高等学校人工智能创新行动计划》,并推出国内首个高校人工智能人才国际培养计划,力争五年内培训顶尖高校至少500位AI教师、5000位AI学生。但是可支持资源少、缺少经验指导是事实,很多老师自己都不会,只能边教边学,无形中提高了学习的门槛。
“人人都有平等学习和使用AI的权利,不能因为技术门槛将学生拒之门外。”许云峰说。2013年,许云峰第一次接触深度学习技术,他意识到“深度学习技术是目前人工智能领域中最成熟、与实际应用最近、可扩展性最强的一项技术,选择深度学习技术作为教学和科研的切入点,既可以促进本科生的就业,又可以促进研究生和教师的科研工作。”然而努力了半年,效果并不理想——没有专业的实验平台,没有真实数据,算法光靠“努力”成不了。
使用Paddle、参加培训班,学习AI的最佳时机被他抓住
2016至2018年,出现了两个转折点。
其一,百度于2016年宣布PaddlePaddle开源。经过长期试用,许云峰认为“PaddlePaddle是目前我们尝试过的最容易上手的开源深度学习框架,没有之一”。作为教师,他很看重框架的易用性,“学生可以非常轻松地设计网络、调整参数,并设计新的算法,进而解决科研项目中的实际问题。”自那之后,许云峰老师所在的实验室一直在尝试用该框架解决科研和工程问题。
其二,2018年5月,百度举办了信息技术新工科产学研联盟深度学习师资培训班,许云峰、李媚、白宇和张妍就在其中,在与资深人工智能专家的交流中他逐渐补齐了知识短板。在课程结束后的交流分享中,许云峰承诺:在河北科技大学已有的实验环境上,开发基于PaddlePaddle的人工智能和大数据实验系统,降低学生学习人工智能和大数据的技术门槛,使人人都有平等学习和使用AI的权利。
缺乏实验环境?于是他给百度打了个电话……
许云峰做出这样的承诺,心里还是有把握的。
在百度举办的深度学习师资培训班上,他和课程组同事已经将PaddlePaddle深度学习开源框架的基本的知识与操作技巧了然于心。培训结束后,参训教师、授课专家建起了微信群。来自不同高校教师经常就教学实践中遇到的问题在群里讨论,寻找最恰当的解决方案,为他们后期的教学活动提供持续性的保障。
在师资问题逐步得到解决之后,摆在许云峰面前的是一个很实际的问题。“学院的机房没有进行人工智能相关实验的软件环境,学生们更不可能配置相应的硬件设备。”这一问题如果不解决,开设相关课程则沦为空谈。
许云峰给百度深度学习师资培训班的组织者之一、PaddlePaddle运营高级经理谢梦打了个电话,“我需要你们的数据,需要你们的平台提供帮助”。在了解到许云峰团队的困境之后,谢梦马上找到了百度AIStudio的产品经理靳伟。
AI Studio是封装好了PaddlePaddle运行环境的AI实训平台,在云端集合了AI教程、代码环境、算法算力;加上其一站式的设计,为初学者准备了多个领域的不同模型范例,以及数十个经典数据集,供学习练习使用。
靳伟了解许云峰的需求后,立马给出肯定答复:“AI Studio愿意为河北科技大学和许老师提供帮助,也肯定能满足他们的需求。”
获得了技术支持,课程组终于能全身心投入大数据和人工智能实验系统的开发。许云峰和百度持续沟通开课细节,课程设置、教材编写、软硬件布施,事无巨细。百度也乐意为老师们提供全天侯的PaddlePaddle开课服务。百度校园品牌部的项目经理张倩与许云峰沟通最为密切,“可能一周有3到4天都会和许老师沟通。我和我同事们的邮箱,几乎天天收到老师发的项目进度、新的需求。能帮助老师们成就一件从无到有的事,我也很开心。”张倩说。
开设PaddlePaddle深度学习开源框架相关课程的基础条件已经具备。此时,距许云峰参加深度学习师资培训班仅过了4个月。
报名人数一口气破300,开课模式可以复制?
9月18日,经过2个白天1个通宵,60多G的数据集被上传到100多台电脑主机。由许云峰与同事以及大数据实验室多位研究生、本科生,历时14人月开发的人工智能和大数据实验系统,正式宣告完工。该系统整合了百度开源的深度学习框架PaddlePaddle和一些人工智能和大数据的相关实验案例,可以让学生在4G内存+I5CPU的普通PC上运行人工智能和大数据实验,大幅度降低了学习人工智能和大数据技术的技术门槛。
他在培训班的微信群里发了一句话:“我们上次开会吹的牛,终于兑现了。”
根据许云峰及团队的规划,他们将在原有课程《大数据应用技术》基础上引入PaddlePaddle深度学习开源框架的相关理论与案例,形成“大数据+深度学习”的全新课程。在原有课时的基础上新增22课时,从应用的角度融合了大数据和人工智能两个学科的知识和相关案例。许云峰希望这门课程的落地,可以增强本科生在就业市场中的竞争力,增强研究生的科研能力。
目前,该课程报名人数已经突破300人,大二、大三学生及研究生尤为热情。虽然涉及PaddlePaddle的课程到10月份才正式展开,但大部分学生已经将20多G的实验系统安装到自己的笔记本上,先做一轮“预习”。
9月20日,许云峰在培训群里又发了一张相片,空旷的实验室已经坐得满满当当:第一波学生已经开始实验了。
河北科技大学向“人人都能学习、使用AI”的愿景迈出了第一步
研究生们在实验室里讨论方案
他将一个网盘链接发在群里,说:“关于我们搭建实验室系统的资料,都在这儿了。平台搭建工作告一段落,后续工作是做应用案例了。”他希望,借助他和团队的分享和经验,后续能有更多的高校搭建实验平台,帮助老师与学生更好地融入到中国高校人工智能队伍中来,人人都能学习、使用AI。
智能相对论(微信ID:aixdlun):深挖人工智能这口井,评出咸淡,讲出黑白,道出vb深浅。重点关注领域:AI+医疗、机器人、智能驾驶、AI+硬件、物联网、AI+金融、AI+安全、AR/VR、开发者以及背后的芯片、算法、人机交互等。