当前位置:首页  新闻聚合  本馆要闻

第二届“慧源共享”高校开放数据创新研究大赛之“数据悦读”学术训练营上海师范大学站顺利举行

5月14日下午2点,第二届“慧源共享”高校开放数据创新研究大赛之“数据悦读”学术训练营“上海师范大学站”在线举行。本场训练营活动由上海师范大学图书馆副馆长胡振华和青年馆员范朋希联合主持,活动邀请了上海师范大学商学院商业数据系副教授傅毅和e成科技首席数据官、复旦大学AI客座教授邬学宁担任报告嘉宾。训练营直播活动在上海教育云平台、Zoom直播平台、哔哩哔哩平台和造就平台进行在线直播,超过4100名师生在线参加了学术训练营活动。

傅毅副教授以“数据挖掘方法与应用——以量化投资为例”为主题,介绍了在数据挖掘技术的更新迭代背景下,各专业领域的交叉应用场景也在不断丰富。分享了对“什么是数据挖掘?”“为什么要进行数据挖掘?”“数据挖掘是一个怎样的过程?”等问题的理解。报告以一个量化投资的数据挖掘项目为例,深入浅出的讲解,向在线观众介绍了运用数据挖掘方法解决具体问题的一般思路和基本步骤。

在互动环节,傅老师与各平台嘉宾和师生展开交流。就如何发现变量和结果之间的关系,傅老师介绍了常用的定性和定量方法,并认为需要根据具体的问题、数据来选择合适的分析方法,才能得出较好的结果。关于组队以及大赛前的准备,傅老师建议参赛选手先要了解比赛数据,并考虑队员的知识结构等因素,合理分工,最大限度发挥团队的作用。

      

数据科学专家邬学宁以“大数据、第四范式与AI”为主题,从表现“狡猾”的新冠病毒以及被我们视为海量计算过程的病毒复制引入大数据话题。首先介绍了人工智能在六十三年发展过程中经历的三起两落、未来趋势,从科学研究以观测、实验为主的第一范式到以密集数据驱动的第四范式的演进。无处不在的AI以大数据为燃料不断发展。其次,分析了认知科学、量子力学、博弈论等多学科启发的智能算法和摩尔定律驱使的指数增长的算力相互推动。通过视频和案例阐述了Alaphgo为本轮AI的引爆点,计算机视觉处理(如卷积神经网络CNN)、自然语言处理(NLP)、对抗神经网络(GAN)则成为本轮AI的三大主推力。随后,介绍贝叶斯方法论与遗传算法的基础上,着重讲述了深度学习的起源、本质和局限以及常见的机器学习算法的分类和实际应用场景,指出知识图谱将成为下一代搜索引擎。最后以生动形象的生物进化史图例做比喻,AI演化类似寒武纪大爆发。通过全球不同领域内人工智能的成功应用案例,说明数字化变革将决定人类未来的命运走向。

在互动环节,邬老师指出,范式就是一个思考问题、认识世界的方法,当下第四范式在各行各业中重新发现新的知识和规律。谈到了AI对未来职业及就业的影响,AI可能会给翻译、医疗诊断等很多领域带来变化,选择职业时需要前瞻性衡量工作的创造性。如果有意向从事算法方面的工作,需要学习Python等编程语言,具备线性代数、微积分等数学基础。

在线上4100名师生对两位报告人表示感谢的热烈掌声中,“数据悦读”学术训练营上海师范大学站圆满结束。(信息研发部)