数据科学的理论与应用—记分子系统中心第十四期“未来科学沙龙”

发布时间:2019.08.12     

  201987日下午,由中国科学院遗传与发育生物学研究所分子系统生物学研究中心主办未来科学沙龙十四期于研究所职工之家顺利举行。本场沙龙以数据科学主题,介绍了企业界数据分析的重要步骤、何为数据科学家以及数据科学家的必备技能。分子系统生物学研究中心王秀杰研究员、钱文峰研究员和屠强研究员出席了本次活动,所内各研究组职工、博士后、研究生共五十余人参加了本场沙龙,现场讨论、交流气氛活跃。 

 

  本场沙龙由来自腾讯公司的特邀嘉宾陈峭霖博士担任报告人。陈峭霖博士首先结合自身从事数据挖掘工作经验,分享了成为一个优秀数据科学家的心得。作为一个多学科交叉的新兴职业,数据科学家要对统计学、计算机科学以及相关领域知识都有一定的了解。接着,陈峭霖博士以其工作中的案例,介绍了在企业界数据分析的几个重要步骤,包括问题定义、数据的收集与清理、模型的选择与评估,并强调要及时根据实际情况对模型进行调整和优化。此外,陈峭霖博士还向大家列举了数据科学家应当掌握的必备技能,同时建议涉足数据分析的同学要适当地拓展自己的建模技术工具箱,并根据实际分析的数据选取合理的分析方法。对于小数据集,支持向量机、随机森林等算法具有明显优势,而对于大样本数据,则倾向于选择深度神经网络。报告结束后,参与沙龙的老师和同学从据分析方法的选择、数据分析在生物制药的应用、如何快速融入新的工作岗位、以及职场中的人脉建立和职业规划选择等多个角度进行了热烈而深入的讨论。本场沙龙的举办让与会师生初步了解了企业界数据分析的基本流程以及数据科学家的日常工作,引导了大家对如何更好地掌握与应用数据科学技术进行思考。 

 

  未来科学沙龙作为分子系统生物学研究中心定期举行的学术活动,将陆续由老师和学生提出议题。希望通过沙龙的举行,拓展大家的知识面与视野,增进彼此间的交流与合作,为师生的课题研究提供新的思路,推动创新性成果的产生。未来科学沙龙非常欢迎研究所其它中心师生的参与。 

 

附件下载: