数据科学导引
内容简介
《数据科学导引》是博雅大数据学院针对新开设的“数据科学与大数据技术”专业编写的数据科学导论课程教材。
《数据科学导引》内容共分十五章,包括绪论、数据预处理、回归模型、分类模型、集成模型、聚类模型、关联规则挖掘、降维、特征选择、EM算法、概率图模型、文本分析、图与网络分析、深度学习、分布式计算。附录部分对相关的基础知识做了简要介绍。
《数据科学导引》还提供了大量的数据分析实践案例,有助于加深读者对理论知识的理解,及培养其实际应用能力。
《数据科学导引》可作为全国高等学校数据科学相关专业的本科生和研究生教材,也可供从事相关工作的技术人员参考使用。
作者简介
鄂维南,中国科学院院士,北京大数据研究院院长,北京大学、普林斯顿大学教授,大数据教育联盟理事长。主要从事计算数学、应用数学及其在力学、物理、化学和工程等领域中的应用等方面的研究。1996年获首届美国青年科学家与工程师总统奖。2003年获国际工业与应用数学大会科拉兹奖。2009年获美国工业与应用数学学会克莱曼奖。2014年获美国工业与应用数学学会卡门奖。
欧高炎,北京大学北京国际数学研究中心博士后,博雅大数据学院院长,大数据教育联盟秘书长。中国计算机学会数据库专委会委员。大数据教育、服务和竞赛平台“数据嗨客”创始人。
朱占星,北京大学大数据科学研究中心、北京大数据研究院研究员。主要研究方向为机器学习。长期从事人工智能、机器学习、深度学习以及大数据分析方面的研究与应用。
董彬,北京大学北京国际数学研究中心研究员,北京大数据研究院生物医学影像分析实验室副主任,求是杰出青年学者,中组部青年千人。主要研究领域是应用数学、计算数学及其在图像和数据科学中的应用。