《数据科学实践》新书推介|“十四五”大数据新兴领域高等教育重点教材重磅出版
发布时间:2025-11-26在大数据、人工智能全面融入经济社会发展的时代背景下,无论是高校的人才培养还是产业的创新发展,对于兼具理论基础和实践能力的复合型数据人才,需求都日益迫切且愈发凸显。在教育部启动战略性新兴领域“十四五”教材体系建设之后,大数据与人工智能相关专业教材迎来了体系化升级的新阶段。《数据科学实践》正是在这一背景下,由中国计算机学会(CCF)大数据专家委员会组织指导、由中国人民大学国家治理大数据和人工智能创新平台执行主任陈跃国领衔编著的重点教材之一。作为大数据新兴领域“十四五”高等教育规划教材,本书立足行业真实场景,以数据科学实践为主线,是面向高校与产业界的重要基础读物。
主编简介
陈跃国教授中国人民大学国家治理大数据和人工智能创新平台执行主任,吴玉章特聘教授,中国计算机学会数据库专委会秘书长。主要从事金融科技、可信数据科学等方面的研究工作。主持国家自然科学基金联合基金重点项目《政府治理大数据行为知识图谱关键技术研究》、国家重点研发计划课题《制造大数据可视化分析系统》等项目,获得教育部科技进步一等奖1次、电子学会科技进步二等奖1次,获得过IEEE ICDE国际会议最佳企业应用论文亚军奖。
覃雄派 副教授中国人民大学信息学院计算机系副教授。1994年毕业于中国人民大学信息系,2001年和2009年,分别在中国人民大学信息学院获得工学硕士和工学博士学位。目前主要从事高性能数据库、并行计算、大数据分析等领域的研究工作。
随着我国大数据战略的全面推进,从智慧农业、智能制造到智慧金融、智慧医疗,海量数据驱动的行业问题不断涌现,数据科学实践能力成为人才培养体系的关键环节。然而,长期以来,大数据专业的教材体系以基础概念、理论方法为主,缺乏深入行业应用的系统实践教材。《数据科学实践》的出版正填补了这一空白。
本书是数据科学新兴领域“十四五”高等教育教材体系的重要组成部分,由来自中国人民大学、北京理工大学、中国科学院大学等高校与科研机构的多位专家学者参与编写。书中所有实践案例来自中国人民大学国家治理大数据和人工智能创新平台,具有真实、前沿、可复现的特点,充分体现了“以数据为中心”的培养理念。本书不仅可作为大数据与人工智能专业的基础技能训练教材,也可为产业界的数据工程师、算法工程师、数据分析师等技术人员提供参考。书籍
《数据科学实践》以CRISP-DM 数据科学流程为总框架,从数据获取、集成、质量提升,到特征工程、模型构建、可视化分析与大数据存储访问,逐步展开如何在真实问题中开展数据驱动的求解。书中涵盖关系型表格数据、文本数据、图像数据、时序数据和图数据等多类型信息,构成一个完整的数据科学实践体系。 为了让读者真正从“方法”走向“应用”,本书选取了六个具有行业代表性的数据科学案例贯穿全书。在智慧农业部分,书中以粮食产量预测为例,展示如何利用特征工程与遥感影像深度学习的方法进行数据清洗、模型构建和灾害影响分析;在智能制造部分,通过产品质量优化案例展示回归模型、特征工程、因果分析等方法如何在工业生产中支持流程调控和质量提升;金融科技章节则以量化交易为核心,通过数据标注、特征构造、模型训练与策略回测,说明如何用大数据与机器学习支撑交易策略构建;在智慧医疗领域,书中以糖尿病视网膜病变识别为例,涵盖眼底图像预处理、病灶检测与分级模型开发等关键步骤;互联网行业部分围绕社交群组推荐,展示从用户画像、个性化推荐到图高阶学习的任务链路;公益事业部分则以危化品知识库问答为案例,结合MSDS文档处理、命名实体识别、传统NLP与大模型问答系统,呈现数据科学在公共安全与社会治理中的应用潜力。每章不仅给出技术综述、实践案例、关键代码等信息,还附有习题与扩展思考,非常适合作为课程教学、实验指导与项目训练使用。
目录
第1章 概论
第2章 智慧农业中的粮食产量预测
第3章 制造业中的产品质量优化
第4章 金融行业中的量化交易
第5章 医疗行业中的病变识别
第6章 互联网行业中的社交群组推荐
第7章 公益事业中的危化品知识库问答
作为国内数据科学体系的重要组成部分,《数据科学实践》不仅体现了“以数据为中心”的课程理念,更以六大行业的真实案例,为学生与产业界提供了系统化、可落地的实践路径。无论读者是高校教师、数据科学初学者,还是希望拓展行业技术能力的工程师,都能从本书中获得清晰的实践方法与跨领域的技术视野。这是一本“站在时代前沿”的大数据实践教材,值得所有关注数据科学的人收藏与深入研读。