最新公告
  • 欢迎您光临淘气哥素材网,牛年活动正在如火如荼进行中,通过卡密充值八折!入驻会员
  • Python数据科学导论PDF下载_Python教程

    Python数据科学导论PDF下载_Python教程 最后编辑:2020-09-15
    增值服务: 自动发货 使用说明 安装指导 环境配置二次开发BUG修复

    资源名称:Python数据科学导论 PDF 下载

    内容简介:

    本书涵盖的主题非常广泛,介绍了数据科学方方面面的知识,每一章都侧重于介绍数据科学的某一方面,为读者以后的深入学习打下基础。具体内容包括:第1、2章系统介绍大数据科学的背景知识及框架结构;第3~5章介绍机器学习相关知识;第6~9章介绍几个比较有趣的数据科学主题。本书是学习数据科学知识的入门教材,在深入学习本书的实例前,需要掌握SQL、Python及HTML5的入门知识,了解统计学和机器学习相关知识。

    资源目录:

    译者序

    前言

    关于本书

    关于作者

    关于封面插图

    第1章 大数据世界中的数据科学1

    1.1 数据科学和大数据的好处和用途2

    1.2 数据种类3

    1.2.1 结构化数据3

    1.2.2 非结构化数据3

    1.2.3 自然语言数据4

    1.2.4 计算机数据4

    1.2.5 图类数据5

    1.2.6 音频、视频和图像数据5

    1.2.7 流数据6

    1.3 数据科学过程6

    1.3.1 设置研究目标6

    1.3.2 检索数据6

    1.3.3 数据准备7

    1.3.4 数据探索7

    1.3.5 数据建模7

    1.3.6 展示与自动化7

    1.4 大数据生态系统与数据科学7

    1.4.1 分布式文件系统7

    1.4.2 分布式编程框架9

    1.4.3 数据集成框架9

    1.4.4 机器学习框架9

    1.4.5 NoSQL数据库10

    1.4.6 调度工具10

    1.4.7 基准测试工具10

    1.4.8 系统部署11

    1.4.9 服务开发11

    1.4.10 安全11

    1.5 Hadoop工作示例介绍11

    1.6 本章小结16

    第2章 数据科学过程17

    2.1 数据科学过程概述17

    2.2 步骤1:定义研究目标并创立项目章程19

    2.2.1 了解研究的目标和背景20

    2.2.2 创立项目章程20

    2.3 步骤2:检索数据20

    2.3.1 从存储在公司内部的数据开始21

    2.3.2 不要害怕去购买数据21

    2.3.3 检查数据质量以预防问题发生22

    2.4 步骤3:数据的清洗、整合以及转换22

    2.4.1 数据清洗22

    2.4.2 尽可能早地修正错误27

    2.4.3 从不同的数据源整合数据28

    2.4.4 数据转换30

    2.5 步骤4:探索性数据分析32

    2.6 步骤5:构建模型35

    2.6.1 模型与变量的选择35

    2.6.2 模型执行36

    2.6.3 模型诊断与模型比较39

    2.7 步骤6:展示结果并在其上搭建应用程序40

    2.8 本章小结40

    第3章 机器学习42

    3.1 什么是机器学习,为什么需要关注它42

    3.1.1 机器学习在数据科学中的应用43

    3.1.2 机器学习在数据科学过程中的使用43

    3.1.3 Python工具在机器学习中的应用44

    3.2 建模过程45

    3.2.1 特征工程以及模型选取46

    3.2.2 模型的训练47

    3.2.3 模型的验证47

    3.2.4 预测新的观测值48

    3.3 机器学习的类型48

    3.3.1 有监督学习48

    3.3.2 无监督学习53

    3.4 半监督学习60

    3.5 本章小结61

    第4章 单机上处理大数据63

    4.1 大数据处理过程中遇到的难题63

    4.2 处理巨量数据的通用技术64

    4.2.1 选择合适的算法65

    4.2.2 选择合适的数据结构71

    4.2.3 选择合适的工具73

    4.3 处理大数据集的通用编程技巧75

    4.3.1 不必重复发明轮子75

    4.3.2 充分利用硬件76

    4.3.3 减少计算需求76

    4.4 案例研究1:预测恶意URL77

    4.4.1 步骤1:确立研究目标77

    4.4.2 步骤2:获取URL数据77

    4.4.3 步骤4:数据探索78

    4.4.4 步骤5:建模79

    4.5 案例研究2:在数据库中建立一个推荐系统80

    4.5.1 所需的工具及技术80

    4.5.2 步骤1:研究问题82

    4.5.3 步骤3:数据准备82

    4.5.4 步骤5:建模86

    4.5.5 步骤6:展示与自动化86

    4.6 本章小结88

    第5章 大数据世界的第一步89

    5.1 数据分布存储和框架处理89

    5.1.1 Hadoop:存储和处理大数据集的框架90

    5.1.2 Spark:取代MapReduce以获得更好的性能92

    5.2 案例研究:借贷的风险评估93

    5.2.1 步骤1:研究目标94

    5.2.2 步骤2:数据检索95

    5.2.3 步骤3:数据准备98

    5.2.4 步骤4(数据探索)和步骤6(报告形成)101

    5.3 本章小结111

    第6章 了解NoSQL112

    6.1 NoSQL简介114

    6.1.1 ACID:关系型数据库核心原则114

    6.1.2 CAP理论:多节点数据库的问题115

    6.1.3 NoSQL数据库的BASE原则116

    6.1.4 NoSQL数据库的种类117

    6.2 案例研究:这是什么疾病123

    6.2.1 步骤1:设置研究目标124

    6.2.2 步骤2和步骤3:数据检索与数据准备124

    6.2.3 步骤4:数据探索131

    6.2.4 再回到步骤3:为描述疾病概况做数据准备137

    6.2.5 再回到步骤4:为描述疾病概况做数据探索140

    6.2.6 步骤6:展示与自动化140

    6.3 本章小结141

    第7章 图数据库的兴起143

    7.1 互联数据及图数据库概述143

    7.2 图数据库Neo4j概述146

    7.3 数据互联案例:食谱推荐引擎152

    7.3.1 步骤1:设置研究目标153

    7.3.2 步骤2:数据检索154

    7.3.3 步骤3:数据准备155

    7.3.4 步骤4:数据探索157

    7.3.5 步骤5:数据建模159

    7.3.6 步骤6:数据展示162

    7.4 本章小结162

    第8章 文本挖掘和文本分析164

    8.1 现实世界中的文本挖掘165

    8.2 文本挖掘技术169

    8.2.1 词袋169

    8.2.2 词干提取和词形还原170

    8.2.3 决策树分类器171

    8.3 案例研究:Reddit帖子分类173

    8.3.1 自然语言工具包173

    8.3.2 数据科学过程综述及第1步:研究目标175

    8.3.3 第2步:数据检索175

    8.3.4 第3步:数据准备178

    8.3.5 步骤4:数据探索180

    8.3.6 再回到步骤3:数据准备的调整182

    8.3.7 步骤5:数据分析185

    8.3.8 步骤6:展示与自动化188

    8.4 本章小结189

    第9章 面向终端用户的数据可视化191

    9.1 数据可视化选项192

    9.2 Crossfilter—Javascript MapReduce库194

    9.2.1 安装195

    9.2.2 利用Crossfilter筛选药品数据集198

    9.3 用dc.js创建一个交互式控制面板201

    9.4 控制面板开发工具205

    ……

    资源截图:

    Python数据科学导论PDF下载_Python教程 Python教程 第1张

    猜你在找

    淘气哥素材网https://www.tqge.com/国内最专业的站长资源平台
    淘气哥素材网-网站源码设计素材营销软件免费下载 » Python数据科学导论PDF下载_Python教程

    常见问题FAQ

    免费下载或者VIP会员专享资源能否直接商用?
    本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担。更多说明请参考 VIP介绍。
    提示下载完但解压或打开不了?
    最常见的情况是下载不完整: 可对比下载完压缩包的与网盘上的容量,若小于网盘提示的容量则是这个原因。这是浏览器下载的bug,建议用百度网盘软件或迅雷下载。若排除这种情况,可在对应资源底部留言,或 联络我们.。
    找不到素材资源介绍文章里的示例图片?
    对于PPT,KEY,Mockups,APP,网页模版等类型的素材,文章内用于介绍的图片通常并不包含在对应可供下载素材包内。这些相关商业图片需另外购买,且本站不负责(也没有办法)找到出处。 同样地一些字体文件也是这种情况,但部分素材会在素材包内有一份字体下载链接清单。
    淘气哥
    一个高级程序员模板开发平台
    • 2020-09-15Hi,初次和大家见面了,请多关照!

    售后服务:

    • 售后服务范围 1、商业模板使用范围内问题免费咨询
      2、源码安装、模板安装(一般 ¥50-300)服务答疑仅限SVIP用户
      3、单价超过200元的模板免费一次安装,需提供服务器信息。
      付费增值服务 1、提供dedecms模板、WordPress主题、discuz模板优化等服务请详询在线客服
      2、承接 WordPress、DedeCMS、Discuz 等系统建站、仿站、开发、定制等服务
      3、服务器环境配置(一般 ¥50-300)
      4、网站中毒处理(需额外付费,500元/次/质保三个月)
      售后服务时间 周一至周日(法定节假日除外) 9:00-23:00
      免责声明 本站所提供的模板(主题/插件)等资源仅供学习交流,若使用商业用途,请购买正版授权,否则产生的一切后果将由下载用户自行承担,有部分资源为网上收集或仿制而来,若模板侵犯了您的合法权益,请来信通知我们(Email: 80027422@qq.com),我们会及时删除,给您带来的不便,我们深表歉意!

    Hi, 如果你对这款模板有疑问,可以跟我联系哦!

    联系作者
    • 1066会员总数(位)
    • 19965资源总数(个)
    • 335本周发布(个)
    • 0 今日发布(个)
    • 407稳定运行(天)

    淘气哥素材网国内外拥有高端品质素材站长资源平台

    立即查看 了解详情
  • © 2020淘气哥素材网- & WordPress Theme. All rights reserved 沪ICP备20009926号

  • XML地图 | 站长导航