《数据天才》【美】Vincent Granville 

该资源由用户: 罗汉如心 上传  举报不良内容

内容简介:

这是一本跟数据科学和数据科学家有关的“手册”,它还包含传统统计学、编程或计算机科学教科书中所没有的信息。《数据天才:数据科学家修炼之道》有3个组成部分:一是多层次地讨论数据科学是什么,以及数据科学涉及哪些其他学科;二是数据科学的技术应用层面,包括教程和案例研究;三是给正在从业和有抱负的数据科学家介绍一些职业资源。《数据天才:数据科学家修炼之道》中有很多职业和培训相关资源(如数据集、网络爬虫源代码、数据视频和如何编写API),所以借助《数据天才:数据科学家修炼之道》,你现在就可以开始数据科学实践,并快速地提升你的职业水平。《数据天才:数据科学家修炼之道》是写给数据科学家和相关专业人士的(如业务分析师、计算机科学家、软件工程师、数据工程师和统计学家),也适合有兴趣转投大数据科学事业的人阅读。

作者简介:

Vincent Granville博士是一名富有远见的数据科学家,有 15 年大数据、预测建模、数字分析和业务分析的经验。Vincent 在评分技术、欺诈检测和网络流量优化及增长等领域,是举世公认的权威专家。在过去的 10 年中,他曾与 Visa 一起研究实时信用卡欺诈检测,与CNET一起研究广告组合优化,与Microsoft(微软公司)一起研究“改变点检测”,与Wells Fargo(富国银行)一起研究在线用户体验,与InfoSpace一起研究搜索智能,与eBay一起研究自动竞价,与各大搜索引擎、广告网络和大型广告客户一起研究点击欺诈检测。Vincent 也管理着LinkedIn上最大的“大数据及分析数据科学家”小组,该小组拥有超过100 000名成员。目录:第1章 数据科学是什么 1-真伪数据科学对比 2- - 伪数据科学的两个例子 5- - 新大学的面貌 7-数据科学家 10- - 数据科学家与数据工程师 10- - 数据科学家与统计学家 12- - 数据科学家与业务分析师 13-13个真实世界情景中的数据科学应用 14- - 情景1:国家对烈性酒销售的垄断结束后,DUI(酒后驾驶)逮捕量减少 15- - 情景2:数据科学与直觉 17- - 情景3:数据故障将数据变成乱码 19- - 情景4:异常空间的回归 21- - 情景5:分析与诱导在提升销量上有何不同价值 22- - 情景6:关于隐藏数据 24- - 情景7:汽油中的铅会导致高犯罪率。真的吗 25- - 情景8:波音787(梦幻客机)问题 26- - 情景9:NLP的7个棘手句子 27- - 情景10:数据科学家决定着我们所吃的食品 28- - 情景11:用较好的相关性增加亚马逊的销售量 30- - 情景12:检测Facebook上的假档案或假“喜欢”数 32- - 情景13:餐厅的分析 33-数据科学的历史、开拓者和现代趋势 33- - 统计学将会复兴 34- -历史与开拓者 36- - 现代的趋势 38- - 最近的问答讨论 40-总结 44第2章 大数据的独特性 45-两个大数据的问题 45- - 大数据“诅咒” 45- - 数据快速流动问题 50-大数据技术示例 56- - 大数据问题是数据科学所面临挑战的缩影 56- - 大规模数据集的聚类和分类 58- - 1亿行的Excel 63-MapReduce不能做什么 67- - 问题 67- - 3种解决方案 68- - 结论:何时使用MapReduce 69-沟通问题 70-数据科学:统计学的终结 72- - 8种最差的预测建模技术 72- - 把计算机科学、统计学和行业专业知识结合在一起 74-大数据生态系统 78-总结 79第3章 成为一名数据科学家 80-数据科学家的主要特征 80- - 数据科学家的职能 80- - 横向与纵向数据科学家 83-数据科学家的类型 86- - 伪数据科学家 86- - 自学成才的数据科学家 86- - 业余数据科学家 87- - 极限数据科学家 89-数据科学家人群特征 90-数据科学方面的培训 91- - 大学课程 91- - 公司和协会培训项目 95- - 免费培训项目 96-数据科学家职业道路 98- - 独立顾问 98- -创业者 105-总结 118第4章 数据科学的技术(I) 119-新型指标 120- - 优化数字营销活动的指标 121- - 欺诈检测的指标 122-选择合适的分析工具 124- - 分析软件 124- - 可视化工具 125- - 实时产品 126- -编程语言 128-可视化 128- - 用R生成数据视频 129- - 更复杂的视频 133-无模型的统计建模 134- - 无模型的统计建模是什么 135- - 该算法是如何工作的 135- - 源代码生成数据集 137-三类指标:中心性、波动性、颠簸性 137- - 中心性、波动性和颠簸性之间的关系 138- - 定义颠簸性 138- - 在Excel中计算颠簸性 139- - 使用颠簸系数 141-大数据的统计聚类 141-大数据的相关性和拟合度 143- - 一系列新的秩相关性 146- - 渐近分布与归一化 148- - -计算复杂度 152- - 计算q(n) 152- - 理论上的解决方案 155-结构系数 156-确定簇的数量 157- - 方法 157- - 例子 158-网络拓扑映射 159-安全通信:数据加密 163-总结 166第5章 数据科学的技术(II) 167-数据字典 168- - 什么是数据字典 168- - 建立数据字典 169-隐性决策树 169- - 实现方法 171- - 示例:互联网流量打分 173- - 结论 175-与模型无关的置信区间 175- - 方法 175- - 分析桥第一定理 176- - 应用 177- - 源代码 178-随机数 179-解决问题的4个办法 181- - 拥有超强直觉能力的业务分析师的直观法 182- - 软件工程师的蒙特卡洛模拟法 182- - 统计学家的统计建模方法 183- -计算机科学家的大数据方法 183-因果关系和相关性 183-怎样检测因果关系 184-数据科学项目的生命周期 186-预测模型的错误 189-逻辑相关回归 191- - 变量之间的相互作用 191- - 一阶近似 191- - 二阶近似 193- - 用Excel进行回归分析 195-实验设计196- - 有趣的指标 196- - 把患者分成不同的人群进行治疗 196- - 私人定制的治疗 197-分析即服务和应用程序接口 198- - 工作原理 199- - 实施案例 199- - 关键词相关的API的源代码 200-其他主题 204- - 当数据库改变时,保存好数值 204- - 优化网络爬虫 205- - 哈希连接 206- - 用于模拟簇的简单源代码 207-Hadoop和大数据的新型合成方差 208- - Hadoop和MapReduce的介绍 208- - 综合指标 209- - Hadoop、数值的和统计的稳定性 210- - 方差的抽象概念 211- - 一个新的大数据定理 213- - 平移不变性的度量标准 214- - 实现:通信和计算成本 214- - 最终意见 215-总结 215第6章 数据科学应用案例研究 217-股票市场 217- - 使回报率提高500%的模式 217- - 优化统计交易策略 220- -股票交易的API:统计模型 222- -股票交易的API:具体实现 225- -股票市场模拟 226- - 些许数学知识 229- - 新趋势 231-加密 232- - 数据科学应用:隐写术 232- - 好的电子邮件加密 236- - 验证码破解 239-欺诈检测 240- - 点击欺诈 241- - 连续点击评分与二进制欺诈/非欺诈 242- -数学模型与基准 244- - 虚假转化产生的偏差 245- - 一些误解 246- - 统计面临的挑战 246- - 点击评分优化关键词出价 247- - 组合优化自动快速的特征选择 249- - 特征的预测能力:交叉验证 250- - 勾连检测和僵尸网络的关联规则检测 254- - 模式检测的极值理论 255-数字分析 256- - 在线广告:到达率和频率的计算公式 256- - 电子邮件营销:提高300%的性能 257- - 在7天内优化关键词广告宣传活动 258- - 自动新闻提要优化 260- - 用bit-ly进行竞争情报分析 261- - 测量 Twitter 哈希标签(hashtag)的收益 263- - 用3个修补方法提升谷歌搜索 267- - 改进相关性的算法270- - 广告循环问题 272-杂项 273- - 简单模型会获得更好的销售预测 273- - 更好的医疗欺诈检测 275- - 归因模型 276- - 预测陨石撞击 277- - 在路口停车场收集数据 281- - 数据科学的其他应用 282-总结 282第7章 踏上你的数据科学职业之路 283-面试问题 283- - 关于工作经验的问题 283- - 技术问题 285- - 一般性问题 286- - 关于数据科学项目的问题 288-测试你自己的视觉和分析思维291- - 通过肉眼的检测模式 292- - 识别偏差 294- - 误导性的时间序列和随机游走 295-从统计学家到数据科学家 296- - 数据科学家也是统计从业人员 297- - 谁应该给数据科学家教统计学 298- - 雇佣问题 298- - 数据科学家与数据架构师密切合作 299- - 谁应该参与战略思考 299- - 两种类型的统计学家 300- - 大数据与取样 301-数据科学家的分类 302- - 数据科学最流行的技能集合 302- - LinkedIn上的顶级数据科学家 306-400个数据科学家职位头衔 309-薪酬调查 311- - 根据技能和位置的薪酬分类 312- - 创建自己的薪酬调查表 316-总结 317第8章 数据科学资源 318-专业资源 318- - 数据集 318- - 书籍 319- - 会议与组织 322- - 网站 324- - 概念定义 324-职业建设资源 327- - 招聘数据科学家的公司 328- - 数据科学招聘广告的样本 329- - 简历样本 329-总结 331


如果您对该资源产生疑虑,欢迎您 点击此处 举报不良内容。 希望我们能共建一个文明社区!感谢您的合作与支持!

扫一扫即可关注本站(PDF之家)微信公众账号
发送您想要找的书籍名称即可找到书籍

Image

本站为非盈利性网站, 但服务器成本高昂, 如果本站内容对您有帮助, 欢迎捐赠, 您的鼓励是我们最大的动力!

大小: 3.94 MB
格式: PDF

声明

本站资源来源于网络及个人用户网盘上传,仅用于分享知识,学习和交流! 本站不保存,不制作,不出售任何图书。请您下载完在24小时内删除。 资源禁用于商业用途!如果您喜欢本站资源,请购买正版,谢谢合作!

标签

Vincent Granville 天才 数据

扫码支持一下:

Image Image

猜你喜欢

《数据天才》【美】Vincent Granville 

请输入验证码: