HOME 首页
SERVICE 服务产品
XINMEITI 新媒体代运营
CASE 服务案例
NEWS 热点资讯
ABOUT 关于我们
CONTACT 联系我们
创意岭
让品牌有温度、有情感
专注品牌策划15年

    数据分析实战45讲百度云(数据分析实战45讲pdf)

    发布时间:2023-03-21 09:13:35     稿源: 创意岭    阅读: 369        问大家

    大家好!今天让创意岭的小编来大家介绍下关于数据分析实战45讲百度云的问题,以下是小编对此问题的归纳整理,让我们一起来看看吧。

    开始之前先推荐一个非常厉害的Ai人工智能工具,一键生成原创文章、方案、文案、工作计划、工作报告、论文、代码、作文、做题和对话答疑等等

    只需要输入关键词,就能返回你想要的内容,越精准,写出的就越详细,有微信小程序端、在线网页版、PC客户端

    官网:https://ai.de1919.com

    创意岭作为行业内优秀企业,服务客户遍布全国,网络营销相关业务请拨打175-8598-2043,或微信:1454722008

    本文目录:

    数据分析实战45讲百度云(数据分析实战45讲pdf)

    一、《数据科学实战手册数据科学实战手册(R+Python)》pdf下载在线阅读,求百度网盘云资源

    《数据科学实战手册数据科学实战手册(R+Python)》TonyOjeda(托尼·奥杰德)SeanPatrickMurphy(肖恩·派特里克·莫非)BenjaminBengfort(本杰明·班福特)电子书网盘下载免费在线阅读  

    链接:https://pan.baidu.com/s/1EqFNGdBQW46Nj8UdHnVLmA

    提取码:bb2u  

    书名:数据科学实战手册

    作者名:Tony Ojeda(托尼·奥杰德) / Sean Patrick Murphy(肖恩·派特里克·莫非) / Benjamin Bengfort(本杰明·班福特)

    豆瓣评分:6.2

    出版社:人民邮电出版社

    出版年份:2016-8-1

    页数:326

    内容介绍:

    这本书是基于R和Python的数据科学项目案例集锦,内容涵盖了基于数据科学的所有要素,包括数据采集、处理、清洗、分析、建模、可视化以及数据产品的搭建。案例包含了汽车数据分析、股票市场建模、社交网络分析、推荐系统、地理信息分析,以及Python代码的计算优化。通过手把手的案例解析,令读者知其然并知其所以然。业界的数据分析师、数据挖掘工程师、数据科学家都可以读一读。想要了解实际工作中如何用数据产生价值的在校学生,或者对数据科学感兴趣的人也值得一读。

    作者介绍:

    Tony Ojeda(托尼·奥杰德),华盛顿DC数据社区的联合创始人,一位经验丰富的数据科学家和企业家,他在佛罗里达国际大学获得金融硕士学位,并且在德保罗大学获得了MBA学位。        Sean Patrick Murphy(肖恩·派特里克·莫非),华盛顿DC数据社区的联合创始人,曾在约翰霍普金斯大学的应用物理实验室做了15年的高级科学家,他专注于机器学习、信号处理、高性能计算以及建模和模拟。现在他是旧金山、纽约和华盛顿DC多家公司的数据顾问。                        Benjamin Bengfort(本杰明·班福特),一位非常有经验的数据科学家和Python开发者。他曾在军方、业界和学术界工作过8年。他目前在马里兰大学派克学院攻读计算机博士学位,研究元识别和自然语言处理。他拥有北达科塔州立大学的计算机硕士学位,并是乔治城大学的客座教授。  

    二、《人人都是数据分析师Tableau应用实战》pdf下载在线阅读,求百度网盘云资源

    《人人都是数据分析师》(刘红阁)电子书网盘下载免费在线阅读

    链接:https://pan.baidu.com/s/1u70VFNpeeKW5dunEtMP9Tg

    密码:8rfi

    书名:人人都是数据分析师

    作者:刘红阁

    豆瓣评分:7.3

    出版社:人民邮电出版社

    出版年份:2015-11

    页数:344

    内容简介:

    本书基于Tableau 9.1 最新版本编写,详细介绍了Tableau 的数据连接与编辑、图形编辑与展示功能,包括数据连接与管理、基础与高级图形分析、地图分析、高级数据操作、基础统计分析、如何与R 集成进行高级分析、分析图表整合以及分析成果共享等主要内容。同时,书中以目前电力行业已有的监测、分析业务实践为基础,以丰富的实际案例贯穿始终,对各类方法、技术进行了详细说明,方便读者快速掌握数据分析方法。

    本书适用于互联网、银行证券、咨询审计、快消品、能源等行业数据分析用户以及媒体、网站等数据可视化用户。

    作者简介:

    刘红阁博士

    百度凤巢分析经理,专注于数据挖掘、机器学习、数据可视化等领域。

    王淑娟

    埃森哲咨询顾问,专注于电力行业运营咨询、数据分析及数据可视化等领域。

    温融冰

    埃森哲咨询经理,专注于企业价值管理、预算与绩效管理及数据分析等领域。

    三、《IBMSPSS数据分析与挖掘实战案例精粹》pdf下载在线阅读,求百度网盘云资源

    《IBM SPSS数据分析与挖掘实战案例精粹》(张文彤)电子书网盘下载免费在线阅读

    链接:https://pan.baidu.com/s/1JLuFxmTN_B4UzyVOH-7PkQ

    提取码:ue0n  

    书名:IBM SPSS数据分析与挖掘实战案例精粹

    作者:张文彤

    豆瓣评分:9.0

    出版社:清华大学出版社

    出版年份:2013-2-22

    页数:501

    内容简介:

    《IBM SPSS数据分析与挖掘实战案例精粹》以IBM SPSS Statistics 20.0和IBM SPSS Modeler 14.1为工具,提供了医疗、金融、保险、汽车、快速消费品、市场研究、互联网等多个行业的数据分析/挖掘案例,基于实战需求,详细讲解整个案例的完整分析过程,并将模型和软件的介绍融于案例讲解之中,使读者在阅读时能突破方法和工具的局限,真正聚集于对数据分析精髓的领悟。《IBM SPSS数据分析与挖掘实战案例精粹》所附光盘包括案例数据和分析程序/流文件,读者可完整重现全部的分析内容。

    四、决策树的原理及算法

    决策树基本上就是把我们以前的经验总结出来。我给你准备了一个打篮球的训练集。如果我们要出门打篮球,一般会根据“天气”、“温度”、“湿度”、“刮风”这几个条件来判断,最后得到结果:去打篮球?还是不去?

    上面这个图就是一棵典型的决策树。我们在做决策树的时候,会经历两个阶段:构造和剪枝。

    构造就是生成一棵完整的决策树。简单来说,构造的过程就是选择什么属性作为节点的过程,那么在构造过程中,会存在三种节点:

    根节点:就是树的最顶端,最开始的那个节点。在上图中,“天气”就是一个根节点;

    内部节点:就是树中间的那些节点,比如说“温度”、“湿度”、“刮风”;

    叶节点:就是树最底部的节点,也就是决策结果。

    剪枝就是给决策树瘦身,防止过拟合。分为“预剪枝”(Pre-Pruning)和“后剪枝”(Post-Pruning)。

    预剪枝是在决策树构造时就进行剪枝。方法是在构造的过程中对节点进行评估,如果对某个节点进行划分,在验证集中不能带来准确性的提升,那么对这个节点进行划分就没有意义,这时就会把当前节点作为叶节点,不对其进行划分。

    后剪枝就是在生成决策树之后再进行剪枝,通常会从决策树的叶节点开始,逐层向上对每个节点进行评估。如果剪掉这个节点子树,与保留该节点子树在分类准确性上差别不大,或者剪掉该节点子树,能在验证集中带来准确性的提升,那么就可以把该节点子树进行剪枝。

    1是欠拟合,3是过拟合,都会导致分类错误。

    造成过拟合的原因之一就是因为训练集中样本量较小。如果决策树选择的属性过多,构造出来的决策树一定能够“完美”地把训练集中的样本分类,但是这样就会把训练集中一些数据的特点当成所有数据的特点,但这个特点不一定是全部数据的特点,这就使得这个决策树在真实的数据分类中出现错误,也就是模型的“泛化能力”差。

    p(i|t) 代表了节点 t 为分类 i 的概率,其中 log2 为取以 2 为底的对数。这里我们不是来介绍公式的,而是说存在一种度量,它能帮我们反映出来这个信息的不确定度。当不确定性越大时,它所包含的信息量也就越大,信息熵也就越高。

    ID3 算法计算的是信息增益,信息增益指的就是划分可以带来纯度的提高,信息熵的下降。它的计算公式,是父亲节点的信息熵减去所有子节点的信息熵。

    公式中 D 是父亲节点,Di 是子节点,Gain(D,a) 中的 a 作为 D 节点的属性选择。

    因为 ID3 在计算的时候,倾向于选择取值多的属性。为了避免这个问题,C4.5 采用信息增益率的方式来选择属性。信息增益率 = 信息增益 / 属性熵,具体的计算公式这里省略。

    当属性有很多值的时候,相当于被划分成了许多份,虽然信息增益变大了,但是对于 C4.5 来说,属性熵也会变大,所以整体的信息增益率并不大。

    ID3 构造决策树的时候,容易产生过拟合的情况。在 C4.5 中,会在决策树构造之后采用悲观剪枝(PEP),这样可以提升决策树的泛化能力。

    悲观剪枝是后剪枝技术中的一种,通过递归估算每个内部节点的分类错误率,比较剪枝前后这个节点的分类错误率来决定是否对其进行剪枝。这种剪枝方法不再需要一个单独的测试数据集。

    C4.5 可以处理连续属性的情况,对连续的属性进行离散化的处理。比如打篮球存在的“湿度”属性,不按照“高、中”划分,而是按照湿度值进行计算,那么湿度取什么值都有可能。该怎么选择这个阈值呢,C4.5 选择具有最高信息增益的划分所对应的阈值。

    针对数据集不完整的情况,C4.5 也可以进行处理。

    暂无

    请你用下面的例子来模拟下决策树的流程,假设好苹果的数据如下,请用 ID3 算法来给出好苹果的决策树。

    「红」的信息增益为:1「大」的信息增益为:0

    因此选择「红」的作为根节点,「大」没有用,剪枝。

    数据分析实战45讲.17 丨决策树(上):要不要去打篮球?决策树来告诉你

    以上就是关于数据分析实战45讲百度云相关问题的回答。希望能帮到你,如有更多相关问题,您也可以联系我们的客服进行咨询,客服也会为您讲解更多精彩的知识和内容。


    推荐阅读:

    直播的时候为什么没有数据(直播的时候为什么没有数据了)

    短视频的相关数据(短视频的相关数据2021)

    抖音数据运营的工作内容(抖音数据运营的工作内容怎么写)

    公司业务推广文案(公司业务推广文案范文)

    上海园林景观设计报价(上海园林景观设计免费设计)