欢迎来到相识电子书!

标签:数据分析

  • 商务与经济统计

    作者:安德森,

    《商务与经济统计》(原书第9版)是美国辛辛那提大学的安德森、斯威尼教授和罗切斯特理工学院的威廉斯教授再度合作的结晶。本版在保留了以前版本的叙述风格和可读性的基础上,对内容进行了大幅的修订,新增了“决策分析”一章,调整了假设检验、区间估计及抽样等章节;增、加了150道取材于美国著名报刊实例的例题和练习;增加了6个案例,便于读者学以致用,练习管理报告的写作;并以Minitab和Excel的最新版本为准则,修订了各章附录中按步骤给出的用以生成计算机输出的程序。   应用性强是《商务与经济统计》(原书第9版)的最大特色。作者精心设计的“方法”、“应用”和“自测题”三种题型,起提示、总结和建议作用的“注释”,以及存储在《商务与经济统计》(原书第9版)附赠光盘中的数据集,无不体现出这一特色。 《商务与经济统计》(原书第9版)既可作为MBA、大学本科生和研究生的教材,也可供从事工商行政管理和经济分析的人士参考。
  • 数理统计与数据分析

    作者:[美] John A. Rice

    数理统计与数据分析(原书第3版),ISBN:9787111336464,作者:(美)里斯 著,田金方 译
  • 应用时间序列分析

    作者:何书元 编

    《应用时间序列分析》是高等院校"应用时间序列分析"课程的教材,较系统讲授应用时间序列分析的基本理论、方法以及应用。《应用时间序列分析》以时间序列的线性模型和平稳序列的谱分析为主线,介绍平稳时间序列的基本知识、常用的建模和预测方法,目的是使学生对时间序列的饿应用理论和方法有基本的了解,能够用时间序列的基本方法处理简单的时间序列数据。全书共分九章,内容包括:时间序列的分解、平稳序列、线性平稳序列、ARMA模型、时间序列的预报,加窗谱估计和多维平稳序列介绍。每节配有适量习题和部分计算机作业,可供教师和学生选用。时间序列分析是概率统计学科中应用性教强的一个分支,在金融经济、气象水文、信号处理、机械振动等众多领域有着广泛的应用。
  • 机器学习

    作者:周志华

    机器学习是计算机科学与人工智能的重要分支领域. 本书作为该领域的入门教材,在内容上尽可能涵盖机器学习基础知识的各方面。 为了使尽可能多的读者通过本书对机器学习有所了解, 作者试图尽可能少地使用数学知识. 然而, 少量的概率、统计、代数、优化、逻辑知识似乎不可避免. 因此, 本书更适合大学三年级以上的理工科本科生和研究生, 以及具有类似背景的对机器学 习感兴趣的人士. 为方便读者, 本书附录给出了一些相关数学基础知识简介. 全书共16 章,大致分为3 个部分:第1 部分(第1~3 章)介绍机器学习的基础知识;第2 部分(第4~10 章)讨论一些经典而常用的机器学习方法(决策树、神经网络、支持向量机、贝叶斯分类器、集成学习、聚类、降维与度量学习);第3 部分(第11~16 章)为进阶知识,内容涉及特征选择与稀疏学习、计算学习理论、半监督学习、概率图模型、规则学习以及强化学习等.前3章之外的后续各章均相对独立, 读者可根据自己的兴趣和时间情况选择使用. 根据课时情况, 一个学期的本科生课程可考虑讲授前9章或前10章; 研究生课程则不妨使用全书. 书中除第1章外, 每章都给出了十道习题. 有的习题是帮助读者巩固本章学习, 有的是为了引导读者扩展相关知识. 一学期的一般课程可使用这些习题, 再辅以两到三个针对具体数据集的大作业. 带星号的习题则有相当难度, 有些并无现成答案, 谨供富有进取心的读者启发思考. 本书可作为高等院校计算机、自动化及相关专业的本科生或研究生教材,也可供对机器学习感兴趣的研究人员和工程技术人员阅读参考。
  • 超级数字天才

    作者:伊恩·艾瑞斯

    有人在葡萄酒酿造出之前就能知道酒的品质好坏 有人在看到运动员比赛之前就能判断出其水平 有人在购买机票之前就能知道机票价格会涨还是跌他们有特异功能吗? 交友网站能测出什么样的异性适合你 亚马逊可以告诉你“和你类似的人还喜欢”的东西谷歌可以根据你的搜索把你最想看到的东西排列到最前面 他们如何做到的呢? 意到了吗?数据分析正在以我们从未想象过的方式影响着生活。本书中,作者向我们展示了当今最优秀、最出色的组织正在以闪电般的速度分析规模庞大的数据,以便更加准确地掌握人类的行为。这些人就是“超级数字天才”。从互联网站如谷歌、亚马逊能比你自己更了解自己的爱好,到医生的诊断和孩子的教育,再到政府、法院,这种新型的决策者逐渐掌控了世界。艾瑞斯以生动、轻松的方式向我们展示: 超级数字分析在商业、医院、法院等社会各个角落的崛起。 超级决策与经验直觉决策的对峙 超级数字分析崛起的原因 哪些人会因此受益,哪些人会因此受损 未来将属于谁 仅仅依靠直觉决策的时代已经一去不复返。任何想要走在时代前列的商业人士、消费者、学生都应该阅读这本书。
  • 统计建模与R软件

    作者:薛毅

    统计建模与R软件,ISBN:9787302143666,作者:薛毅
  • 统计思维

    作者:Allen B.Downey

    代码跑出来的概率统计问题; 程序员的概率统计开心辞典; 开放数据集,全代码攻略。 现实工作中,人们常被要求用数据说话。可是,数据自己是不能说话的,只有对它进行可靠分析和深入挖掘才能找到有价值的信息。概率统计是数据分析的通用语言,是大数据时代预测未来的根基。 站在时代浪尖上的程序员只有具备统计思维才能掌握数据分析的必杀技。本书正是一本概率统计方面的入门图书,但视角极为独特,折射出大数据浪潮的别样风景。作者将基本的概率统计知识融入Python编程,告诉你如何借助编写程序,用计算而非数学的方式实现统计分析。一个趣味实例贯穿全书,生动地讲解了数据分析的全过程:从采集数据和生成统计量,到识别模式和检验假设。一册在手,让你轻松掌握分布、概率论、可视化以及其他工具和概念。  编写测试代码深入理解概率论和统计学  运行实验检验统计行为特征,如生成服从各种分布的样本  通过模拟理解数学上艰涩的概念  学习贝叶斯估计等实用内容  用Python导入各种来源的数据  运用统计推断解决真实数据问题 《统计思维:程序员数学之概率统计》是一本以全新视角讲解概率统计的入门图书。抛开经典的数学分析,Downey 手把手教你用编程理解统计学。概率、分布、假设检验、贝叶斯估计、相关性等,每个主题都充满趣味性,经编程解释后变得更为清晰易懂。 本书研究数据主要来源于美国全国家庭成长调查(NSFG)与行为风险因素监测系统(BRFSS),数据源及解决方案的相关代码全部开放,具体章节列出了大量学习和进阶资料,方便读者参考。 Allen B. Downey是富兰克林欧林工程学院的计算机科学副教授,曾执教于韦尔斯利学院、科尔比学院和加州大学伯克利分校。他先后获麻省理工学院计算机科学硕士学位和加州大学伯克利分校计算机科学博士学位。Downey已出版十余本技术书,内容涉及Java、Python、C++、概率统计等,深受专业读者喜爱。他的最新Think系列书还有Think Complexity: Complexity Science and Computational Modeling、Think Python。
  • 人人都是数据分析师

    作者:刘红阁,王淑娟,温融冰

    本书基于Tableau 9.1 最新版本编写,详细介绍了Tableau 的数据连接与编辑、图形编辑与展示功能,包括数据连接与管理、基础与高级图形分析、地图分析、高级数据操作、基础统计分析、如何与R 集成进行高级分析、分析图表整合以及分析成果共享等主要内容。同时,书中以目前电力行业已有的监测、分析业务实践为基础,以丰富的实际案例贯穿始终,对各类方法、技术进行了详细说明,方便读者快速掌握数据分析方法。 本书适用于互联网、银行证券、咨询审计、快消品、能源等行业数据分析用户以及媒体、网站等数据可视化用户。
  • 图解网站分析(修订版)

    作者:[日] 小川卓

    本书以图配文,结合实例详细讲解了如何利用从网站上获取的各种数据了解网站的运营状况,如何从数据中攫取最有用的信息,如何优化站点,创造更大的网站价值。本书适合各类网站运营人员阅读。 第1 部分介绍了进行网站分析必备的基础知识。第2 部分详细讲解了如何明确网站现状,发现并改善网站的问题。第3 部分是关于流量获取和网站内渠道优化的问题。第4 部分介绍了一些更加先进的网站分析方法,其中详细讲解了如何分析现今风靡全球的社交媒体网站。
  • 调查研究中的统计分析法

    作者:柯惠新,沈浩

    有人说“统计不容易学”,那是没遇到一本好书。 作为一本本科生和研究生的教材,本书系统地介绍了常规专业调研工作中常用的统计分析方法及其基本原理,并就如何实际操作提供了具体说明和案例。这使得本书还可作为实务工具书、超越一般统计方法的教学参考书或专业著作。本书体现了作者多年的理论功底和丰富的实践经验,具有内容丰富、深入浅出、推理明晰和实用性强的特色。
  • 数字是靠不住的

    作者:[美] 查尔斯•塞费

    有人说,“世界上有三种谎言:谎话、弥天大谎与数字。” 你想过没有,人的标准体温真的是37摄氏度吗? 上个月的通货膨胀率真的只有5.8%吗? 房价真的会大幅下跌20%吗? 其实,数字不像你想的那么靠谱。 聪明人,别再被数字忽悠了! “使用手机会让罹患脑瘤的风险提高2倍”,“某公司员工的平均年薪为10万美金”,“上个月的通货膨胀率为5.8%”,“全球变暖冰山融化会使海平面上升20英尺” ……这样包含有数字的耸人听闻的新闻标题随处可见,如果你相信它们,那你就中了数字的圈套了! 在人们心中,数字天生就具备凌驾于个人主观意志之上的权威性,它一看就懂的特性,往往比长篇大论的文字更容易吸引我们的注意力。甚至无论某种说法多么不靠谱,只要它包含了貌似精确的数字,我们通常都会选择相信它。 跟其他炒作手段一样,数字可以被用来解除怀疑、蒙蔽记者、愚弄公众。于是,假专业人士、政客、企业、科研组织、学校、调研公司、新闻媒体之手,“数字的骗术”出现了,而且愈演愈烈。捏造的“原始”数据、伪造的统计结果和刻意歪曲事实的算法,以各种实实在在、令人担忧的方式影响着我们每个人的生活:不合格的新药上市,不合适的人选就任政府要职,不合理的新经济政策出台,被包装成低风险的投机产品,天价理发店,天价医疗费,等等。 数字的角色真假难辨,它既有说服力,又有欺骗性,到底我们要如何看穿数字?作者查尔斯•塞费引领我们拆穿波将金数字、成果包装、润色数字等唬人的数字伎俩,引用发生我们身边的新闻事件,教我们用普通人所具备的常识、生活经验与能力,去找出数字背后的真相,练就受用一生的数字透视力。 【媒体推荐】 读起来非常过瘾!它不仅仅是一本关于数字的书,更是一堂开阔视野的全民公开课! ——《纽约时报》书评版 作者向政府和媒体惯用的“数字伎俩”发起了猛烈的攻击。 ——《波士顿环球报》 书中形象生动的遣词造句、幽默风趣的写作风格,以及各种新奇的小花絮,引领读者拆穿波将金数字、成果包装、润色数字等唬人的数字伎俩,找出数字背后的真相,练就受用一生的数字透视力。 ——《费城问询报》 作者写了一本深有见地、观点独到的好书。 ——《达拉斯晨报》 一本让人变得更加清醒的著作。 ——《克科斯书评》 一本充满启迪意义的书,每个人都应该阅读这本书! ——《书目报》星级推荐
  • 鲜活的数据

    作者:[美] Nathan Yau

    在生活中,数据几乎无处不在,任我们取用。然而,同样的数据给人的感觉可能会千差万别:或冰冷枯燥,让人望而生畏、百思不解其意;或生动有趣,让人一目了然、豁然开朗。为了达到后一种效果,我们需要采用一种特别的方式来展示数据,来解释、分析和应用它。这就是数据可视化技术。Nath an Yau是这一创新领域的先锋。在本书中,他根据数据可视化的工作流程,先后介绍了如何获取数据,将数据格式化,用可视化工具(如R)生成图表,以及在图形编辑软件(如Illustrator)中修改以使图表达到最佳效果。本书介绍了数十种方法(如柱形图、饼图、折线图和散点图等),以创造性的视觉方式生动讲述了有关数据的故事。
  • Mining the Social Web

    作者:Matthew A. Russell

    Popular social networks such as Facebook, Twitter, and LinkedIn generate a tremendous amount of valuable social data. Who's talking to whom? What are they talking about? How often are they talking? Where are they located? This concise and practical book shows you how to answer these types of questions and more. Each chapter presents a soup-to-nuts approach that combines popular social web data, analysis techniques, and visualization to help you find the needles in the social haystack you've been looking for -- and some you didn't know were there. With Mining the Social Web, intermediate-to-advanced Python programmers will learn how to collect and analyze social data in way that lends itself to hacking as well as more industrial-strength analysis. The book is highly readable from cover to cover and tells a coherent story, but you can go straight to chapters of interest if you want to focus on a specific topic. Get a concise and straightforward synopsis of the social web landscape so you know which 20% of the space to spend 80% of your time on Use easily adaptable scripts hosted on GitHub to harvest data from popular social network APIs including Twitter, Facebook, and LinkedIn Learn how to slice and dice social web data with easy-to-use Python tools, and apply more advanced mining techniques such as TF-IDF, cosine similarity, collocation analysis, document summarization, and clique detection Build interactive visualizations with easily adaptable web technologies built upon HTML5 and JavaScript toolkits This book is still in progress, but you can get going on this technology through our Rough Cuts edition, which lets you read the manuscript as it's being written, either online or via PDF. via http://oreilly.com/catalog/9781449394844/ Amazon: http://www.amazon.com/Mining-Social-Web-Finding-Haystack/dp/1449388345/
  • 内容分析法

    作者:(美)丹尼尔·里夫//斯蒂文·赖斯//弗

    内容简介 《内容分析法:媒介信息量化研究技巧(第2版)》主要内容简介:内容分析是媒介以及媒介经济研究中一种非常重要的方法,是一种对传播内容进行客观、系统和定量描述的研究方法,具有客观、方便、经济等优点。《内容分析法:媒介信息量化研究技巧(第2版)》是继1981年Krippendorf的经典专著《内容分析》之后又一本关于内容分析的书。该书提供了系统全面的内容分析研究的操作指南,深入分析了内容分析中的各种常见问题,如测量、抽样、信度、效度和数据分析中的各种技术,并附以大量案例,方便初学者学习和运用。《内容分析法:媒介信息量化研究技巧(第2版)》逻辑清晰,言简意赅,按照内容分析的步骤顺次介绍,操作性强,具有很强的实际应用价值。 《内容分析法:媒介信息量化研究技巧(第2版)》可以作为了解内容分析法的首选读物,是传播学、政治学和其他社会科学、行为科学研究中不可缺少的参考资料。
  • Dataclysm

    作者:Christian Rudder

  • 纵贯数据分析

    作者:诺瓦尔.D.格伦

    《纵贯数据分析》由四种讨论纵贯研究的小册子组成,分别是《世代分析》、《纵向研究》、《分析重复调查数据》以及《多元时间序列模型》。纵贯研究相较截面研究而言,其最大的优点是可以描述事物的发展过程和变化,并从这种变化中考察社会发展趋势。 《世代分析》介绍了检验数据时常用的一项分析方法,即世代研究。这本小册子分别讨论了世代研究的目的、定义、策略等问题,并结合实例,说明了该研究的具体应用和数据选择问题。《纵向研究》讨论了纵向研究的目的、数据收集、研究对象与研究模型等问题,能为研究发展趋势、历史变迁或动态过程的研究者提供帮助。《分析重复调查数据》指出,重复调查是从对个人层次的微观研究转向对整体层次的宏观研究,并讨论了重复调查的基本用途,即描述、分解、解释总体趋势、对个别参数变化进行估计。《多元时间序列模型》概述了多元时间序列分析中的许多高级方法,包括同时方程模型、向量自回归模型、格兰杰因果检验、冲击反应分析等。作者通过介绍这些方法,预测并描述了变量之间内生的动态关系。
  • 统计学方法与数据分析引论(上下)

    作者:[美] R.L.奥特(R.Lyamn O

    本书据Duxbury Press第5版译出。内容分为8个部分,共20章,分上下两册。各章均有大量习题。作者使用实例来引入主题,并把统计概念和实际问题联系在一起进行讲解,介绍了统计数据的收集和分析过程,讨论了如何解释数据分析的结果,并专门讲述了如何写数据分析报告。
  • 社会统计的数学基础

    作者:约翰·福克斯

    《社会统计的数学基础》是一本集中讨论社会科学研究中的数理基础知识的小册子,其内容涵盖了许多数学和统计学中容易被人忽视却又至关重要的话题,如矩阵、线性代数、积分、概率理论及统计分布等。全书首先介绍了有关矩阵、线性代数和几何向量的基本概念,然后简单回复了一些基础数学,简述了微积分入门知识,接着对应用统计学中广泛运用的概率及统计推理进行了概述,最后阐述了线性最小二乘法回归这一统计方法的发展过程。《社会统计的数学基础》不仅可以协助研究生及社会统计工作者进行研究,而且是对定量方法研究的重要补充。
  • 统计学(第三版)

    作者:吴喜之 编著

    《统计学:从数据到结论(第3版)》内容简介:不知读者们是否意识到,统计已经渗入到人们的社会、生活、工作等各个领域。每天新闻媒介报道的各个方面都离不开各种统计数据和各种分析与预测。人们可能对于这些统计内容觉得习以为常,也可能会有一些好奇或神秘感。由于国情不同,统计的地位与人们对统计的看法也不同。在发达国家,一般民众觉得统计学和数学类似,是一门高不可攀但极易找到满意工作的学问。在中国,又有一些人认为统计就是处理政府报表的职业。但自从中国向世界开放之后,越来越明确的一点是,没有什么学科或领域能够真正离开统计。
  • Super Crunchers

    作者:Ian Ayres

    Why would a casino try and stop you from losing? How can a mathematical formula find your future spouse? Would you know if a statistical analysis blackballed you from a job you wanted? Today, number crunching affects your life in ways you might never imagine. In this lively and groundbreaking new book, economist Ian Ayres shows how today's best and brightest organizations are analyzing massive databases at lightening speed to provide greater insights into human behavior. They are the Super Crunchers. From internet sites like Google and Amazon that know your tastes better than you do, to a physician's diagnosis and your child's education, to boardrooms and government agencies, this new breed of decision makers are calling the shots. And they are delivering staggeringly accurate results. How can a football coach evaluate a player without ever seeing him play? Want to know whether the price of an airline ticket will go up or down before you buy? How can a formula outpredict wine experts in determining the best vintages? Super crunchers have the answers. In this brave new world of equation versus expertise, Ayres shows us the benefits and risks, who loses and who wins, and how super crunching can be used to help, not manipulate us. Gone are the days of solely relying on intuition to make decisions. No businessperson, consumer, or student who wants to stay ahead of the curve should make another keystroke without reading Super Crunchers.