欢迎来到相识电子书!

标签:数据分析

  • R Cookbook

    作者:Paul Teetor

    With more than 200 practical recipes, this book helps you perform data analysis with R quickly and efficiently. The R language provides everything you need to do statistical work, but its structure can be difficult to master. This collection of concise, task-oriented recipes makes you productive with R immediately, with solutions ranging from basic tasks to input and output, general statistics, graphics, and linear regression. Each recipe addresses a specific problem, with a discussion that explains the solution and offers insight into how it works. If you're a beginner, R Cookbook will help get you started. If you're an experienced data programmer, it will jog your memory and expand your horizons. You'll get the job done faster and learn more about R in the process. * Create vectors, handle variables, and perform other basic functions * Input and output data * Tackle data structures such as matrices, lists, factors, and data frames * Work with probability, probability distributions, and random variables * Calculate statistics and confidence intervals, and perform statistical tests * Create a variety of graphic displays * Build statistical models with linear regressions and analysis of variance (ANOVA) * Explore advanced statistical techniques, such as finding clusters in your data "Wonderfully readable, R Cookbook serves not only as a solutions manual of sorts, but as a truly enjoyable way to explore the R language-one practical example at a time." -Jeffrey Ryan, software consultant and R package author
  • 社会科学定量研究的变量类型、方法选择及范例解析

    作者:蓝石

    《社会科学定量研究的变量类型、方法选择及范例解析》告诉读者:在明确了研究主题、对象和问题之后,如何根据自变量和因变量的类型,迅速地选择和使用恰当的统计分析方法。《社会科学定量研究的变量类型、方法选择及范例解析》对每一种统计分析方法均提供范例,并逐一解释统计分析图表中数据的含义,按照国际通行的学术规范(APA格式)用中英文两种语言陈述研究问题和研究结论,力图帮助研究者以像“完成填空题”一样简便的方式写作出符合国际规范的学术论文。
  • 深入浅出数据分析

    作者:Michael Milton

    《深入浅出数据分析》以类似“章回小说”的活泼形式,生动地向读者展现优秀的数据分析人员应知应会的技术:数据分析基本步骤、实验方法、最优化方法、假设检验方法、贝叶斯统计方法、主观概率法、启发法、直方图法、回归法、误差处理、相关数据库、数据整理技巧;正文以后,意犹未尽地以三篇附录介绍数据分析十大要务、R工具及ToolPak工具,在充分展现目标知识以外,为读者搭建了走向深入研究的桥梁。 本书构思跌宕起伏,行文妙趣横生,无论是职场老手,还是业界新人,无论是字斟句酌,还是信手翻阅,相信都能跟着文字在职场中走上几回,去体味数据分析领域的乐趣与挑战。
  • Discovering Statistics Using SPSS

    作者:Andy Field

    'In this brilliant new edition, Andy Field has introduced important new introductory material on statistics that the student will need and was missing at least in the first edition. This book is the best blend that I know of a textbook in statistics and a manual on SPSS. It is a balanced composite of both topics, using SPSS to illustrate important statistical material and, through graphics, to make visible important approaches to data analysis. There are many places in the book where I had to laugh, and that's saying a lot for a book on statistics. His excellent style engages the reader and makes reading about statistics fun' - David C Howell, Professor Emeritus, University of Vermont, USA. This award-winning text, now fully updated with SPSS Statistics, is the only book on statistics that you will need! Fully revised and restructured, this new edition is even more accessible as it now takes students through from introductory to advanced level concepts, all the while grounding knowledge through the use of SPSS Statistics. Andy Field's humorous and self-deprecating style and the book's host of characters make the journey entertaining as well as educational. While still providing a very comprehensive collection of statistical methods, tests and procedures, and packed with examples and self-assessment tests to reinforce knowledge, the new edition now also offers: a more gentle introduction to basic-level concepts and methods for beginners; new textbook features to make the book more user-friendly for those learning about more advanced concepts, encouraging 'critical thinking'; a brand new, full-colour design, making it easy for students to navigate between topics, and to understand how to use the latest version of SPSS Statistics; both 'real world' (the bizarre and the wonderful) and invented examples that illustrate the concepts and make the techniques come alive for students; an additional chapter on multilevel modelling for advanced-level students; and, reinforced binding to make the book easier to handle at a computer workstation. The book also includes access to a brand new and improved companion Website, bursting with features including: animated 'SPSS walk-through' videos clearly demonstrating how to use the latest SPSS Statistics modules; self-marking multiple choice questions; data sets for psychology, business and management and health sciences; a flash-card glossary for testing knowledge of key concepts; and, access to support material from SAGE study skills books. Statistics lecturers are also provided with a whole range of resources and teaching aids, including: the test bank; over 300 multiple-choice questions ready to upload to WebCT, Blackboard or other virtual learning environments; charts and diagrams in electronic format for inclusion in lecture slides; and, PowerPoint slides written by the author to accompany chapters of the text.
  • 陶哲軒教你聰明解數學

    作者:陶哲軒

    陶哲軒是華裔數學天才、目前數學界響噹噹的人物,也是極受學生歡迎的UCLA數學教授。《陶哲軒教你聰明解數學》寫於15歲,多年來對許多數學資優生、數學家和教育工作者帶來很大啟發。15年後陶哲軒30歲,應英國劍橋大學出版社之邀進行增補與修訂,再次出版。 這是一本愛好數學的中學生談怎樣學數學、解數學題的書。陶哲軒用中學生的語言講數學,優游於數論、代數、歐幾里得與解析幾何等數學領域,處處可見對他對數學之美的讚嘆與樂趣。他舉出一個個實際例子,教導大家從了解問題開始,進而分析問題的本質、討論各種解法的優劣、剔除不合適的方法,最後使解題技巧逐漸浮現,並提供許多有趣的練習題。 書中特別著重解題過程的思考,藉由分享自己的經驗、觀察和思考問題的角度,帶領大家一起享受解題的樂趣,無論是中學生與老師、數學系學生或愛好數學的人,都可得到很大的收穫。
  • 社会网络分析

    作者:[美] 戴维·诺克,[美] 杨松

    本书作为一种跨学科的研究方法,社会网络分析在近几十年越来越受到公众和学界的青睐.本书采用实际的社会网络研究问题来解释相关的概念和方法,广泛引用例子,用简洁的语言精确介绍了这一应用广泛的研究方法.在介绍有关关系数据和网络概念的基础上,重点关注数据收集问题,
  • Big Data

    作者:Viktor Mayer-Schönbe

    National Bestseller “No other book offers such an accessible and balanced tour of the many benefits and downsides of our continuing infatuation with data.”—Wall Street Journal “What I’m certain about is that Big Data will be the defining text in the discussion for some time to come.”—Forbes.com It seems like “big data” is in the news every day, with new examples of how powerful algorithms are teasing out the hidden connections between seemingly unrelated things. Whether it is used by the NSA to fight terrorism or by online retailers to predict customers’ buying patterns, big data is a revolution occurring around us, in the process of forever changing economics, science, culture, and the very way we think. But it also poses new threats, from the end of privacy as we know it to the prospect of being penalized for things we haven’t even done yet, based on big data’s ability to predict our future behavior. Big Data is the first big book about this earthshaking subject, with two leading experts explaining what big data is, how it will change our lives, and what we can do to protect ourselves from its hazards.
  • 多变量分析

    作者:林震岩

    《多变量分析:SPSS的操作与应用》所介绍的多变量分析技术,除了SPSS/Base功能外,也针对Advanced等模块的功能加以说明,如平均数检定、一般线性模式、因素分析、集群分析、区别分析、回归分析等,并探讨一般书上少见的多元尺度法、TREE、Logistic、规则相关分析、联合分析、时间数列分析等进阶的多变量分析。此外,有关SPSS的外挂程序,包括结构方程模型AMOS与数据探勘Clementine等也多有着墨。
  • 机器学习

    作者:(美)Drew Conway,John

    这本书为机器学习技术提供了一些非常棒的案例研究。它并不想成为一本关于机器学习的工具书或者理论书籍,它注重的是一个学习的过程,因而对于任何有一些编程背景和定量思维的人来说,它都是不错的选择。 ——Max Shron OkCupid 机器学习是计算机科学和人工智能中非常重要的一个研究领域,近年来,机器学习不但在计算机科学的众多领域中大显身手,而且成为一些交叉学科的重要支撑技术。本书比较全面系统地介绍了机器学习的方法和技术,不仅详细阐述了许多经典的学习方法,还讨论了一些有生命力的新理论、新方法。 全书案例既有分类问题,也有回归问题;既包含监督学习,也涵盖无监督学习。本书讨论的案例从分类讲到回归,然后讨论了聚类、降维、最优化问题等。这些案例包括分类:垃圾邮件识别,排序:智能收件箱,回归模型:预测网页访问量,正则化:文本回归,最优化:密码破解,无监督学习:构建股票市场指数,空间相似度:用投票记录对美国参议员聚类,推荐系统:给用户推荐R语言包,社交网络分析:在Twitter上感兴趣的人,模型比较:给你的问题找到最佳算法。各章对原理的叙述力求概念清晰、表达准确,突出理论联系实际,富有启发性,易于理解。在探索这些案例的过程中用到的基本工具就是R统计编程语言。R语言非常适合用于机器学习的案例研究,因为它是一种用于数据分析的高水平、功能性脚本语言。 本书主要内容: ·开发一个朴素贝叶斯分类器,仅仅根据邮件的文本信息来判断这封邮件是否是垃圾邮件; ·使用线性回归来预测互联网排名前1000网站的PV; ·利用文本回归理解图书中词与词之间的关系; ·通过尝试破译一个简单的密码来学习优化技术; ·利用无监督学习构建股票市场指数,用于衡量整体市场行情的好坏; ·根据美国参议院的投票情况,从统计学的角度对美国参议员聚类; ·通过K近邻算法构建向用户推荐R语言包; ·利用Twitter数据来构建一个“你可能感兴趣的人”的推荐系统; ·模型比较:给你的问题找到最佳算法。
  • 网站分析实战

    作者:王彦平 吴盛峰

    《网站分析实战:如何以数据驱动决策,提升网站价值》由王彦平、吴盛峰著。目前,越来越多的网站开始重视数据,并期望从中发现新的机会,不管你是做网络营销、互联网产品设计、电子商务运营、个人站点运营维护,我们都希望从数据中寻找有价值的结论,并且指导公司管理层的决策,最终创造更大的网站价值。《网站分析实战:如何以数据驱动决策,提升网站价值》以通俗易懂的方式来讲解网站分析所需掌握的知识,剖析日常工作中遇到的问题,并且配合大量的实战案例的讲解。
  • SPSS其实很简单

    作者:罗纳德·D·约克奇|译者:刘超//吴铮

    《SPSS其实很简单》力图打破这种局面:从实际问题入手,剥离出需要研究的问题,帮助读者理解如何选择恰当的统计方法。软件的发展,使统计从专业方法变成大众的游戏。只要输入格式无误的数据,就能得到漂亮的结果,然而最重要的问题一一方法的选择以及结果的解读却被忽略。从使用SPSS生成变量开始,到最终实现撰写APA(美国心理协会)格式的结果,提供SPSS每一操作步骤的截图,并对输出结果进行解读,帮助读者在面对大量输出结果时,快速有效地找到所需部分,并做出合理分析。总结统计方法使用的前提假设和利用SPSS进行各种统计分析的程序步骤,带领读者理解统计方法的实质。
  • 最简单的图形与最复杂的信息

    作者:[美]黄慧敏(Dona M.Wong)

    [内容简介] ★在当今这个数据驱动、信息大爆炸的时代,我们需要懂得如何利用图形语言清晰、高效地表达自己。可是,我们应该如何选择反映信息的最佳图形?如何利用黑白两色令图形“多彩”?如何让“相貌平平”的图表升级为“才华出众”的图表?如何建立自己的视觉思维,以找到最有力的方式在最短的时间内打动决策者? ★在本书中,黄慧敏将数据分析和图形制作巧妙地结合在一起,清晰、有效地告诉我们如何将纷繁复杂的图形和陈述报告变得既简单又有表现力,实操性很强,且易于理解。 [编辑推荐] ★这是《华尔街日报》与作者第一次公开这种专业秘诀,出版后破天荒打进美国亚马逊金融投资类第一名、《纽约时报》商业类排行榜第九名。 ★作者是数据可视化权威爱德华•塔夫特(Edward Tufte)的学生,拥有耶鲁大学美术硕士学位,处理财金图表经验逾20年。 ★麦肯锡公司形象化沟通主管、纽约联邦储备银行执行副总裁、穆迪经济学家网创始人兼首席经济学家、牛津大学赛德商学院长、《华尔街日报》前总编辑等,对于黄慧敏非凡的资料解释能力、视觉呈现能力,都赞不绝口。 ★湛庐文化出品。
  • R语言与统计分析

    作者:汤银才

    《R语言与统计分析》以数据的常用统计分析方法为基础,在简明扼要地阐述统计学基本概念、基本思想与基本方法的基础上,讲述与之相对应的R函数的实现,并通过具体的例子说明统计问题求解的过程。《R语言与统计分析》注重统计的思想性、方法的实用性和计算的可操作性。在内容的安排上不仅包含了基础统计分析中的探索性数据分析、参数估计与假设检验,还包括了非参数统计分析的常用方法、多元统计分析方法及贝叶斯统计分析方法。每一部分都通过具体例子重点讲述解决问题的思想、方法和在R中的实现过程。
  • MATLAB for Behavioral Scientists

    作者:David A. Rosenbaum

    "MATLAB for Behavioral Scientists" is a tremendously valuable textbook that walks behavioral scientists through the computer programming process, using terms that are relevant to their concerns and appreciating their special programming needs.
  • 漫画统计学

    作者:[日] 高桥信

    你是不是曾经被统计学里奇怪的名词和繁琐的计算所困?不知道在说什么,也不知道该从哪里人手进行学习?那么,这本书太适合你了。这是世界上最简单的统计学教科书,它通过漫画式的情境说明,让你边看故事边学知识,每读完一篇就能理解一个概念,每篇末还附有文字说明,只要跟着这些简单的习题进行操练,你将能在最短的时间内成为统计学达人! 有趣的故事情节、时尚的漫画人物造型、细致的内容讲解定能给你留下深刻的印象,让你看过忘不了。不论你是学生、上班族或是已经有一家已经属于自己的公司的老板,活学活用统计学,定会为你的学习与企业发展增添更多的便利…… ------- 目录 序章 令人悸动的统计学. 第1章 确认数据种类 1.分类数据和数值数据 2.分类数据注意事项举例 3.实务中“非常有趣”-“非常无趣”的运用 例题和解答 总整理 第2章 掌握数据整体的状态(数值数据篇) 1.次数分布表和直方图 2.平均数 3.中位数 4.标准差 5.次数分布表的组距 6.推断统计学和描述统计学 例题和解答 总整理 第3章 掌握数据整体的状态(分类数据篇) 1.次数分布表
  • 爱上统计学

    作者:[美] 尼尔·J. 萨尔金德

    《爱上统计学(中译本)(第3版)》非常清晰地阐明了整个抽样调查、统计检验的思想和逻辑,特别是书中总结的一个表:在什么时候需要用到什么样的统计技术,对刚入门的人特别有用。比如什么时候用独立样本T检验,什么时候用非独立样本T检验等。 《爱上统计学(中译本)(第3版)》的写作语言易懂, 鲜有大片大片的数学公式出现,把道理都讲得很清楚。
  • 利用Python进行数据分析

    作者:Wes McKinney

    【名人推荐】 “科学计算和数据分析社区已经等待这本书很多年了:大量具体的实践建议,以及大量综合应用方法。本书在未来几年里肯定会成为Python领域中技术计算的权威指南。” ——Fernando Pérez 加州大学伯克利分校 研究科学家, IPython的创始人之一 【内容简介】 还在苦苦寻觅用Python控制、处理、整理、分析结构化数据的完整课程?本书含有大量的实践案例,你将学会如何利用各种Python库(包括NumPy、pandas、matplotlib以及IPython等)高效地解决各式各样的数据分析问题。 由于作者Wes McKinney是pandas库的主要作者,所以本书也可以作为利用Python实现数据密集型应用的科学计算实践指南。本书适合刚刚接触Python的分析人员以及刚刚接触科学计算的Python程序员。 •将IPython这个交互式Shell作为你的首要开发环境。 •学习NumPy(Numerical Python)的基础和高级知识。 •从pandas库的数据分析工具开始。 •利用高性能工具对数据进行加载、清理、转换、合并以及重塑。 •利用matplotlib创建散点图以及静态或交互式的可视化结果。 •利用pandas的groupby功能对数据集进行切片、切块和汇总操作。 •处理各种各样的时间序列数据。 •通过详细的案例学习如何解决Web分析、社会科学、金融学以及经•济学等领域的问题。
  • Handbook of Functional MRI Data Analysis

    作者:Russell A. Poldrack,

    Functional magnetic resonance imaging (fMRI) has become the most popular method for imaging brain function. Handbook of Functional MRI Data Analysis provides a comprehensive and practical introduction to the methods used for fMRI data analysis. Using minimal jargon, this book explains the concepts behind processing fMRI data, focusing on the techniques that are most commonly used in the field. This book provides background about the methods employed by common data analysis packages including FSL, SPM and AFNI. Some of the newest cutting-edge techniques, including pattern classification analysis, connectivity modeling and resting state network analysis, are also discussed. Readers of this book, whether newcomers to the field or experienced researchers, will obtain a deep and effective knowledge of how to employ fMRI analysis to ask scientific questions and become more sophisticated users of fMRI analysis software.
  • 行为统计学基础

    作者:理查德·P·鲁尼

    对统计学的学习来说,最主要的是掌握统计思想,理解相关的统计原理,能够根据实际情境提出解决问题的一个或几个合适方案,并懂得选择其中的最优。因此适合非统计专业学生的统计学理想教材,应该是能兼顾专业特点、深入浅出阐述统计学基本原理和方法,同时在轻快风趣的讲述中激发读者的学习兴趣,培养统计思维,并辅之例题分析,对使用中容易发生的错误加以提醒,切实提高学生应用统计方法分析解决实际问题的能力。《行为统计学基础》(第9版)正是这样一本非常出色的教材。本书写作风格轻松活泼,语言流畅易懂,数学深入浅出,读者在学习和阅读时不会感到枯燥乏味。 本书是心理和教育统计学方面的一本优秀的基础教材,对于在社会科学领域中的广大研究人员来说,也是一本不可多得的重要参考书
  • 爱上统计学

    作者:[美] 尼尔·J. 萨尔金德

    在经过不断地摸索以及少量成功大量失败的尝试之后,我已经学会了以某种方式教授统计学,我和我的许多学生认为这种方式不会让人感到害怕,同时能够传递大量的信息。 通过这本书可以了解基础统计学的范围并学习所有应该掌握的信息,也可以了解整理和分析数据的基本思路和最常用的技术。本书理论部分有一些,但是很少,数学证明或特定数学程式的合理性讨论也很少。 为什么《爱上统计学》这本书不增加更多理论内容?很简单,初学者不需要。这并不是我认为理论不重要,而是在学习的这个阶段,我想提供的是我认为通过一定程度的努力可以理解和掌握的资料,同时又不会让你感到害怕而放弃将来选修更多的课程。我和其他老师都希望你能成功。 因此,如果你想详细了解方差分析中F值的含义,可以从Sage出版社查找其他的好书(我愿意向你推荐书目)。但是如果你想了解统计学为什么以及如何为你所用,这本书很合适。这本书能帮助你理解在专业文章中看到的资料,解释许多统计分析结果的意义,并且能教你运用基本的统计过程。 --- 第I部分 耶!我喜欢统计学 1 统计学还是虐待学?由你决定 为什么学习统计学 统计学简史 统计学:是什么(或不是什么) 我在统计学课堂上做什么 使用这本书的十种方式(同时也在学统计学!) 关于那些符号 难度指数 第Ⅱ部分 西格玛·弗洛伊德和描述统计 2 必须完成的功课——计算和理解平均数 计算均值 需要记忆的内容 计算中位数 需要记忆的内容 计算众数 何时用什么 应用计算机并计算描述统计值 3 性别差异——理解变异性 为什么理解变异性很重要 计算极差 计算标准差 需要记忆的内容 计算方差 使用计算机计算变异性量数 4 一幅图真的相当于千言万语 为什么要用图表说明数据 好图表的十个方面(少贪新,多练习) 首先是建立频数分布 图形密度:建立直方图 扁平和细长的频数分布 其他的图表数据的绝妙方法 使用计算机图示数据 5 冰淇淋和犯罪——计算相关系数 相关系数到底是什么 需要记忆的内容 计算简单相关系数 理解相关系数的含义 决定性的努力:相关系数平方 其他重要的相关 使用计算机计算相关系数 第Ⅲ部分 抓住那些有趣又有利的机会 6 你和假设:检验你的问题 也许你想成为一个科学家 零假设 研究假设 好假设的标准是什么 7 你的曲线是正态的吗——概率和概率的重要性 为什么学习概率 正态曲线(或钟型曲线) 我们最中意的标准值:z值 使用计算机计算z值 第Ⅳ部分 显著性差异——使用推论统计 8 显著性的显著——对你我来说意味着什么 显著性的概念 显著性与意义 推论统计介绍 显著性检验介绍 9 两个群体的t检验——不同群体的均值检验 独立样本t检验介绍 计算检验统计量 特殊效果:差异是真实的吗 使用计算机进行t检验 10 两个群体的t检验——两个相关群体的均值检验 …… 第V部分 你得了解和记忆的内容 附录A 30分钟SPSS教学 附录B 数据表 附录C 数据集