欢迎来到相识电子书!

标签:大数据

  • 数据挖掘与数据化运营实战

    作者:卢辉

    《数据挖掘与数据化运营实战:思路、方法、技巧与应用》是目前有关数据挖掘在数据化运营实践领域比较全面和系统的著作,也是诸多数据挖掘书籍中为数不多的穿插大量真实的实践应用案例和场景的著作,更是创造性地针对数据化运营中不同分析挖掘课题类型,推出一一对应的分析思路集锦和相应的分析技巧集成,为读者提供“菜单化”实战锦囊的著作。作者结合自己数据化运营实践中大量的项目经验,用通俗易懂的“非技术”语言和大量活泼生动的案例,围绕数据分析挖掘中的思路、方法、技巧与应用,全方位整理、总结、分享,帮助读者深刻领会和掌握“以业务为核心,以思路为重点,以分析技术为辅佐”的数据挖掘实践应用宝典。 《数据挖掘与数据化运营实战:思路、方法、技巧与应用》共19章,分为三个部分:基础篇(第1~4章)系统介绍了数据分析挖掘和数据化运营的相关背景、数据化运营中“协调配合”的核心,以及实践中常见分析项目类型;实战篇(第6~13章)主要介绍实践中常见的分析挖掘技术的实用技巧,并对大量的实践案例进行了全程分享展示;思想意识篇(第5章,第14~19章)主要是有关数据分析师的责任、意识、思维的培养和提升的总结和探索,以及一些有效的项目质控制度和经典的方法论介绍。 海报:
  • Mahout实战

    作者:[美] Sean Owen,[美] Ro

    通过收集数据来学习和演进的计算机系统威力无穷。Mahout作为Apache的开源机器学习项目,把推荐系统、分类和聚类等领域的核心算法浓缩到了可扩展的现成的库中。使用Mahout,你可以立即在自己的项目中应用亚马逊、Netflix及其他互联网公司所采用的机器学习技术。 本书出自Mahout核心成员之手,得到Apache官方推荐,权威性毋庸置疑。作者凭借多年实战经验,为读者展现了丰富的应用案例,并细致地介绍了Mahout的解决之道。本书还重点讨论了可扩展性问题,介绍了如何利用Apache Hadoop框架应对大数据的挑战。 本书内容: • 利用分组数据实现个性化推荐; • 寻找数据中的逻辑簇; • 通过即时分类实现过滤与调优。
  • IBM SPSS数据分析与挖掘实战案例精粹

    作者:张文彤,钟云飞

    《IBM SPSS数据分析与挖掘实战案例精粹》以IBM SPSS Statistics 20.0和IBM SPSS Modeler 14.1为工具,提供了医疗、金融、保险、汽车、快速消费品、市场研究、互联网等多个行业的数据分析/挖掘案例,基于实战需求,详细讲解整个案例的完整分析过程,并将模型和软件的介绍融于案例讲解之中,使读者在阅读时能突破方法和工具的局限,真正聚集于对数据分析精髓的领悟。《IBM SPSS数据分析与挖掘实战案例精粹》所附光盘包括案例数据和分析程序/流文件,读者可完整重现全部的分析内容。
  • 大数据

    作者:Anand Rajaraman,Jeff

    大数据:互联网大规模数据挖掘与分布式处理,ISBN:9787115291318,作者:(美) Anand Rajaraman (美) Jeffrey David Ullman 著,王 斌 译
  • 全面回忆

    作者:[美]戈登·贝尔,[美]吉姆·戈梅尔

    现代“小型机之父”戈登·贝尔和微软研究院研究员吉姆·戈梅尔通过“我的数字生活”(MyLifeBits)项目,带领我们进行了一场关于数字化记录生活的美妙之旅,为我们揭示了在“信息在你指尖”的时代,全面数字化记录我们的所见所闻和所作所为如何完美呈现我们生命中的风景,以实现真正的“永生”。 那么,在”全面回忆“时代,我们该如何实时监测自己的健康状态,使自己的所有健康信息综合起来,为治疗和保健所用?我们该如何将“数字记忆”应用于工作领域,建立新式的数字记忆型企业,实现事业的巨大成功?我们又该如何在“全面回忆”的背景下,掀起一场教育革命,发掘科学研究的第四范式——数据密集型科学发现,成就最高效的学习?而我们又该如何应用这些个人大数据信息,成就自己的数字化人生? “全面记忆”和云端存储的大量信息,将彻底改变人们工作和学习的方式,人们的创造力将大大提高,学习境界也将明显提升。全面完整的健康信息,将为我们的健康生活保驾护航,“数字护士”将颠覆现有的医疗模式。“数字记忆”有助于长久保持与亲人之间的情感,让我们的亲人真正实现“永生”。“全面记忆“将催生一个新的产业和无数创业家,而工作、健康和学习的数字记忆必将引发一场革命!
  • Big Data

    作者:Kenneth Cukier,Vikto

    Since Aristotle, we have fought to understand the causes behind everything. But this ideology is fading. In the age of big data, we can crunch an incomprehensible amount of information, providing us with invaluable insights about the what rather than the why. We're just starting to reap the benefits: tracking vital signs to foresee deadly infections, predicting building fires, anticipating the best moment to buy a plane ticket, seeing inflation in real time and monitoring social media in order to identify trends. But there is a dark side to big data. Will it be machines, rather than people, that make the decisions? How do you regulate an algorithm? What will happen to privacy? Will individuals be punished for acts they have yet to commit? In this groundbreaking and fascinating book, two of the world's most-respected data experts reveal the reality of a big data world and outline clear and actionable steps that will equip the reader with the tools needed for this next phase of human evolution.
  • 大数据

    作者:郭晓科 编

    《大数据》是一部从跨学科的视角、全面介绍“大数据”(Big Data)在社会各领域的广泛应用的普及读物,同时兼具权威性与前瞻性。全书共分为六个部分:第一章“数据大爆炸”从多个角度介绍了大数据的潜力、大数据的价值、大数据的特点、大数据面临的挑战等内容; 第二章“大数据应用”从商业、健康、社会管理、新闻业、物联网等不同的领域,着重介绍大数据在社会各领域的应用情况以及带来的改变; 第三章“大数据挖掘”用通俗易懂的语言介绍了数据挖掘的思路与方法,例如:如何准备数据,如何对数据进行挖掘,如何呈现数据等; 第四章“大数据前瞻”为读者勾勒出大数据将如何改变世界,从“数字地球”的提出,到物联网的广泛应用,到“智慧地球”设想的提出与实验,大数据正在深刻地改变人类生活; 第五章“大数据安全”从个人与国家的两个不同层面,分析了大数据的广泛应用背景下如何保护公众的隐私与国家非传统安全。 附录部分是大数据相关术语的中英文对照。
  • 算法时代

    作者:Luke Dormehl

    世界上的一切事物都可以被简化成一个公式吗?数字可以告诉我们谁是适合我们的另一半,而且能和我们白头偕老吗?算法可以准确预测电影的票房收入,并且让电影更卖座吗?程序软件能预知谁将要实施犯罪,并且精确到案发时间吗?这些事听起来都像是科幻小说中的情节,但事实上,它们仅是日益被算法主宰的人类世界的“冰山一角”。 近年来随着大数据技术的快速发展,我们正在进入“算法经济时代”。每天,算法都会对展示在我们眼前的信息进行分类、筛选与取舍。我们看到的谷歌搜索结果,脸谱网上显示的好友信息,以及购物网站给我们提供的个性化购买建议等,都是算法作用的结果。算法正在以各种各样的方式,影响着世界的方方面面,包括企业创新、产业变革、经济发展。 在《算法时代》一书中,作者带领读者展开了一次算法和大数据世界的探索之旅:探寻我们如何开始相信大数据的力量;向我们介绍人工智能专家、大数据科学家和硅谷的创业家们,是他们创造了这个美丽的新世界。 在当下以及未来,当大数据和算法成为社会、企业和个人已经无法忽视的资产时,就会催生一些新型经济模式。毋庸置疑,算法将成为新经济的新引擎。如果你对人工智能、大数据、互联网技术和算法感兴趣,《算法时代》就非常适合你阅读。
  • Dataclysm

    作者:Christian Rudder

  • 大数据 [3.0升级版]

    作者:涂子沛

    《大数据》3.0升级精装版,增加作者自序,以及归国以来的演讲、专题——数据是我们新经济的土壤,是我们未来智能社会的土壤,数据可以治国,还可以强国。 美国第一,中国第几?公布官员财产美国是怎么做的,美国能让少数人腐败起来吗?美国式上访是怎么回事?凭什么美国矿难那么少?全民医改美国做得到吗?美国总统大选有什么利器才能赢?下一轮全球洗牌我们世界工厂会被淘汰吗?…… 除了上帝,任何人都必须用数据来说话。 大数据浪潮,汹涌来袭,与互联网的发明一样,这绝不仅仅是信息技术领域的革命,更是在全球范围启动透明政府、加速企业创新、引领社会变革的利器。现代管理学之父德鲁克有言,预测未来最好的方法,就是去创造未来。而“大数据战略”,则是当下领航全球的先机。 大数据,这一世界大潮的来龙去脉如何?数据技术变革,何以能推动政府信息公开、透明和社会公正?何以促发行政管理和商业管理革新,并创造无限商机?又何以既便利又危及我们每个人的生活?Google、百度之类搜索服务,何以会不再有立足之地?引领世界的数据帝国——美国和西欧,正在如何应对大数据时代?我们中国,又当如何作为? 本书通过讲述美国半个多世纪信息开放、技术创新的历史,以别开生面的经典案例——奥巴马建设“前所未有的开放政府”的雄心、公共财政透明的曲折、《数据质量法》背后的隐情、全民医改法案的波澜、统一身份证的百年纠结、隐私危机、街头警察的创新传奇、美国矿难的悲情历史、商务智能的前世今生、数据开放运动的全球兴起,以及云计算、Facebook和推特等社交媒体、Web3.0与下一代互联网的未来图景等等,为您一一细解,数据创新给公民、政府、社会带来的种种挑战和变革。 美国是全书主体,但又处处反观中国当下的现实。回望中国,胡适批评“差不多先生”,黄仁宇求索“数目字管理”,作者从太平洋对面看到中美两国的差距,深知中国缺少什么、需要什么,故将十多年观察、思索所得,又新增微学校、微学位等教育领域正在发生的革命,以及建言中国“大数据战略”的重要文章和访谈,淘洗成这本开创性的“大数据之书”——《大数据:正在到来的数据革命,以及它如何改变政府、商业与我们的生活》。
  • 社会动力学

    作者:刘怡君,周涛 [等]

    《社会动力学》是社会物理学系列丛书的第三号,在对国际社会物理学研究前沿认真探索(第一号)、国内社会物理学理论与应用(第二号)的基础上,从社会物理学与社会和谐、社会物理学与社会安全,社会物理学与社会计算、社会物理学与社会空间、社会物理学与社会舆论等模型视角,邀请国内外知名专家特别针对社会物理学的研究撰稿而成,其目的旨在对国际国内社会物理学界最新的概念模型、系统模型、仿真模型等进行全面介绍。作为新型的交叉学科,《社会动力学》具有重要的理论价值和应用前景,可以为国内外社会物理学研究进行科学比较。
  • 可视化未来

    作者:[美] 埃雷兹·艾登,[法] 让-巴蒂斯

    科学的传播速度有多快?今时今日我们很少谈论上帝了吗?人们什么时候开始用“having sex” 而不用“making love”? 史上的人是在哪岁成名的?语法的变化速度到底有多快?哪些作家被纳粹审查得最彻底? “donut” 什么时候开始取代“doughnut”? 我 们能否预测人类未来?比尔·克林顿和花椰菜哪个更出名? 《可视化未来》一书的两位作者通过与“谷歌图书”的合作,得以有机会研究500多万本电子书,而成果是一个科学工具——n元词组词频查看器。通过它,我们可以一探恒星的运动轨迹,用图表去研究人类历史在几个世纪来的发展趋势,从而为我们提供了一个新的理解世界过往、可能性和未来的视角。 该书是史蒂芬·平克最为推崇的人文趋势新作,500多万本电子书、82幅图表、6大热点主题,完美洞悉人文历史与未来。
  • Uncharted

    作者:Erez Aiden,Jean-Bapt

  • 颠覆医疗

    作者:[美]埃里克·托普

    “创造性破坏”是奥地利经济学家约瑟夫·熊彼特最著名的理论,当一个产业在革新之时,都需要大规模地淘汰旧的技术与生产体系,并建立起新的生产体系。电器之于火器、汽车之于马车、个人计算机之于照排系统,都是一次又一次的“创造性破坏”,旧的体系完全不复存在,新的体系随之取代。 “创造性破坏”已经深深地改变了我们的生活,在这个数字时代,我们身边的一切都被“数字化”了。只有一处,也许是由于其本身的根深蒂固,也许是由于它天然的排斥新鲜事物,医学,却从未被数字化浪潮所影响。 这本书所谈的,就是一个即将被“创造性破坏”的产业,一个即将被颠覆的产业。iPhone、云计算、3D打印、基因测序、无线传感器、超级计算机,这些改变了我们生活的事物,将再一次地融合在一起,对医学进行一次“创造性破坏”。在这超级融合之下,权力第一次交回到我们自己手中,而只有我们自己,才能真正将这场医学革命进行下去,颠覆医疗。
  • 大规模分布式存储系统

    作者:杨传辉

    《大规模分布式存储系统:原理解析与架构实战》是分布式系统领域的经典著作,由阿里巴巴高级技术专家“阿里日照”(OceanBase核心开发人员)撰写,阳振坤、章文嵩、杨卫华、汪源、余锋(褚霸)、赖春波等来自阿里、新浪、网易和百度的资深技术专家联袂推荐。理论方面,不仅讲解了大规模分布式存储系统的核心技术和基本原理,而且对谷歌、亚马逊、微软和阿里巴巴等国际型大互联网公司的大规模分布式存储系统进行了分析;实战方面,首先通过对阿里巴巴的分布式数据库OceanBase的实现细节的深入剖析完整地展示了大规模分布式存储系统的架构与设计过程,然后讲解了大规模分布式存储技术在云计算和大数据领域的实践与应用。 《大规模分布式存储系统:原理解析与架构实战》内容分为四个部分:基础篇——分布式存储系统的基础知识,包含单机存储系统的知识,如数据模型、事务与并发控制、故障恢复、存储引擎、压缩/解压缩等;分布式系统的数据分布、复制、一致性、容错、可扩展性等。范型篇——介绍谷歌、亚马逊、微软、阿里巴巴等著名互联网公司的大规模分布式存储系统架构,涉及分布式文件系统、分布式键值系统、分布式表格系统以及分布式数据库技术等。实践篇——以阿里巴巴的分布式数据库OceanBase为例,详细介绍分布式数据库内部实现,以及实践过程中的经验。专题篇——介绍分布式系统的主要应用:云存储和大数据,这些是近年来的热门领域,本书介绍了云存储平台、技术与安全,以及大数据的概念、流式计算、实时分析等。
  • NoSQL精粹

    作者:[美]Pramod J. Sadalag

    《NoSQL精粹》为考虑是否可以使用和如何使用NoSQL数据库的企业提供了可靠的决策依据。它由世界级软件开发大师和软件开发“教父”Martin Fowler与Jolt生产效率大奖图书作者Pramod J. Sadalage共同撰写。书中全方位比较了关系型数据库与NoSQL数据库的异同;分别以Riak、MongoDB、Cassandra和Neo4J为代表,详细讲解了键值数据库、文档数据库、列族数据库和图数据库这4大类NoSQL数据库的优劣势、用法和适用场合;深入探讨了实现NoSQL数据库系统的各种细节,以及与关系型数据库的混用。 全书分为两部分,共15章:第一部分(第1~7章)主要讲述NoSQL的核心概念。其中第1章解释了NoSQL发展迅速的原因;第2章描述了在NoSQL领域的三种主要的数据模型中如何体现“聚合”这一概念;第3章介绍了聚合的缺点;第4章描述了数据库如何在集群中分布数据;第5章论及了更新与读取操作对一致性的影响;第6章讨论了版本戳;第7章描述了适合用在NoSQL系统中的“映射-化简”操作。第二部分(第8~15章)讲述了如何实现NoSQL数据库系统。其中第8章~第11章每章各以一种NoSQL数据库为例,演示了如何实现第一部分介绍的概念;第12章解释了数据如何在强模式系统与无模式系统之间迁移;第13章着眼于混合持久化领域的趋势;第14章探讨了在混合持久化领域中会考虑到的其他一些技术;第15章提供了选择数据库时可以参考的一些建议。
  • 精简

    作者:[美] 马修·E·梅

    为什么联邦快递的logo因为其中的隐形箭头而大获成功? 为什么很多自行车坐垫中间会挖空一块? 为什么丰田塞恩汽车的成功与车本身无关? 为什么无标识、无人管控、车流量巨大的环道却秩序井然? 为什么耗资290万英镑的博览会路连护栏也不要? 为什么规则最简单(甚至简陋)的APP会让人上瘾? 为什么《华尔街日报》上由小黑点组成的肖像画能让读者如此投入? 为什么只有18分钟的TED演讲能够吸引万千观众? …… 欢迎来到这个一切都过量的大数据时代。 如今,我们的工作内容变得更深入、要求更苛刻;我们的生意变得更复杂、更难以管理;一切都有着过量的功能与选择,唯独缺乏最佳的体验。商业成功在这样的时代显得如此不同,你需要掌握真正的大数据取舍之道,把最有意义的留下,也就是精简。 在《精简》中,作者把精简之道归纳为6条最精华的法则: 1. 无形之物往往胜过有形之物。 2. 最简单的规则缔造最有效的经验。 3. 有限的信息能激发无限的想象力。 4. 明智的约束更能激发创造力。 5. 打破常规才能取得突破性进展。 6. 行动不一定胜过按兵不动。 《精简》这本书阐释了精简的6条法则的具体内容,以及它们在商务和工作中的应用,并汇集了全球最有创意的、应用精简法则的颠覆性案例:联邦快递、《华尔街日报》、火星探路者、雷克萨斯、臭鼬工厂、苹果的麦金塔等等。 作者以一种说故事的方式为我们解读了这些“精简”的案例其中的成功奥秘,来指导读者在这个大数据时代,运用精简的法则识别人们的需求,抓住人们的注意力,实现突破性创新,缔造与众不同的用户体验,把握最关键的机会,在工作和商业领域获得独树一帜的成功。 【编辑推荐】 大数据时代,一切都有着过量的功能与选择,唯独缺乏最佳的体验。 真正的大数据取舍之道,就是把最有意义的留下,也就是精简。 很多企业因“精简”取得了令人瞩目的成功,不仅让品牌家喻户晓,也改变了人们的生活方式。比如苹果公司生产的iPod、iphone、ipad, 以其精简、优雅的外形设计和用户体验风靡世界,全球争抢;谷歌那极简的搜索首页仅用一个输入框连接用户与世界,成为互联网史上的经典;亚马逊凭借精简的“一键下单”功能成为全球最大电子商城;宜家的家具因其简约、现代的外形俘获万千人心,成为很多人的首选家装品牌(即使它真的不够结实);无印良品对它的产品不断进行精简:拿掉商标、去除一切不必要的加工和颜色、包装,简单到只剩下素材和功能本身,于是乎连一个透明塑料盒都成了品质生活的代言。 品牌咨询管理公司思睿高发现,消费者愿意为更简单的体验支付更高的价格:平均愿意多支付3%-4.1%的价格,这在理论上相当于300亿美元的营收。——少了一部分,反而更诱人! 《精简》这本书会告诉你,在这样的大数据时代,只要掌握了精简的法则,你就可以改变你的工作,改变你的产品,改变你的企业,改变人们的生活: 1、在大数据时代,每个企业都可以因为“精简”而发生改变: 互联网企业可以把冰冷繁杂的数据转换为伟大的设计,让网页界面更精简,让科技应用更便利,让用户体验更好; 媒体可以让“杰出”的报道从诸多“好”的报道中脱颖而出,让内容更吸引受众; 消费类企业可以让产品的设计更有创意,功能更有特色,打造让人印象深刻、充满活力的品牌;缔造与顾客之间的微妙情感联系,以最无声的手段带来最大的收益。 2、在大数据时代,每个职场人都可以因为“精简”而发生改变:精简你的工作,让自己更有效率;精简你的关系网,让人际关系更有益;精简你的生活,让自己思维更清晰、充满创意;精简你的团队,让管理更有效…… 阿里巴巴集团副总裁梁春晓、快书包CEO徐智明、腾讯科技频道主编龙兵华、商业价值主笔夏勇峰等,专注于最优产品研发和用户体验设计的企业家,以及探索时代表象背后真相的媒体人,阅读《精简》后一致鼎力推荐!
  • 大数据思维与决策

    作者:[美]伊恩·艾瑞斯

  • 魔鬼数学

    作者:[美] 乔丹•艾伦伯格(Jordan E

    如果你是一个有“数学焦虑症”的人,你可能不会相信有一天你会爱上数学。 原因在于,我们在学校所学的数学知识看上去不过是一堆沉闷的规则、定律和公理,都是前人传下来的,而且是不容置疑的。在《魔鬼数学》中,世界知名数学家乔丹•艾伦伯格告诉我们这样的认识是错误的。数学与我们所做的每一件事都息息相关,可以帮助我们洞见在混沌和嘈杂的表象之下日常生活的隐性结构和秩序。数学是一门告诉我们“如何做才不会犯错”的科学,是经年累月的努力、争论所锤炼出来的。 你应该提前多长时间到达机场?民意调查的结果真的能代表人们的意愿吗?为什么父母都是高个子,孩子的身高却比较矮?用什么策略买彩票才能中大奖?《魔鬼数学》运用数学方法分析和解决了很多的日常生活问题,帮助数学门外汉习得用数学思维思考问题的技能。 作者用数学这条主线穿起了时空,从每时每刻到宇宙空间,中间还穿插了很多人和事物,比如棒球、里根经济学、伏尔泰、意大利文艺复兴时期的绘画、人造语言等。 《魔鬼数学》带领我们踏上了一段精彩绝伦的数学思维之旅,旅行过后,相信你可以成为一个更棒的思考者。作者从历史及最近的理论发展中汲取精华,向我们展示了数学知识的魅力和力量。数学可以让我们更好地思考:它可以磨练我们的直觉,让我们的判断更敏锐,它还可以驯服不确定性,让我们更深入地了解世界的结构和逻辑。 拥有了数学工具,我们就可以把那些我们想当然的事情看得更透彻, 从而做出正确的决策。
  • 智慧社会

    作者:阿莱克斯·彭特兰 (Alex Pentl

    ●如果要在大数据领域推举出一个代表性的科学家,阿莱克斯·彭特兰是一个无法令人忽略的名字。经过数年极具开创性的研究,社会物理学这个全新科学领域的根基已足够深厚。社会物理学是关于想法流的科学,正是在想法流的帮助下,我们才得以提高集体智能,促进智慧社会的形成。 ● 通过研究数以百万计的人在智能手机、GPS设备、互联网等地方留下的“数字面包屑”,大数据的应用已成为一股无法被忽视的力量。在大数据的应用中,重要的是目睹人们实际做了什么,而不是听他们说自己做了什么。如果运用恰当的社会网络激励,我们将能够切实提高生产率,实现更高效的沟通。 ●彭特兰的研究发现,我们可以在不知道任何信息的具体内容的情况下,只通过研究社会网络中的信息交换模式获得惊人的生产力提升和预测准确率提高。不管是家庭、公司这样的小团体,还是城市、国家这样的大团体,都可以通过对社会网络的调整,大大提高思想流,让我们用一种全新的方式看待生活本身。