欢迎来到相识电子书!

标签:搜索引擎

  • Google品牌战略

    作者:尼尔·泰勒

    《GOOgle品牌战略》是一本中心突出且实用性强的好书,通俗易懂。这是品牌从业者所写的,服务于从业者的一本书。作者敏锐的洞察力以及大量的有用信息一定会为市场营销人员带来意想不到的收获。卡斯商学院消费市场学教授文森特-韦恩·米切尔   1995年,拉里·佩奇第一次见到谢尔盖·布林,没多久,他们就开始合作创业,并一举创造出曾两度被评为全球最佳品牌的产品,也就是我们所熟知的Google。在今天这个时代,Google仅仅依靠众口相传就获得了惊人的成功,实在堪称传奇。   然而,它究竟是一个伟大的品牌,抑或只是一件伟大的产品呢?在本书中,尼尔·泰勒记录下了Google——这个任何人都可以免费使用的知名品牌的成长,独到地分析了一切与它的品牌获得成功有关的因素。从它的名字、标识到它的首次公开募股,Google品牌成功的秘诀就在轻松有趣的叙述中娓娓道来。在它那简单而可爱的标识背后,隐藏了多少复杂的技术因子?隐藏在Google的核心原则“不作恶”的字面下的深意,又有多少人知道?最重要的是,我们能从Google的成功中学到什么呢?
  • 榨干百度谷歌

    作者:张志

    小小的搜索引擎,可以成为你从事网络营销的利器。如果你还没有意识到这一点,或者还不知道从何下手,请打开《榨干百度谷歌:搜索引擎广告大赢家》吧!《榨干百度谷歌:搜索引擎广告大赢家》作者将其丰富的实战经验融汇在这书中,结合大量国内不同行业实际应用案例,生动地告诉读者,怎样正确地利用搜索引擎,以很小的投资获得巨大的回报。并且深入浅出地介绍了企业开展搜索营销的关键点,包括如何提炼并组合关键词、如何撰写简洁明了的广告文本。以及运用竞价排名都要注意些什么等内容。《榨干百度谷歌:搜索引擎广告大赢家》贴近企业营销需求,通俗易懂,适合各个行业负责搜索引擎网络营销推广的负责人和技术人员阅读。
  • 搜索引擎优化

    作者:[美]Jennifer Grappone

    本书的核心是SEO计划,一个旨在提高网站排名和目标流量的为期3个月的每日程序。我们按照时间来划分任务,每项任务估计会花费一小时。根据您所处的环境、对项目的了解程度以及网站后勤方面的不同,完成某些任务的时间可能会较长或者较短。 在执行SEO计划之前,需要前期规划和收集所需的信息。这就意味着您应该从头阅读本书,并按照从头到尾的顺序执行SEO计划。
  • 搜索引擎

    作者:W.Bruce Croft,Donald

    本书介绍了信息检索(IR)中的关键问题,以及这些问题如何影响搜索引擎的设计与实现,并且用数学模型强化了重要的概念。对于网络搜素引擎这一重要的话题,书中主要涵盖了在网络上广泛使用的搜索技术。 本书适用于高等院校计算机科学或计算机工程专业的本科生、研究生,对于专业人士而言,本书也不失为一本理想的入门教材。
  • 自己动手写搜索引擎

    作者:罗刚

    《自己动手写搜索引擎》是猎兔企业搜索开发团队的软件产品研发和项目实践的经验汇总。《自己动手写搜索引擎》全方位展现出一个商用级别的Lucene搜索解决方案,主要包括爬虫、自然语言处理和搜索实现部分。爬虫部分介绍了网页遍历方法和从网页提取主要内容的方法。 自然语言处理部分包括了中文分词从理论到实现以及在搜索引擎中的实用等细节。 其他自然语言处理的经典问题与实现包括:文档排重、文本分类、自动聚类、语法解析树、拼写检查、拼音转换等理论与实现方法。 在实现搜索方面,《自己动手写搜索引擎》用简单的例子介绍了完整的搜索实现过程,覆盖了从索引库的设计和索引库与数据库的同步到搜索用户界面设计与实现。搜索用户界面包括实现布尔逻辑查询、按区间范围查询、搜索结果按日期排序等。《自己动手写搜索引擎》还进一步介绍了搜索排序的优化方法。 最后以基于Lucene的搜索服务器Solr为例,展示了Lucene的最新应用方法。
  • Lucene+nutch搜索引擎开发

    作者:王学松

    《Lucene+nutch搜索引擎开发》以Lucene构建搜索引擎的开发过程为主线,由浅入深,循序渐进,为读者展示如何使用Lucene开发自己的搜索引擎系统。全书内容包括搜索引擎概述和原理、Lucene部署安装、Nutch网络蜘蛛与数据获取、Lucene索引建立、Lucene检索与查询、搜索结果排序、文档分析器与中文分词、格式化文本分析、分布式搜索与缓存等。为便于读者理解搜索引擎快速开发过程,《Lucene+nutch搜索引擎开发》最后几章进行了应用实例的讲解,包括Nutch构建专题搜索、Lucene构建企业级搜索实例以及相关的整体工程性能测试。
  • Web数据挖掘

    作者:刘兵

    《Web数据挖掘》旨在讲述这些任务以及它们的核心挖掘算法;尽可能涵盖每个话题的广泛内容,给出足够多的细节,以便读者无须借助额外的阅读,即可获得相对完整的关于算法和技术的知识。其中结构化数据的抽取、信息整合、观点挖掘和Web使用挖掘等4章是《Web数据挖掘》的特色,这些内容在已有书籍中没有提及,但它们在Web数据挖掘中却占有非常重要的地位。当然,传统的Web挖掘主题,如搜索、页面爬取和资源探索以及链接分析在书中也作了详细描述。 《Web数据挖掘》尽管题为“Web数据挖掘”,却依然涵盖了数据挖掘和信息检索的核心主题;因为Web挖掘大量使用了它们的算法和技术。数据挖掘部分主要由关联规则和序列模式、监督学习(分类)、无监督学习(聚类)这三大最重要的数据挖掘任务,以及半监督学习这个相对深入的主题组成。而信息检索对于Web挖掘而言最重要的核心主题都有所阐述。
  • Understanding Search Engines

    作者:Michael W. Berry,Mur

  • The Search

    作者:John Battelle

    What does the world want? According to John Battelle, a company that answers that question -- in all its shades of meaning -- can unlock the most intractable riddles of both business and culture. And for the past few years, that's exactly what Google has been doing. Jumping into the game long after Yahoo, Alta Vista, Excite, Lycos, and other pioneers, Google offered a radical new approach to search, redefined the idea of viral marketing, survived the dotcom crash, and pulled off the largest and most talked about initial public offering in the history of Silicon Valley. But The Search offers much more than the inside story of Google's triumph. It's also a big-picture book about the past, present, and future of search technology, and the enormous impact it is starting to have on marketing, media, pop culture, dating, job hunting, international law, civil liberties, and just about every other sphere of human interest. More than any of its rivals, Google has become the gateway to instant knowledge. Hundreds of millions of people use it to satisfy their wants, needs, fears, and obsessions, creating an enormous artifact that Battelle calls "the Database of Intentions." Somewhere in Google's archives, for instance, you can find the agonized research of a gay man with AIDS, the silent plotting of a would-be bombmaker, and the anxiety of a woman checking out her blind date. Combined with the databases of thousands of other search-driven businesses, large and small, it all adds up to a goldmine of information that powerful organizations (including the government) will want to get their hands on. No one is better qualified to explain this entire phenomenon than Battelle, who cofounded Wired and founded The Industry Standard. Perhaps more than any other journalist, he has devoted his career to finding the holy grail of technology -- something as transformational as the Macintosh was in the mid- 1980s. And he has finally found it in search. Battelle draws on more than 350 interviews with major players from Silicon Valley to Seattle to Wall Street, including Google cofounders Larry Page and Sergey Brin and CEO Eric Schmidt, as well as competitors like Louis Monier, who invented AltaVista, and Neil Moncrief, a soft-spoken Georgian whose business Google built, destroyed, and built again. Battelle lucidly reveals how search technology actually works, explores the amazing power of targeted advertising, and reports on the frenzy of the Google IPO, when the company tried to rewrite the rules of Wall Street and declared "don't be evil" as its corporate motto. For anyone who wants to understand how Google really succeeded -- and the implications of a world in which every click can be preserved forever -- THE SEARCH is an eye-opening and indispensable read.
  • 搜索百度李彦宏

    作者:汪瑞林

    《搜索百度李彦宏:搜索百度幕后》:百度上市创造了纳斯达克十年一现的辉煌,也把这家中文搜索的霸主及其灵魂人物——李彦宏推到了风口浪尖。但是,绝大多数人所看到的展现在闪光灯下的情景,并不是百度和李彦宏的全部。百度何以成功,命运为何垂青李彦宏?这本书通过幕后采访,以大量鲜为人知的故事,告诉读者一个真实的百度,解密网络上看不到的厮杀。
  • 隨意搜尋

    作者:Peter Morville

  • 这就是搜索引擎

    作者:张俊林

    搜索引擎作为互联网发展中至关重要的一种应用,已经成为互联网各个领域的制高点,其重要性不言而喻。搜索引擎领域也是互联网应用中不多见的以核心技术作为其命脉的领域,搜索引擎各个子系统是如何设计的?这成为广大技术人员和搜索引擎优化人员密切关注的内容。 本书的最大特点是内容新颖全面而又通俗易懂。对于实际搜索引擎所涉及的各种核心技术都有全面细致的介绍,除了作为搜索系统核心的网络爬虫、索引系统、排序系统、链接分析及用户分析外,还包括网页反作弊、缓存管理、网页去重技术等实际搜索引擎必须关注的技术,同时用相当大的篇幅讲解了云计算与云存储的核心技术原理。另外,本书也密切关注搜索引擎发展的前沿技术:Google的咖啡因系统及Megastore等云计算新技术、百度的暗网抓取技术阿拉丁计划、内容农场作弊、机器学习排序等。诸多新技术在相关章节都有详细讲解,同时对于社会化搜索、实时搜索及情境搜索等搜索引擎的未来发展方向做了技术展望。为了增进读者的理解,全书大量引入形象的图片来讲解算法原理,相信读者会发现原来搜索引擎的核心技术理解起来比原先想象的要简单得多。
  • 信息检索导论

    作者:Christopher D.Mannin

    封面图片为英国伯明翰塞尔福瑞吉百货大楼,其极具线条感的轮廓外型优美,犹如水波的流动。其外表悬挂了1.5万个铝碟,创造出一种极具现代气息的纹理装饰效果,有如夜空下水流的波光粼粼,闪烁于月光之下,使建筑的商业氛围表现到极致。设计该建筑的英国“未来系统建筑事物所”,将商场内部围合成一个顶部采光的中庭,配以交叉的自动扶梯,使购物环境呈现出一种凝聚的向心力和商业广告的展示效应。作为英国第二商业城市伯明翰的建筑地标,人们称该建筑为“未来的百货商店”。因其设计构思的前卫性,该建筑获得2004年英国皇家建筑学会的“建筑设计奖”和2004年“英国皇家工艺美术委员会奖”等多个奖项。 本书从计算机科学领域的角度出发,介绍了信息检索的基础知识,并对当前信息检索的发展做了回顾,重点介绍了搜索引擎的核心技术,如文档分类和文档聚类问题,以及机器学习和数值计算方法。书中所有重要的思想都用示例进行了解释,生动形象,引人入胜,实现了理论与实战的完美结合。 本书的三位作者均是信息检索领域的顶级专家,两位来自学术教育界,一位来自硅谷业界,使本书既具备深厚的理论基础,又代表了尖端科技水准。因此,该书甫一出版,即被奉为该领域的权威著作,备受瞩目。目前已被众多世界名校采用为信息检索课程的教材。
  • Introduction to Information Retrieval

    作者:Christopher D. Manni

    Class-tested and coherent, this groundbreaking new textbook teaches classic web information retrieval, including web search and the related areas of text classification and text clustering from basic concepts. Written from a computer science perspective by three leading experts in the field, it gives an up-to-date treatment of all aspects of the design and implementation of systems for gathering, indexing, and searching documents; methods for evaluating systems; and an introduction to the use of machine learning methods on text collections. All the important ideas are explained using examples and figures, making it perfect for introductory courses in information retrieval for advanced undergraduates and graduate students in computer science. Based on feedback from extensive classroom experience, the book has been carefully structured in order to make teaching more natural and effective. Although originally designed as the primary text for a graduate or advanced undergraduate course in information retrieval, the book will also create a buzz for researchers and professionals alike. Contents 1. Information retrieval using the Boolean model; 2. The dictionary and postings lists; 3. Tolerant retrieval; 4. Index construction; 5. Index compression; 6. Scoring and term weighting; 7. Vector space retrieval; 8. Evaluation in information retrieval; 9. Relevance feedback and query expansion; 10. XML retrieval; 11. Probabilistic information retrieval; 12. Language models for information retrieval; 13. Text classification and Naive Bayes; 14. Vector space classification; 15. Support vector machines and kernel functions; 16. Flat clustering; 17. Hierarchical clustering; 18. Dimensionality reduction and latent semantic indexing; 19. Web search basics; 20. Web crawling and indexes; 21. Link analysis. Reviews “This is the first book that gives you a complete picture of the complications that arise in building a modern web-scale search engine. You'll learn about ranking SVMs, XML, DNS, and LSI. You'll discover the seedy underworld of spam, cloaking, and doorway pages. You'll see how MapReduce and other approaches to parallelism allow us to go beyond megabytes and to efficiently manage petabytes." -Peter Norvig, Director of Research, Google Inc. "Introduction to Information Retrieval is a comprehensive, up-to-date, and well-written introduction to an increasingly important and rapidly growing area of computer science. Finally, there is a high-quality textbook for an area that was desperately in need of one." -Raymond J. Mooney, Professor of Computer Sciences, University of Texas at Austin “Through compelling exposition and choice of topics, the authors vividly convey both the fundamental ideas and the rapidly expanding reach of information retrieval as a field.” -Jon Kleinberg, Professor of Computer Science, Cornell University
  • 百度:如此专注!

    作者:东山樵夫

    《专注:百度成功的故事》讲述了:2005年8月5日,中国最大的互联网搜索服务提供商——百度在线网络技术有限公司(NASDAQ:BIDU)宣布在纳斯达克(nasdaq)正式上市,发行4,040,402股美国存托凭证股票。第二天,百度IPO当日涨幅354%,在美国IPO历史上排名第18位,在海外IPO案子中则是新高纪录。从此百度就有了让人疯狂的理由。这《专注:百度成功的故事》将介绍海归传奇人物李彦宏的成长经历,以及他是如何利用中西合璧的文化创造着百度的命运?百度为什么要上市?号称“中国Google”的百度在上市之后命运又是如何?有人说百度上市是中国互联网的里程碑,那么上市真的代表成功吗?李彦宏又将面临怎样的选择,是让股价继续攀升还是投资技术开发?百度在热暴之下给国内外IT人士带来怎样的冷思考……
  • 文本挖掘

    作者:(以)费尔德曼,(美)桑格

    《文本挖掘(英文版)》是一部文本挖掘领域名著,作者为世界知名的权威学者。书中涵盖了核心文本挖掘操作、文本挖掘预处理技术、分类、聚类、信息提取、信息提取的概率模型、预处理应用、可视化方法、链接分析、文本挖掘应用等内容,很好地结合了文本挖掘的理论和实践。《文本挖掘(英文版)》非常适合文本挖掘、信息检索领域的研究人员和实践者阅读,也适合作为高等院校计算机及相关专业研究生的数据挖掘和知识发现等课程的教材。
  • 深入搜索引擎

    作者:ian H. Witten,Alista

    《深入搜索引擎:海量信息的压缩、索引和查询》是斯坦福大学信息检索和挖掘课程的首选教材之一,并已成为全球主要大学信息检索的主要教材。《深入搜索引擎:海量信息的压缩、索引和查询》理论和实践并重,深入浅出地给出了海量信息数据处理的整套解决方案,包括压缩、索引和查询的方方面面。其最大的特色在于不仅仅满足信息检索理论学习的需要,更重要的是给出了实践中可能面对的各种问题及其解决方法。 《深入搜索引擎:海量信息的压缩、索引和查询》作为斯坦福大学信息检索课程的教材之一,具有一定的阅读难度,主要面向信息检索专业高年级本科生和研究生、搜索引擎业界的专业技术人员和从事海量数据处理相关专业的技术人员。
  • Lucene in Action, Second Edition

    作者:Michael McCandless,E

    HIGHLIGHT New edition of top-selling book on the new version of Lucene--the core open-source technology behind most full-text search and "Intelligent Web" applications. DESCRIPTION When Lucene first hit the scene five years ago, it was nothing short of amazing. By using this open-source, highly scalable, super-fast search engine, developers could integrate search into applications quickly and efficiently. A lot has changed since then--search has grown from a "nice-to-have" feature into an indispensable part of most enterprise applications. Lucene now powers search in diverse companies including Akamai, Netflix, LinkedIn, Technorati, HotJobs, Epiphany, FedEx, Mayo Clinic, MIT, New Scientist Magazine, and many others. Some things remain the same, though. Lucene still delivers high-performance search features in a disarmingly easy-to-use API. Due to its vibrant and diverse open-source community of developers and users, Lucene is relentlessly improving, with evolutions to APIs, significant new features such as payloads, and a huge increase (as much as 8x) in indexing speed with Lucene 2.3. And with clear writing, reusable examples, and unmatched advice on best practices, Lucene in Action, Second Edition is still the definitive guide to developing with Lucene. KEY POINTS * Completely revised and updated to current Lucene 2.3 APIs. * Practical coverage, like how to index MS Word, PDF, HTML, and XML. * Full introduction to Intelligent Web topics like smart searching, sorting, and filtering.
  • 搜索引擎

    作者:(美)克罗夫特

    《搜索引擎:信息检索实践(英文版)》介绍了信息检索(1R)中的关键问题。以及这些问题如何影响搜索引擎的设计与实现,并且用数学模型强化了重要的概念。对于网络搜索引擎这一重要的话题,书中主要涵盖了在网络上广泛使用的搜索技术。 《搜索引擎:信息检索实践(英文版)》适用于高等院校计算机科学或计算机工程专业的本科生、研究生,对于专业人士而言,《搜索引擎:信息检索实践(英文版)》也不失为一本理想的入门教材。
  • 作者:(美)约翰·巴特利

    这个世界需要什么?如何任何一家公司能回答好这个问题,它就掌握了控制商业社会,乃至整个人类文明的万能钥匙。在过去的几年中,Google正在为获得这把钥匙而努力。虽然Google并非搜索业务的最早开发者,但它凭借着简明、便利、实用的搜索技术和理念,逐渐击败雅虎、Alta Vista等搜索领域的先锋,成为搜索行业名副其实的王者。 本书描述了Google如何从斯坦福一个不起眼的公司迅速崛起为“用思想控制世界的搜索巨头”,再现了Google首次公开上市时写华乐街的游戏规则,公开宣布其“不作恶”的信条时掀起的狂潮,以及搜索技术的兴起对市场营销、传媒产业、流行文化、职业发展、公民权利等人类社会各方面的巨大影响。 作者约翰·巴利特是《产业标准》杂志的创始人,也是著名的行业杂志《连线》创始人之一。为写作本书,巴特利采访了从硅谷到华尔街与搜索行业相关的350多人,包括Google的两位创始人拉里·佩奇、谢尔盖·布林和公司总裁埃里克·施米特等风云人物。他指出,搜索的革命性意义并非表现在搜索巨头间的激战上,重要的是,Google和其他的搜索引擎已经在不知不觉中深深地改变了我们的做事习惯和生活方式,成为通向整个世界的需求、兴趣、恐惧和欲望的窗口,旨趣的数据库,它们也注定会成为21世纪资本的枢纽。 这或许是我们的幸运,或者也是一种悲哀。但无论如何,你都可以从这本书中找到世界可能的未来。