Lucene搜索引擎开发权威经典

出版时间:2008-10  出版社:中国铁道出版社  作者:于天恩  页数:629  字数:939000  
Tag标签:无  

内容概要

这本书基于Lucene的当前最新版本(2.1)精解了Lucene搜索引擎的相关知识,从基础知识到应用开发,精练简洁,恰到好处    本书共包括16章,分为6部分。第1部分Lucene基础。介绍了Lucene的基础知识,包括Lucene的历史和发展情况、使用Lucene创建索引和执行搜索的基本方法以及中文分词的应用,最后做了两个应用项目。第2部分:数据解析。介绍解析不同格式数据(如Word、PDF等)的方法,包括常用的数据解析组件、Lucene自身的数据解析机制和Lius类库。第3部分:索引的高级知识。介绍了 Lucene建立索引的过程,索引的查看和删除,索引的同步,索引的合并和优化等内容。第4部分:搜索的高级知识。介绍使用不同的Query对象构建搜索请求,使用QueryParser解析用户的搜索请求,搜索结果的过滤和排序等内容。第5部分:Lucene应用实例。应用本节介绍的所有知识构建一个桌面搜索引擎和一个Web搜索引擎。这部分作为对前面所有内容的总结。第6部分:Nutch搜索引擎框架。介绍了基于Lucene的完整搜索引擎Nutch。    本书适合从Lucene初学者到高级开发人员之间的一切Lucene爱好者。

作者简介

于天恩,现任某大型软件开发公司技术总监,高级软件工程师,精通主流软件编程技术(100多种),具有大量软件项目开发经验。主持开发过大中型企业网站,短信服务系统,办公自动化系统(OA),CRM系统等。
  已经出版的作品:《PHP精解案例教程》、《做自己的搜索引擎——搜

书籍目录

第1部分 Lucene基础(第1~5章)  第1章 Lucene简介  1.1 认识Lucene     1.1.1  Lucene是什么     1.1.2  Lucene的作者     1.1.3  Lucene的历史     1.l.4  Lucene的现在   1.2  Lucene体验实例     1.2.1 下载Lucene     1.2.2 编写辅助粪     1.2.3 最简单的搜索引擎     1.2.4 索引器的开发     1.2.5 索引器的运行     1.2.6 搜索器的开发      1.2.7 搜索器的运行    小结 第2章 创建索引    2.1 创建索引的基本方式     2.1.1 理解创建索引的过程     2.1.2 创建Field     2.1.3 创建Document     2.1.4 创建Index Writer   2.2 创建索引实例     2.2.1 简单索引     2.2.2 复杂一点的索引     2.2.3 为文件创建索引     2.2.4 为某一目录下的所有文件创建索引   小结 第3章 执行搜索   3.1 执行搜索的基本方式     3.1.1 创建搜索器对象:IndexSearcher     3.1.2 封装搜索条件:使用Term和Query对象     3.1.3 执行搜索     3.1.4 提取搜索结果:了解Hits对象     3.1.5 提取搜索结果:了解Document对象     3.1.6 提取搜索结果了解Field对象  3.2 执行搜索实例     3.2.1 简单搜索     3.2.2 分词问题   小结 第4章 中文分词  4.1 说说分词     4.1.1 分词的方法     4.1.2 做分词器   4.2  Lucene的分词器     4.2.1 二分法分词器     4.2.2  Lucene自带的中文分词器     4.2.3  NGram分词器的原理和用法     4.2.4  JE分词器的原理和用法     4.2.5  IK分词器的原理和用法     4.2.6 其他分词器  小结  ……第2部分 数据解析(第6~8章)第3部分 索引的高级知识(第9~10章)第4部分 搜索的高级知识(第11~12章)第5部分 lucene应用实例(第13~14章)第6部分 Nutch搜索引擎框架(第15~16章)

章节摘录

  第1部分 Lucene基础(第1~5章)  作为本书的第一部分,笔者在这里使用五章的篇幅介绍了Lucene的基础知识。包括Lucene的历史和发展情况、使用Lucene创建索引和执行搜索的基本方法以及中文分词的应用,最后做了两个应用项目,来说明使用Lucene建立搜索引擎的详细过程。  这部分内容是很浅的,只是基础。学过了这部分之后,读者就可以做一些实际的应用项目了。比如:给自己的网站添加全文搜索引擎。

编辑推荐

  《Lucene搜索引擎开发权威经典》基于Lucene的当前最新版本(2.1)精解了Lucene搜索引擎的相关知识,从基础知识到应用开发,精炼简洁,恰到好处。  《Lucene搜索引擎开发权威经典》包含了必要的理论,但以实践为主。所讲的理论都不是纸上谈兵,都是可以立即付诸实践进行工程应用,代码可以直接拿来用。  书,不见得要写得深透。书的好坏要由书面向的读者群来评价。《Lucene搜索引擎开发权威经典》适合从Lucene初学者到高级开发人员之间的一切Lucene爱好者。  内容精练实用,《Lucene搜索引擎开发权威经典》中所列代码可以搭建一座中型搜索平台,完整实例再现,让读者紧跟作者构建思路,Lucene搜索引擎技术完美演绎。

图书封面

图书标签Tags

评论、评分、阅读与下载


    Lucene搜索引擎开发权威经典 PDF格式下载


用户评论 (总计6条)

 
 

  •   《搜索引擎权威经典》一书约630页厚,售价为88元,买了一本试试,总算没有白花书费。该书的主要优缺点如下:

    优点:
    1)lucene部分写的比较细致,容易读懂。例程结构清晰、错误较少,有一定重用的价值,多数情况不作或只稍为修改就可以运行。
    2)对PDF、WORD、EXCEL、XML、HTML等文件的解析较好。
    3)光盘中附带了运行lucene的一些插件。光盘没有附带的,还可以在书中推荐的网址下载。没有软件版本不匹配的问题。

    缺点:
    1)说了很多重复的话,用了很多重复的代码。很多程序只是修改了2~3行代码,连程序的名字都没有换。
    2)使用CMD,在DOS界面下调试运行程序十分不便,建议改用Eclipse/MyEclipse。
    3)Nutch部分只有区区20余页,到总页码的5%,而且介绍没有Nutch和Lucene的联系。似乎,有点不负责任。

    看完觉得写的虎头蛇尾 过于罗嗦,谈不上什么“权威”,只不过适合那些需要容易上手并迅速深入lucene的人。
  •   写的很好,中国人自己写的好书
  •   从当当买了这么多书,这是我买得最失望的一本书,作者纯粹就是想凑字数赚稿费,看完什么东西也学不到,还不如看lucene源代码来得实在,也没有一些网站上对lucene分析得好,总的来说很让人失望的一本书。
  •   很失望,不好,代码连最基本的java格式都不是,是c的排版格式,而且很多地方都是java所不推荐的编程方式,重复的代码一堆,来撑篇幅,不少实例图也是错误的,张冠李戴,不值得买。
  •   唉,这是我读过的最会堆砌的书了,非常遗憾看到这样的技术书籍,极不推荐购买
  •   从来没见过这么滥竽充数的技术书籍。亏作者还好意思显摆。他那点积累太浅薄了。
 

250万本中文图书简介、评论、评分,PDF格式免费下载。 第一图书网 手机版

京ICP备13047387号-7