新到貨2本75折
Solr 實戰

Solr 實戰

  • 定價:774
  • 運送方式:
  • 臺灣與離島
  • 海外
  • 可配送點:台灣、蘭嶼、綠島、澎湖、金門、馬祖
  • 可取貨點:台灣、蘭嶼、綠島、澎湖、金門、馬祖
載入中...
  • 分享
 

內容簡介

本書介紹了當下最流行的開源搜索技術解決方案Solr。在搜索引擎視域下,循序漸進地介紹了Solr是什麼、Solr 能做什麼,以及如何更好地使用Solr 進行開發。在搜索基礎層,本書從Solr 的快速搭建入手,介紹了Solr 背后的信息檢索基本概念,之后重點講解了構建一個搜索引擎所需的核心模塊:索引構建、文本分析、執行搜索及處理搜索結果。在搜索功能層,詳細介紹了Solr 的四大增強型搜索功能:分面搜索、搜索結果高亮、查詢建議、搜索結果分組等。在搜索研究的進階層,介紹了SolrCloud、多語種搜索及復雜查詢操作等。最后,圍繞搜索引擎的本質核心問題「相關度」展開了討論與展望。本書適合搜索技術工程師、搜索應用設計者以及對搜索引擎技術感興趣的讀者閱讀,也可作為高校計算機專業信息技術方向、信息管理與信息系統專業等的課程參考資料。

Trey Grainger是CareerBuilder公司的工程總監。Timothy Potter是LucidWorks公司工程組的資深成員。兩位作者都在從事Solr的可擴展性和可靠性、推薦引擎及大數據分析技術等方面的工作。
 

目錄

第1部分 初識Solr
1Solr入門
1.1為什麼需要搜索引擎
1.1.1管理以文本為中心的數據
1.1.2常見的搜索引擎用例
1.2Solr是什麼
1.2.1信息檢索引擎
1.2.2靈活的模式管理
1.2.3JavaWeb應用
1.2.4一台服務器上的多個索引
1.2.5可擴展性(插件)
1.2.6可伸縮性
1.2.7容錯性
1.3選擇Solr的理由
1.3.1面向軟件架構師的Solr
1.3.2面向系統管理員的SoIr
1.3.3面向CEO的Solr
1.4功能概述
1.4.1用戶體驗功能
1.4.2數據建模功能
1.4.3Solr4的新功能
1.5本章小結
2Solr上手
2.1開始上手
2.1.1Solr的安裝
2.1.2啟動Solr的示例服務器
2.1.3了解Solr主目錄
2.1.4對示例文檔進行索引
2.2一切都關乎搜索
2.2.1Solr查詢表單詳解
2.2.2Solr的搜索返回機制
2.2.3排名檢索
2.2.4分頁和排序
2.2.5擴展的搜索功能
2.3Solr管理控制台一覽
2.4根據需求改造搜索示例服務器
2.5本章小結
3Solr基礎理論
3.1搜索、匹配與找尋內容
3.1.1何為文檔
3.1.2基本搜索問題
3.1.3倒排索引
3.1.4詞項、短語與布爾邏輯
3.1.5找到文檔集
3.1.6短語查詢與術語位置
3.1.7模糊匹配
3.1.8快速小結
3.2相關度
3.2.1默認相似度
3.2.2詞項頻次
3.2.3反向文檔頻次
3.2.4詞項權重
3.2.5規范化因子
3.3查准率與查全率
3.3.1查准率
3.3.2查全率
3.3.3達到平衡
3.4搜索的規模化
3.4.1非規范化文檔
3.4.2分布式搜索
3.4.3集群vs.服務器
3.4.4Solr的局限
3.5本章小結
4配置solr
4.1solrconfig.xml文件概覽
4.1.1常見的XML數據結構和數據類型元素
4.1.2配置文件更新的應用
4.1.3Solr的其他配置
4.2查詢請求處理
4.2.1請求處理簡介
4.2.2搜索處理器
4.2.3Solritas的browse請求處理器示例
4.2.4利用搜索組件擴展查詢處理
4.3管理搜索器
4.3.1新建搜索器
4.3.2新搜索器預熱
4.4緩存管理
4.4.1緩存原理
4.4.2過濾器緩存
4.4.3查詢結果緩存
4.4.4文檔緩存
4.4.5字段值緩存
4.5其他配置選項
4.6本章小結
5創建索引
5.1微博搜索應用示例
5.1.1面向搜索的內容表示
5.1.2Solr索引構建概覽
5.2設計自己的schema
5.2.1文檔粒度
5.2.3索引字段
5.2.4存儲字段
5.2.5schema.xml概覽
5.3在schema.xml中定義字段
5.3.1必備字段屬性
5.3.2多值字段
5.3.3動態字段
5.3.4復制字段
5.3.5……鍵字段
5.4結構化非文本字段類型
5.4.1字符串字段
5.4.2日期字段
5.4.3數值字段
5.4.4高級字段類型屬性
5.5發送文檔到Solr進行索引
5.5.1使用XML或JSON進行文檔索引
5.5.2使用SolrJ客戶端庫添加文檔索引
5.5.3向Solr導入文檔的其他工具
5.6更新處理器
5.6.1將文檔提交到索引
5.6.2事務日志
5.6.3原子更新
5.7索引管理
5.7.1索引存儲
5.7.2索引片段合並
5.8本章小結
6文本分析
6.1微博文本分析
6.2基礎文本分析
6.2.1分析器
6.2.2分詞器
6.2.3分詞過濾器
6.2.4StandardTokenizer
6.2.5使用StopFilterFactory移除停用詞
6.2.6使用LowerCaseFilterFactory對詞項進行小寫轉換
6.2.7通過Solr分析表單進行文本分析測試
6.3為微博文本自定義一個字段類型
6.3.1使用PatternReplaceCharFilterFactory折疊重復的字母
6.3.2保留主題標簽、提及符號和連字符詞項
6.3.3使用ASCIIFoldingFilterFactory移除變音符號
6.3.4使用KStemFilterFactory提取詞干
6.3.5在查詢階段使用SynonymFilterFactory加入同義詞
6.3.6把過濾器組合在一起
6.4高級文本分析
6.4.1高級字段屬性
6.4.2各語種文本分析
6.4.3使用Solr插件擴展文本分析
6.5本章小結
……
第2部分 Solr的核心功能
第3部分 Solr進階

附錄A 與Solr代碼庫打交道
附錄B 語種字段類型配置
附錄C 有用的數據導入配置
 

詳細資料

  • ISBN:9787121311659
  • 規格:598頁 / 普通級 / 1-1
  • 出版地:中國

最近瀏覽商品

 

相關活動

  • 【科普、電腦】高寶電子書暢銷書展:人生就是選擇的總和,全展75折起
 

購物說明

溫馨提醒您:若您訂單中有購買簡體館無庫存/預售書或庫存於海外廠商的書籍,建議與其他商品分開下單,以避免等待時間過長,謝謝。

大陸出版品書況:因裝幀品質及貨運條件未臻完善,書況與台灣出版品落差甚大,封面老舊、出現磨痕、凹痕等均屬常態,故簡體字館除封面破損、內頁脫落...等較嚴重的狀態外,其餘所有商品將正常出貨。 

 

請注意,部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。

調貨時間:若您購買海外庫存之商品,於您完成訂購後,商品原則上約45個工作天內抵台(若有將延遲另行告知)。為了縮短等待的時間,建議您將簡體書與其它商品分開訂購,以利一般商品快速出貨。 

若您具有法人身份為常態性且大量購書者,或有特殊作業需求,建議您可洽詢「企業採購」。 

退換貨說明 

會員所購買的商品均享有到貨十天的猶豫期(含例假日)。退回之商品必須於猶豫期內寄回。 

辦理退換貨時,商品必須是全新狀態與完整包裝(請注意保持商品本體、配件、贈品、保證書、原廠包裝及所有附隨文件或資料的完整性,切勿缺漏任何配件或損毀原廠外盒)。退回商品無法回復原狀者,恐將影響退貨權益或需負擔部分費用。 

訂購本商品前請務必詳閱商品退換貨原則

  • 哲學│歷史│文學 79折起
  • 翦商作者新作79折
  • 針灸匠張寶旬