新到貨2本75折
New Internet:大數據挖掘

New Internet:大數據挖掘

  • 定價:414
  • 運送方式:
  • 臺灣與離島
  • 海外
  • 可配送點:台灣、蘭嶼、綠島、澎湖、金門、馬祖
  • 可取貨點:台灣、蘭嶼、綠島、澎湖、金門、馬祖
載入中...
  • 分享
 

內容簡介

譚磊編著的《New Interne》全面地介紹了如何使用數據挖掘技術從各種結構的(數據庫)或非結構(Web)的海量數據中提取和產生業務知識。

作者梳理了各種數據挖掘常用算法和信息采集技術,系統地描述了實際應用時如何在互聯網日志分析、電子郵件營銷、互聯網廣告和電子商務上進行數據挖掘,着重介紹了數據挖掘的原理和算法在互聯網海量數據挖掘中的應用。

《New Interne》主要特點:全面介紹了數據挖掘和大數據的基本概念和技術;大量采用了實際案例,實用性強;詳細介紹了大數據挖掘領域最新的商業應用。

《New Interne》是從事數據挖掘研究和開發,或者是互聯網相關行業從事數據運營的專業人員理想的參考書,同時也可作為了解數據挖掘應用的入門指南。
 

目錄

第1章 緒論——從淘金客到礦山主
1.1 大數據時代的「四v」
1.2 什麼是大數據挖掘
1.2.1 從數據分析到數據挖掘
1.2.2 web挖掘
1.2.3 大數據挖掘之「大」
1.3 大數據挖掘的國內外發展
1.3.1 數據挖掘的應用發展
1.3.2 數據挖掘研究發展
1.4 本書內容
第2章 一小時了解數據挖掘
2.1 數據挖掘是如何解決問題的
2.1.1 尿不濕和啤酒
2.1.2 target和懷孕預測指數
2.1.3 電子商務網站流量分析
2.2 分類:從人臉識別系統說起
2.2.1 分類算法的應用
2.2.2 數據挖掘分類技術
2.2.3 分類算法的評估
2.3 一切為了商業
2.3.1 什麼是商業智能(business intelligence)
2.3.2 數據挖掘的九大定律
2.4 數據挖掘很糾結
2.5 數據挖掘的基本流程
2.5.1 數據挖掘的一般步驟
2.5.2 幾個數據挖掘中常用的概念
2.5.3 crisp-dm
2.5.4 數據挖掘的評估
2.5.5 數據挖掘結果的知識表示
2.6 本章相關資源
第3章 數據倉庫——數據挖掘的基石
3.1 存放數據的倉庫
3.1.1 數據倉庫的定義
3.1.2 數據倉庫和數據庫
3.2 傳統的數據倉庫介紹
3.3 數據倉庫基本結構
3.4 olap聯機分析處理
3.5 雲存儲上的數據倉庫
3.5.1 google公司的雲架構
3.5.2 開源的分布式系統hadoop
3.5.3 facebook的數據倉庫
3.5.4 nosql
3.6 本章相關資源
第4章 數據挖掘算法及原理
4.1 數據挖掘中的算法
4.2 數據挖掘十大經典算法
4.3 分類算法(classification)
4.4 聚類算法(clustering)
4.5 關聯算法
4.5.1 關聯算法中的概念
4.5.2 關聯規則數據挖掘過程
4.5.3 關聯規則的分類
4.5.4 apriori算法的執行實例
4.5.5 關聯規則挖掘算法的研究與優化
4.6 序列挖掘(sequence mining)
4.7 數據挖掘建模語言pmml
4.8 本章相關資源
第5章 在進行數據挖掘之前
5.1 數據集成
5.2 為何要做數據預處理
5.3 數據預處理
5.3.1 數據清理
5.3.2 數據轉換
5.3.3 數據規約
5.4 本章相關資源
第6章 r語言和其他數據挖掘工具
6.1 r語言的歷史
6.1.1 r語言的特點
6.1.2 r語言和數據挖掘
6.2 其他數據挖掘工具
6.2.1 matlab
6.2.2 其他商用數據挖掘工具
6.2.3 開源數據挖掘工具weka
6.3 數據挖掘和雲
6.4 本章相關資源
第7章 互聯網上的日志分析
7.1 網站日志簡介
7.2 網站日志處理
7.2.1 web日志預處理
7.2.2 web日志分析和數據挖掘
7.3 郵件日志
7.4 本章相關資源
第8章 數據挖掘和電子郵件
8.1 郵件營銷與垃圾郵件過濾
8.2 數據挖掘和郵件營銷
8.2.1 如何有效地進行郵件營銷
8.2.2 郵件營銷案例分享之一
8.2.3 郵件營銷案例分享之二
8.2.4 運用數據挖掘rfm模型提高郵件營銷效果
8.3 數據挖掘和垃圾郵件過濾
8.3.1 垃圾郵件
8.3.2 垃圾郵件過濾技術
8.3.3 垃圾郵件過濾案例
8.4 本章相關資源
第9章 數據挖掘和互聯網廣告
9.1 互聯網廣告
9.2 廣告作弊行為
9.3 網站聯盟廣告
9.4 網站聯盟廣告上的數據挖掘
9.4.1 數據助力網盟廣告
9.4.2 如何應對網盟廣告作弊
9.5 本章相關資源
第10章 數據挖掘和電子商務
10.1 中國電子商務現狀
10.2 在互聯網上賣米
10.3 用數據來掌握客戶
10.3.1 客戶何時來,從哪來
10.3.2 客戶最喜歡哪種商品
10.3.3 競爭與反競爭分析
10.3.4 客戶還會買什麼
10.3.5 哪些客戶是我們需要的
10.4 電子商務案例
10.4.1 電子商務企業案例一
10.4.2 電子商務企業案例二
10.5 本章相關資源
第11章 數據挖掘和web挖掘
11.1 互聯網上的個性化–like
11.1.1 like=像
11.1.2 like=喜歡
11.2 web挖掘和sns
11.2.1 sns上的數據價值
11.2.2 sns上的數據關聯關系
11.2.3 sns上的用戶關系
11.3 數據挖掘和隱私
11.4 本章相關資源
第12章 數據挖掘和移動互聯網
12.1 移動互聯網的特殊性
12.1.1 鎖定用戶的數據價值
12.1.2 移動互聯網上數據的形式
12.1.3 移動互聯網地理位置信息的價值
12.2 數據挖掘和lbs
12.2.1 用pu學習算法做文本挖掘
12.2.2 用相似匹配算法做地點挖掘
12.3 移動互聯網數據面臨的問題
12.4 本章相關資源
附錄a 技術詞匯表
附錄b 英語參考文獻表
附錄c 中文參考文獻表
附錄d 微博
附錄e 博客和其他網址
 

詳細資料

  • ISBN:9787121196706
  • 規格:353頁 / 普通級 / 1-1
  • 出版地:中國

最近瀏覽商品

 

相關活動

  • 【科普、電腦、飲食】高寶電子書暢銷書展:人生就是選擇的總和,全展75折起
 

購物說明

溫馨提醒您:若您訂單中有購買簡體館無庫存/預售書或庫存於海外廠商的書籍,建議與其他商品分開下單,以避免等待時間過長,謝謝。

大陸出版品書況:因裝幀品質及貨運條件未臻完善,書況與台灣出版品落差甚大,封面老舊、出現磨痕、凹痕等均屬常態,故簡體字館除封面破損、內頁脫落...等較嚴重的狀態外,其餘所有商品將正常出貨。 

 

請注意,部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。

調貨時間:若您購買海外庫存之商品,於您完成訂購後,商品原則上約45個工作天內抵台(若有將延遲另行告知)。為了縮短等待的時間,建議您將簡體書與其它商品分開訂購,以利一般商品快速出貨。 

若您具有法人身份為常態性且大量購書者,或有特殊作業需求,建議您可洽詢「企業採購」。 

退換貨說明 

會員所購買的商品均享有到貨十天的猶豫期(含例假日)。退回之商品必須於猶豫期內寄回。 

辦理退換貨時,商品必須是全新狀態與完整包裝(請注意保持商品本體、配件、贈品、保證書、原廠包裝及所有附隨文件或資料的完整性,切勿缺漏任何配件或損毀原廠外盒)。退回商品無法回復原狀者,恐將影響退貨權益或需負擔部分費用。 

訂購本商品前請務必詳閱商品退換貨原則

  • 中信5折起
  • 曬書節
  • 哲學│歷史│文學 79折起