大數據理論與工程實踐 ,

作者:陸晟

出版社:人民郵電出版社

ISBN:9787115496836

$29.45

Product ID: 81709 SKU: 9787115496836 Categories: , Tags: , ,

本書主要面向架構師,或者是有具體大數據問題需要解決的工程師;也適合從零開始搭建大數據結構,或者需要將現有的非大數據的需求修改成大數據方案的讀者。你將從書中學到以下方面的知識:數據存儲、計算資源、計算模型、大數據應用、數據治理、大數據與人工智慧。

目錄

第 1 章 概述 1
大資料處理的特徵 / 3
基本處理模型 / 5
工程角度的大資料歷史 / 8
大資料的基本處理框架 / 10
大資料的技術實施方法 / 13

第2 章 數據 21
資料存儲 / 23
數據定址 / 28
列式存儲 / 34
鍵值對快取記憶體 / 43
持久化的快取記憶體 / 54
大資料表 / 65

第3 章 計算資源 73
集群匯流排 / 75
資源調度 / 91
資源控制 / 97

第4 章 計算模型 109
MapReduce / 111
SQL 類查詢 / 115
流式計算 / 119
圖計算 / 125

第5 章 大資料應用 133
搜索資訊匹配 / 136
搜索資訊排名 / 140
文檔相似性判定 / 147
文檔主題生成 / 152
用戶畫像 / 163
廣告投放決策 / 175
基數計算 / 191

第6 章 資料治理 199
中繼資料管理 / 202
主資料管理 / 207
資料標準 / 209
資料管理成熟度評估 / 213
數據資產 / 220
資料治理的組織構架 / 230

第7 章 大數據和人工智慧 233
大資料和電腦視覺 / 236
大數據和語音辨識 / 259
大數據和博弈 / 284
術語表 291
作者介紹 299

作者介紹

陸晟,博士,曾任IBM中國研究院研究員,涉及高性能計算、人機交互、虛擬世界等領域,最早在國內推廣雲計算相關技術。參與創立過烽火安網公司,創立了北京敏思創想軟體技術有限公司。

此外,先後擔任過VMware主任工程師、品友互動技術工程副總裁、豬八戒網商業基礎設施中心高級總監兼大數據事業部總經理等職務。現任美數信息科技公司首席技術官。從1995年開始參與中國教育和科研網的建設工作,並以第六完成人獲江蘇省科技進步二等獎,以第二作者參與過《電腦網路安全導論》第1版的編著。獲得國內外專利授權超過15項。

出版日期

12/01/2018

語系

簡體中文

版別

1-1

裝訂

平裝

頁數

299

印刷

單色印刷

出版地

大陸