Spark MLlib機器學習實踐（第2版）｜iRead eBooks 華藝電子書

0人評分過此書

Spark MLlib機器學習實踐（第2版）

作者

：

王曉華 (著)

出版社

：

崧燁文化事業有限公司

出版日期

：

2018

閱讀格式

：

EPUB

書籍分類

：

學術書 ; 電腦

學科分類

：

科學類

ISBN

：

9789576811708

朗讀功能

：

因版權限制，本書不支援朗讀功能

MLlib Spark 決策樹 SparkContext 線性回歸 RDD

本館館藏

借閱規則

當前可使用人數 1 人

借閱天數 14 天

線上看 0 人

丨

借閱中 0 人

選擇分享方式

擁有此書的圖書館

搜尋館別

選擇單位類型或單位所在地區

選擇單位類型：

選擇單位所在地區：

所有文化部計次圖書館

推薦本館採購書籍

您可以將喜歡的電子書推薦給圖書館，圖書館會參考讀者意見進行採購

讀者資料

圖書館：明新科技大學

* 姓名：

* 身分：

系所：

* E-mail ：

※ 我們會寄送一份副本至您填寫的Email中

電話：

※ 電話格式為區碼+電話號碼(ex. 0229235151)/ 手機格式為 0900111111

* 請輸入驗證碼：

更新驗證碼

內容簡介
目錄

本書的主要目的是介紹如何使用MLlib進行數據挖掘。MLlib是Spark中最核心的部分，它是Spark機器學習庫，經過無數創造者卓越的工作，MLlib已經成為一個優雅的、可以運行在分佈式集群上的數據挖掘工具。

MLlib充分利用了現有數據挖掘的技術與手段，將隱藏在數據中不為人知，但又包含價值的訊息從中提取出來，並透過相應的電腦程式，無須人工干預自動地在系統中進行計算，以發現其中的規律。

通常來說，數據挖掘的難點和重點在於兩個方面：分別是算法的學習和程式的設計。還有的是需要使用者有些相應的背景知識，例如統計學、人工智慧、網路技術等。本書在寫作上以工程實踐為主，重點介紹其與數據挖掘密切相關的算法與概念，並且使用淺顯易懂的語言將其中涉及的算法進行概括性描述，從而可以幫助使用者更好地瞭解和掌握數據挖掘的原理。

作者在寫作本書的時候有一個基本原則，這本書應該體現工程實踐與理論之間的平衡。數據挖掘的目的是為瞭解決現實中的問題，並提供一個結果，而不是去理論比較哪個算法更高深，看起來更能嚇唬人。本書對算法的基本理論和算法也做了描述，如果讀者閱讀起來覺得困難，建議找出相應的教材深入複習一下，相信大多數的讀者都能理解相關的內容。

本書主要介紹MLlib數據挖掘算法，編寫的內容可以分成三部分：第一部分是MLlib最基本的介紹以及RDD的用法，包括第一～四章；第二部分是MLlib算法的應用介紹，包括第五～十二章；第三部分透過一個經典的實例向讀者演示了如何使用MLlib去進行數據挖掘工作，為第十三章。