0人評分過此書
Spark MLlib機器學習實踐(第2版)
作者
:
出版日期
:
2018
閱讀格式
:
EPUB
ISBN
:
9789576811708
朗讀功能
:
因版權限制,本書不支援朗讀功能
本書的主要目的是介紹如何使用MLlib進行數據挖掘。MLlib是Spark中最核心的部分,它是Spark機器學習庫,經過無數創造者卓越的工作,MLlib已經成為一個優雅的、可以運行在分佈式集群上的數據挖掘工具。
MLlib充分利用了現有數據挖掘的技術與手段,將隱藏在數據中不為人知,但又包含價值的訊息從中提取出來,並透過相應的電腦程式,無須人工干預自動地在系統中進行計算,以發現其中的規律。
通常來說,數據挖掘的難點和重點在於兩個方面:分別是算法的學習和程式的設計。還有的是需要使用者有些相應的背景知識,例如統計學、人工智慧、網路技術等。本書在寫作上以工程實踐為主,重點介紹其與數據挖掘密切相關的算法與概念,並且使用淺顯易懂的語言將其中涉及的算法進行概括性描述,從而可以幫助使用者更好地瞭解和掌握數據挖掘的原理。
作者在寫作本書的時候有一個基本原則,這本書應該體現工程實踐與理論之間的平衡。數據挖掘的目的是為瞭解決現實中的問題,並提供一個結果,而不是去理論比較哪個算法更高深,看起來更能嚇唬人。本書對算法的基本理論和算法也做了描述,如果讀者閱讀起來覺得困難,建議找出相應的教材深入複習一下,相信大多數的讀者都能理解相關的內容。
本書主要介紹MLlib數據挖掘算法,編寫的內容可以分成三部分:第一部分是MLlib最基本的介紹以及RDD的用法,包括第一~四章;第二部分是MLlib算法的應用介紹,包括第五~十二章;第三部分透過一個經典的實例向讀者演示了如何使用MLlib去進行數據挖掘工作,為第十三章。
MLlib充分利用了現有數據挖掘的技術與手段,將隱藏在數據中不為人知,但又包含價值的訊息從中提取出來,並透過相應的電腦程式,無須人工干預自動地在系統中進行計算,以發現其中的規律。
通常來說,數據挖掘的難點和重點在於兩個方面:分別是算法的學習和程式的設計。還有的是需要使用者有些相應的背景知識,例如統計學、人工智慧、網路技術等。本書在寫作上以工程實踐為主,重點介紹其與數據挖掘密切相關的算法與概念,並且使用淺顯易懂的語言將其中涉及的算法進行概括性描述,從而可以幫助使用者更好地瞭解和掌握數據挖掘的原理。
作者在寫作本書的時候有一個基本原則,這本書應該體現工程實踐與理論之間的平衡。數據挖掘的目的是為瞭解決現實中的問題,並提供一個結果,而不是去理論比較哪個算法更高深,看起來更能嚇唬人。本書對算法的基本理論和算法也做了描述,如果讀者閱讀起來覺得困難,建議找出相應的教材深入複習一下,相信大多數的讀者都能理解相關的內容。
本書主要介紹MLlib數據挖掘算法,編寫的內容可以分成三部分:第一部分是MLlib最基本的介紹以及RDD的用法,包括第一~四章;第二部分是MLlib算法的應用介紹,包括第五~十二章;第三部分透過一個經典的實例向讀者演示了如何使用MLlib去進行數據挖掘工作,為第十三章。
- 出版地 : 臺灣
- 語言 : 繁體中文
評分與評論
請登入後再留言與評分