訂閱電子報∣ 友善列印字體大小 文章分享-Facebook 文章分享-Plurk 文章分享-Twitter
Cloudera 協助企業加速大數據智慧應用
CTimes陳復霞 報導
獲取產業訊息零時差!立即訂閱電電公會電子報。

Cloudera日前發表Cloudera數據科學平台(Cloudera Data Science Workbench;CDSW)測試版,此平台為針對Cloudera企業版的數據科學所做的全新自助服務工具。Cloudera數據科學平台以Cloudera去年收購的雲端Sense.io技術為基礎,讓資料科學家使用開放原始碼程式語言(常見的R語言、Python和Scala撰寫程式),和整合原生Apache Spark和Apache Hadoop安全企業平台上的資料庫進行各項分析任務,加快從探討到製程所產生的數據分析。儲存資料量大、可儲存任何類型的數據及可彈性調整為Cloudera產品的特性。

Steven Totman的理念是所有現今無法解決的問題,未來將可以用數據來解決;而Cloudera數據科學平台是協助企業加速大數據智慧應用的全新自助服務工具。(source:Cloudera)
Steven Totman的理念是所有現今無法解決的問題,未來將可以用數據來解決;而Cloudera數據科學平台是協助企業加速大數據智慧應用的全新自助服務工具。(source:Cloudera)

Cloudera大數據專業顧問Steven Totman具有19年資訊管理領域的豐富經驗,並且擁有數項關於數據整合、數據管理及元數據相關設計的專利,協助全球客戶藉由Cloudera企業數據集中管理系統以處理企業本身的大數據資料,包括數據管理工具、數據模型及資料使用道德等來創造利潤。

 

至於企業除了建立平台和擁有工具之外,如何順利導入大數據及有效應用是重點。Steven Totman表示,企業內部善加應用大數據的三項步驟在於:

1.企業必須重視數據,把數據當成資產,建立以數據為導向的企業文化;他認為一般企業多半對於所擁有的硬體設備資產非常清楚,卻不重視數據能解決問題的能力,對於數據多少所帶來的價值一無所知。他以Gartner分析師提出的資訊加上經濟可形成數據經濟學的觀點來說明數據是商機的所在。

2.成立適當的團隊及運用工具、技巧;目前許多企業會仰賴資料科學家的分析結果來調整行銷策略,然而資料科學家往往受限於用部分的數據來整理數據、分析和建立分析預測的演算法模型,容易導致分析結果不夠準確,也提高了資安的風險,他們必須不斷調整分析模型與方法才能找出有效模式足以因應企業所產生複雜的問題。然而專業分工是必要的,企業團隊必須結合資料科學家、數據工程師、架構分析工程師等人才之力,專案部署靈活迅速的在企業內部推動大數據運作,運用分析技術處理企業龐大的數據,不再需要3、6或9月來規畫開發,而是以30、60或90天的來計算部署時程。

3.利用機器學習節省人力和時間。Steven Totman提及在不同產業的應用案例,透過收集數據的反饋,可以得知生產流程中的元件狀態/衰退期及確實掌握狀況,進而規劃流程與知道何時汰換不適用的元件,他認為單一數據並無價值,將數據整合能力變成資訊才有意義。他以紐約大雪灑鹽不結冰的案例說明下大雪時每天收集1千萬筆數據分析研究,讓道路優先排序調整鹽量的使用,對於個人生活造成的影響。

Steven Totman的理念是所有現今無法解決的問題,未來將可以用數據來解決。他認為在大數據領域,台灣相較於美國還處於初期階段,卻持有開放的態度願意接受變化。至於未來大數據在全球的最大主流應用預料將落在真的足以改變人類生命與生活的領域,例如電信及醫療。

Cloudera數據科學平台建置安全數據探索、視覺化和模組化的協作自助型環境,讓科學家、分析師和商業團隊可以共同使用,能為企業加快數據科學和機器學習的自助服務數據科學。

訂閱電子報 友善列印 字體大小:
獲取產業訊息零時差!立即訂閱電電公會電子報。