爲(wèi)什麽(me)選擇 MapR Data Science Refinery?
可以訪(fǎng)問所有數據因而有更準確(què)的見解
MapR Data Science Refinery是唯一可以安全訪問所有數據的數據科學産(chǎn)品。它用以下東(dōng)西連接盒子:
MapR-XD: 用於(yú)文件和容器
• 全球分布式數據(jù)存儲(chǔ)
• 高規(guī)模,且可靠
MapR-DB:高度可擴展的多模型NoSQL數據(jù)庫(kù)管理系統
• 支持多種數據模型,包括寬列,文檔(dàng),鍵值和時間(jiān)序列。
MapR-ES: 全球發(fā)布 - 訂(dìng)閱事件流媒體系統
• 融合數據平台内置的第一個(gè)大數據規(guī)模流媒體系統
• 唯一可以在物聯網規(guī)模上可靠地支持全球事件複(fù)制的大數據流系統
創建實時機器學習管道
MapR平台的核心組件是MapR-ES,它是一個針對大數據的全球發布 - 訂閱事件流媒體系統。通過MapR-ES和機器學習庫的本地集成,企業現在可以創(chuàng)建實時機器學習管線,使他們能夠将ML模型應用於(yú)實時數據。
通過廣泛的語言和圖書館(guǎn)支持提高數據科學的生産(chǎn)力
MapR數據科學精煉廠提供瞭(le)Apache Zeppelin數據科學筆(bǐ)記本,可以在一個視覺空間中跨越多個引擎工作:
• 使用Apache Spark和Python進行分布式計(jì)算和ML編(biān)程
• 使用Apache Hive和Drill的批處(chù)理和交互式SQL
• Apache Pig的腳(jiǎo)本支持
• Shell 訪(fǎng)問(wèn) MapR-FS
• 使用Spark編(biān)程訪(fǎng)問MapR-DB和MapR-ES
使用持久和有狀(zhuàng)态的容器輕(qīng)松部署
容易部署
• Docker Hub上有Docker鏡(jìng)像。
• Image包含瞭(le)所有必要的功能,不再需要使用MapR作爲集裝箱化應用程序的持久數據存儲(chǔ)。
安全
• 身份驗證發(fā)生在容器級别,以確(què)保容器化的應用程序隻能訪問授權的數據。
• 加密通信以確(què)保在訪(fǎng)問MapR中的數據時的隐私.
可擴展
• Dockerfile也将在GitHub上提供,允許您根據(jù)需要進(jìn)一步自定義圖像以支持您的特定應用程序需求。
持久
• 容器可以輕松地利用所有的MapR平台服務(MapR-FS,MapR-DB,MapR流)作爲持久數據(jù)存儲(chǔ)。
爲數據(jù)科學家提供強(qiáng)大的可視化支持
MapR數據科學精煉廠配備(bèi)瞭(le)8個開箱即用的可視化庫,包括MatPlotLib和GGPlot2。Apache Zeppelin提供瞭(le)一個可插入的可視化框架使得:
• NPM注冊(cè)表中提供常見(jiàn)的可視化庫
• 輕(qīng)松創(chuàng)建和加載自定義可視化的功能
啓用筆(bǐ)記(jì)本/模型協作,共享和鏡像
MapR融合數據平台非常适合存儲模型和筆記本存儲庫。組織可以利用MapR平台的全局名稱空間和卓越的複制功能。MapR平台還提供瞭(le)不變的快照,以保存和部署相同模型的各種版本,從而使數據科學家能夠比較每個版本模型的性能和準確(què)性。