咨詢郵箱?咨詢郵箱:service@yitianxinda.com 咨詢熱線?咨詢熱線:18101296137 微博 微信
北京軟件開發(fā)公司Apache Spark 2.0技術(shù)預覽版_北京軟件開發(fā)公司
發(fā)表日期:2016-06-08 10:12:36 ?? 文章編輯:yitianxinda ?? 瀏覽次數(shù):

  北京軟件開發(fā)公司Apache Spark 2.0技術(shù)預覽版,Apache Spark第一版發(fā)布時隔兩年后,Databricks公布了基于上游分支2.0.0-preview的Apache Spark 2.0技術(shù)預覽版。該預覽版在穩(wěn)定性和API方面均不適合用于生產(chǎn)環(huán)境,主要是為了在正式上市前收集來及社區(qū)的反饋。

  此次發(fā)布的新版主要針對社區(qū)反饋進一步完善了各種功能,根據(jù)Spark的開發(fā)計劃,主要改進分為兩方面。

  SQL是基于Apache Spark的應用程序較常用的接口之一。Spark 2.0可以支持全部的99個TPC-DS查詢,這些查詢大部分都基于SQL:2003規(guī)范。這些改進有助于在對應用程序堆棧進行較少量重寫的情況下將現(xiàn)有數(shù)據(jù)負載移植至Spark后端。

  第二方面改進主要是編程API,同時在這個新版中也更重視機器學習。spark.mllib程序包已經(jīng)被全新的spark.ml程序包所取代,后者更加側(cè)重于基于管線的API,這項技術(shù)源自DataFrames。機器學習管線和模型現(xiàn)已能夠持久保存,Spark所支持的所有語言均支持這一特性。同時R已經(jīng)可以支持K-Means、Generalized Linear Models(GLM)、樸素貝葉斯和Survival Regression。

  借助新增的Datasets類,DataFrames和Datasets已實現(xiàn)了統(tǒng)一,可支持Scala和Java編程語言,同時也可充當結(jié)構(gòu)流(Structured streaming)的抽象。不支持編譯時類型安全(Compile time type safety)的語言暫時還無法做到這一點,此時只能使用DataFrames作為主要抽象。SQLContext和HiveContext已被統(tǒng)一的SparkSession所取代。新增的Accumulator API具有比基本類型更簡單的類型層級,可支持對基本類型進行專門化(Specialization)。老的API已被棄用,但為了實現(xiàn)向后兼容性依然包含在新版中。

  新發(fā)布的結(jié)構(gòu)化流API主要可用于在不增加復雜性的前提下管理流數(shù)據(jù)集,借此程序員和現(xiàn)有機器學習算法將可以處理批量加載的數(shù)據(jù)集。在第二代Tungsten引擎的幫助下,性能也有所增強,執(zhí)行速度較高可提升10倍。

  該技術(shù)預覽版已經(jīng)發(fā)布至DataBricks。

相關(guān)文章推薦
下一代工業(yè)進步被稱為工業(yè)4.0,旨在將傳統(tǒng)行業(yè)(如自動化)互聯(lián)互通并實現(xiàn)計算機化。工業(yè)4.0的目標是使工廠變得更加智能,提高適應性和資源效率,以及改善工廠之間供...
您正在尋找能夠?qū)⒛钊梭@嘆的應用程序想法變?yōu)楝F(xiàn)實的人。我應該聘請軟件公司還是兼職開發(fā)者?這可能是每個新晉產(chǎn)品所有者問自己的最常見問題。在開始開發(fā)過程之前,您需要...
從頭開始構(gòu)建網(wǎng)站并托管和維護或改造舊網(wǎng)站需要聘請一支擁有技能和專業(yè)知識的團隊。如果您不想進一步擴大團隊,不想經(jīng)歷招聘大手筆,或者想降低離岸成本,北京軟件開發(fā)外包...
物聯(lián)網(wǎng) ( IoT ) 概念首次出現(xiàn)時,曾有大膽預測稱,到 2020 年,物聯(lián)網(wǎng)連接設備數(shù)量將達到 500 億甚至數(shù)萬億。這些極高的估值引發(fā)了炒作,但最終被證明...
下一代工業(yè)進步被稱為工業(yè)4.0,旨在將傳統(tǒng)行業(yè)(如自動化)互聯(lián)互通并實現(xiàn)計算機化。工業(yè)4.0的目標是使工廠變得更加智能,提高適應性和資源效率,以及改善工廠之間供...
企業(yè)需要強大且可靠的在線形象才能取得成功。Magento 已成為領先的電子商務平臺,為各種規(guī)模的企業(yè)提供強大的功能和定制選項。對于希望通過基于 Magento ...
北京企業(yè)手機軟件開發(fā)公司...
北京軟件開發(fā)公司對軟件錯誤檢測的研究促使軟件開發(fā)工程師開發(fā)了一種方法——它就像兩個說自己語言的朋友一樣——來加強對電子郵件和社交媒體消息等數(shù)字內(nèi)容的保護。...
ISV以及較終用戶處對整個產(chǎn)品做詳盡的測試。 *發(fā)貨準備 為批量臨蓐準備發(fā)表末了的"金盤"與文檔 象OEM。 * 外部測試 公司內(nèi)在的"β"測試點,監(jiān)視從顧客獲得的音訊反應。開發(fā)員實行...
mvc4權(quán)限系統(tǒng)快速開發(fā),權(quán)限管理+快速開發(fā)+動態(tài)接口+通用組件+動態(tài)UI于一體的全新.net信息化快速開發(fā)框架。信息化系統(tǒng)快速開發(fā)框架的使用,大大地縮短了開發(fā)周期,提高了軟件質(zhì)量,...
下一代工業(yè)進步被稱為工業(yè)4.0,旨在將傳統(tǒng)行業(yè)(如自動化)互聯(lián)互通并實現(xiàn)計算機化。工業(yè)4.0的目標是使工廠變得更加智能,提高適應性和資源效率,以及改善工廠之間供...
  北京軟件開發(fā)茶樓咖啡廳會員管理系統(tǒng)會員儲值管理系統(tǒng)積分管理軟件   適用行業(yè):茶樓會所。   產(chǎn)品特色:   A、運行穩(wěn)定:   B、超強功能:...
?