• ?

    構建企業AI"1+N "轉型的磐石 第四范式SageOne企業級軟硬一體AI集成系統發布

    2019.6.20

    ?

    ?

    6月20日,第四范式正式發布了企業級AI 軟硬一體集成系統——SageOne,通過“軟件定義計算”的軟硬一體技術構建了企業AI閉環系統,貫通硬件基礎設施、AI核心引擎、AI平臺和AI業務應用的全價值鏈條,全面支撐企業AI "1+N "業務場景應用需求。第四范式本次發布了SageOne Advanced、SageOne Standard和SageOne WorkStation三大系列共7款產品,覆蓋大中小企業中開發、投產和驗證等全部場景應用。SageOne軟硬一體集成系統具備低門檻、低TCO、高性能、高效率和規模化應用等特點,助力各行業企業解決“1”核心應用的極致業務效果和“N”規模化應用落地效率的難題。

    ?

    面對企業AI全面轉型需求,解決算力問題成為關鍵。“軟件定義算力”已經成為行業共識和趨勢。第四范式SageOne借助自研AI訓練引擎、AI推理引擎和AI特征存儲引擎三大引擎技術,針對硬件中的芯片、存儲、網絡等組件進行了重新定義,根據企業AI應用的實際情況進行了專用計算架構、資源管理和調度等進行深度優化和加速,為企業“1+N”AI應用提供充沛算力。

    ?

    1)AI訓練引擎——全面加速高維機器學習過程 以自研高維機器學習分布式框架GDBT和高維算法為基礎,第四范自主研發的硬件加速卡——4Paradigm ATX800,采用20nm制程,算力達到1.5TFLOPS,內置FlashGBM加速系統,充分用內存和高速緩存帶寬,支持自動優化訓練超參數、高位特征計算過程I/O加速和高維GBDT訓練加速等功能,在企業應用場景中表現出多達10倍的訓練性能。

    ?

    此外,第四范式和英特爾聯合實驗室一直探索最佳優化技術,并針對最新Cascade Lake-AP處理器的全新AVX512指令集、多核心及主頻利用率和CLX AP微架構IO總線的利用率進行全面優化。

    ?

    SageOne內置第四范式自主研發的高維、分布式網絡通訊協議Swift,集成pRPC自研網絡通信框架、零拷貝數據交換協議等AI領先通訊技術,結合基于CLX-AP架構的參數服務器集群,展現出業界領先機器學習性能表現。SageOne在高維特征計算過程I/O最大10X加速,高維稀疏場景模型訓練比GPU提速5X以上,自研pRPC通信框架比百度bRPC和谷歌gRPC提速3-10X。

    ?

    2)AI推理引擎——實現極速實時AI推理能力

    ?

    SageOne內置自研實時特征計算引擎和模型預估引擎,為企業AI應用提供特征處理過程免開發上線、線下線上一致性保證、一鍵生成預估服務、異構模型統一服務等AI核心應用服務,結合非易失性存儲的無限緩存和超低延遲內存存儲等硬件技術,確保企業AI應用時具備?量時序特征計算和萬億維模型實時推理能力的同時,提供百萬級并發實時請求支持和99.9%請求毫秒級響應的高并發業務極速響應服務。

    ?

    3)AI特征存儲引擎——打造超低延時在線AI數據治理

    ?

    面向AI的數據治理是企業AI規模化落地的基礎,針對企業中多源異構數據對接、離線在線數據一致性管理、回流數據自動標準及權限、審計等眾多治理需求,SageOne借由自研內存時序數據庫引擎的優勢,具備毫秒級海量時序特征供給性能,并通過融合InfiniCache無限緩存等技術,實現自動切換存儲介質優化TCO和RAFT一致性災備與恢復等高性能企業級標準。SageOne利用超低延遲數據訪問接口、超高數據吞吐傳輸通道和水平擴展動態擴容服務等突出能力,為企業AI應用構建了超低延遲在線數據治理能力。

    ?

    “1”—高維算法+實時推理決策 提升企業核心業務的極致效果

    ?

    企業核心場景的AI應用,每一個百分點的效果提升,對企業都至關重要。第四范式SageOne軟硬一體集成系統具備高維、實時領先優勢,更大限度助力企業釋放核心業務潛能,讓AI 應用緊隨業務發展需求。

    ?

    1)高維算法+海量數據

    ?

    第四范式自主研發的高維機器學習算法,面對企業海量多源異構的數據場景,特征維度呈現指數級提升,同時帶來模型的預測效果成倍提升,達到更精準的業務價值觸達和業務收益。在金融、互聯網和醫療行業AI應用中,高維為行業的核心業務效果提升50%-574%。

    ?

    2) 實時AI推理決策

    ?

    SageOne通過毫秒級數據響應和百萬級吞吐量實時提升核心業務成效,讓原本只能出現于“事后”的統計分析,轉變成為“事中”實時業務決策AI應用。在企業核心場景的海量實時業務決策中,15個SageOne推理引擎節點都夠支撐20億維特征模型實時2萬次并發請求,其中99.9%請求在100ms內響應,大幅提升實時決策在核心業務場景中的關鍵價值。

    ?

    “N”—提升AI應用生產效率 打造企業AI規模化落地能力

    ?

    面對眾多的AI應用場景落地需求,很多企業都面臨著“全面AI改造”,此時規模化落地能力成為企業智能化轉型的關鍵。借助第四范式統一的方法論和SageOne的AI數據治理和充沛算力,企業可以快速完成AI 應用創新與規模化落地,快速賦能成百上千個業務應用。

    ?

    1)統一方法論

    ?

    第四范式以“庫伯學習圈”理論為基礎建立了閉環AI應用方法論,通過SageOne將AI應用構建簡化為“行為數據采集、反饋數據采集、模型訓練、模型應用”四個標準步驟,并借助第四范式領先的AutoML技術構建規模化的AI生產流水線,將AI應用上線平均周期從30人月降低至數十人天,大幅度節省了人力時間成本。

    ?

    2)面向AI的數據治理

    ?

    目前企業AI應用開發周期中數據準備占據了60%人天成本,要實現企業AI規模化高效落地需要建立一套完整的AI的數據治理系統。SageOne不僅具備能夠存取PB級甚至更大量的日志的實時高性能存儲能力,同時解決了企業數據采集訪問雙實時、全量原始數據 、線上線下一致性及利用回流數據自動標注等AI數據治理能力難題,突破制約AI規模化落地的數據瓶頸。

    ?

    3) AutoML

    ?

    AutoML是幫助企業AI走向規模化生產流水線的關鍵性技術。SageOne內置第四范式自研的AutoML算法,覆蓋企業AI應用從數據準備、自動數據標注、自動模型選擇、模型一鍵上線、模型迭代自學習等端到端的全棧流程,助力企業實現低門檻、高效率、大規模構建AI應用。

    ?

    SageOne的性能表現,正在支撐大規模核心場景快速智能迭代。

    ?

    面對越來越多企業AI “1+N”轉型的迫切需求,第四范式發布SageOne 企業級AI 集成系統恰逢其時,不僅為企業實現“核心業務極致效果、大規模場景快速落地”形成全面有效支撐,同時帶給企業更優能效和更高的投資回報率。目前,第四范式SageOne AI 集成系統服務于銀行、保險、證券、零售、安防、能源、政務、媒體、互聯網等多個領域,助力它們實現全面AI轉型目標。

    ?

    ?

    水中色