Built for Fast! Built for Freedom!
國內外企業組織都已將資料視為重要的資產,而大數據分析則使這些資產的應用價值得以實現。隨著企業擁有愈來愈龐大且複雜的資料,有效的資料儲存及運算的技術和方法,可以使大數據變得更容易處理,其重要性不言可喻。
Vertica由Mike Stonebraker(14年的圖靈獎得主)所創建,2011年被HP購併,成為HP核心大數據平台軟體。Vertica是專為大數據分析構建的關聯式資料庫,比起傳統的資料庫速度快50~1000倍,快速擴充可以更快的速度處理大量的負載,與Legacy系統相比則可大幅降低成本。Vertica開放架構所整合的豐富生態系統,以及迎向大數據即時分析的技術,使其成為各大企業如:花旗集團、諾華公司(Novartis,全球醫療保健的領導廠商)等的資料分析平臺解決方案。
特色與效益
Vertica為什麼能這麼快?
- Vertica採用列式儲存,只讀取所需資料,大幅降低磁片I/O時間
- 自動在表上建立projection,優化查詢
- 支持12+壓縮演算法,資料主動壓縮和列式計算,直接存取編碼資料值,進行過濾、關聯、分組等操作時不需要解碼,大幅降低資料操作時所須的CPU與記憶體資源
Vertica如何支援大數據分析?
- 資料庫內建類RAID功能,原生支援高可用性
- 採用無共用大規模並行處理(Massively Parallel Processing, MPP)架構,基於工業標準的x86伺服器,擁有高可擴展性,可以支援PB(Petabyte)級別的結構化資料
- 透過讀寫分離、記憶體與磁碟混合的儲存架構,以及原生支持kafka訊息系統的連結,可支援資料即時載入與近即時的秒級分析
- 資料庫內建分析庫,包括時序插值和關聯、事件視窗和會話處理、模式匹配、空間地理分析、文本情感分析等高級分析,以及廣義線性回歸、邏輯回歸、K-Means聚類、樸素貝葉斯分類等常用機器學習和預測分析功能
Vertica的開放架構:
圖說:Vertica開放架構生態系統
- 支援完整的關係資料庫和SQL標準:Vertica支援關聯式資料庫事務處理和ACID的規範,支援SQL-92/SQL-99/SQL-2003等標準。
- 可擴展的資料庫內部分析框架:Vertica的開發框架除了使用內建的SQL分析和聚合函式外,還可藉由C++/Java/R等SDK自定義函式。
- 支援Hadoop:Vertica可以作為SQL分析引擎直接部署到Hadoop集群中,直接存取HDFS上的資料;也可以通過標準SQL直接訪問Hive等管理的資料,並與Vertica管理的資料進行關聯分析;另外Vertica還支援API、MapReduce、Pig等框架,構建了結構化、半結構化和非結構化整合的大數據分析環境。
- 具備高整合能力:提供ODBC、JDBC、ADO.NET接口,可與R無縫整合,並支援各類BI產品及ETL工具。
代表性客戶
客戶涵蓋全球製造、醫療、傳媒、零售、交通、電信、行銷、商業服務、財務服務各產業中的企業及公部門,應用個案可詳參https://www.vertica.com/customers/。
業務聯絡窗口
-
-