Apache SystemML 是由 IBM 開發(fā)并開源的優(yōu)化大數據機器學習平臺,為使用大數據的機器學習提供了最佳的工作場所。 它可以在 Apache Spark上運行,會自動縮放數據,逐行確定代碼是否應在驅動程序或 Apache Spark 群集上運行。 (推薦學習:phpstorm)
SystemML 是聲明式機器學習 (DML),包含線性代數原語,統(tǒng)計功能和 ML 指定結構,可以更容易也更原生的表達 ML 算法。
算法通過 R 類型或者 Python 類型的語法進行表達。DML 通過提供靈活的定制分析表達和獨立于底層輸入格式和物理數據表示的數據顯著提升數據科學的生產力。
其次,SystemML 提供自動優(yōu)化功能,通過數據和集群特性保證高效和可伸縮。SystemML 可以在 MapReduce 或者 Spark 環(huán)境運行。
SystemML 與眾不同的是:
(1) 可定制算法
(2) 多個執(zhí)行模式,包括單個,Hadoop 批量和 Spark 批量,
(3) 自動優(yōu)化
SystemML 先進的機器學習主要基于兩方面:
SystemML 語言,聲明式機器學習 (DML)。SystemML 包含線性代數原語,統(tǒng)計功能和 ML 指定結構,可以更容易也更原生的表達 ML 算法。算法通過 R 類型或者 Python 類型的語法進行表達。
DML 通過提供靈活的定制分析表達和獨立于底層輸入格式和物理數據表示的數據顯著提升數據科學的生產力。
其次,SystemML 提供自動優(yōu)化功能,通過數據和集群特性保證高效和可伸縮。SystemML 可以在 MapReduce 或者 Spark 環(huán)境運行。