Рассмотрено машинное обучение и распределенная обработка данных на Apache Mahout. Сопоставлены две его реализации - на основе использования парадигмы MapReduce и программной конструкции (framework) Spark с математической средой Mahout Samsara, которая создает семантически дружественные условия для линейной алгебры, построена по образу базового пакета в R, содержит алгебраический DSL Scala и оптимизатор выражений. Библиотека ML Mllib поддерживает универсальную масштабируемую линейную алгебру и включает в себя многие современные алгоритмы.
展开▼
机译:考虑到Apache Mahout上的机器学习和分布式数据处理。 比较了其实现 - 基于MapReduce范式和软件设计(框架)火花与Mahout Samsara数学环境的使用,它为线性代数创建了用于线性代数的语义友好条件,其中包含了r的基本包的图像代数DSL Scala和表达式优化器。 ML MLLIB库支持通用可扩展的线性代数,包括许多现代算法。
展开▼