
spark ml 机器学习
游九河
每日需更进一步
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
spark -- 线性回归
Apache Spark ML MLlib是Spark的机器学习(ML)库。其目标是使实用的机器学习可扩展且简单。从较高的层面来说,它提供了以下工具: ML算法:常见的学习算法,如分类,回归,聚类和协同过滤 特征化:特征提取,转换,降维和选择 管道:用于构建,评估和调整ML管道的工具 持久性:保存和加载算法,模型和管道 实用程序:线性代数,统计,数据处理等。 线性回归 在统计学中,线性回归(Lin...原创 2019-05-05 16:01:31 · 1423 阅读 · 0 评论 -
spark -- PCA
Spark PCA 在机器学习或者数据挖掘中,得到的数据往往维度过高,含有噪音,需要把多指标转化为少数几个综合指标的数据。pca是机器学习框架中常用的一个功能,spark机器模块也实现了这一功能。 PCA主要的几个方法 设置输入项的字段 def setInputCol(value: String): this.type = set(inputCol, value) 设置输出项的字段 def s...原创 2019-05-17 17:11:36 · 1246 阅读 · 0 评论