Python大规模机器学习 第2页
-
甘特图怎么制作更方便?甘特图制作方法" title="甘特图怎么制作更方便?甘特图制作方法" width="200" height="150">
-
OKR的实施标准步骤是什么?成功实施落地OKR的要点" title="OKR的实施标准步骤是什么?成功实施落地OKR的要点" width="200" height="150">
-
Python大规模机器学习》—2 Scikit-learn中的可扩展学习" title="《Python大规模机器学习》—2 Scikit-learn中的可扩展学习" width="200" height="150">
《Python大规模机器学习》—2 Scikit-learn中的可扩展学习
第2章 Scikit-learn中的可扩展学习 假如拥有这个时代强大而又实惠的电脑,那么,将数据集加载到内存中、准备好数据矩阵、训练机器学习算法以及使用样本外观察法来测试其泛化能力通常并不是非常困难。...
-
Python大规模机器学习》— 2.3.2 随机梯度下降" title="《Python大规模机器学习》— 2.3.2 随机梯度下降" width="200" height="150">
《Python大规模机器学习》— 2.3.2 随机梯度下降
2.3.2 随机梯度下降 到目前为止看到的梯度下降版本称为全批梯度下降,它通过优化整个数据集误差来工作,因此需要占用内存。非核心版是随机梯度下降(SGD)和最小批梯度下降(SGD)。 在这里,公...
-
Python大规模机器学习》—3.2.4 使用SGD实现大规模SVM" title="《Python大规模机器学习》—3.2.4 使用SGD实现大规模SVM" width="200" height="150">
《Python大规模机器学习》—3.2.4 使用SGD实现大规模SVM
3.2.4 使用SGD实现大规模SVM 考虑到子采样的局限性(首先是指在大数据集上训练模型的欠拟合),当使用Scikitlearn中的适合于大规模流的线性SVM时,可用的唯一选项仍然是SGDC...
-
Python大规模机器学习》—2.5 小结" title="《Python大规模机器学习》—2.5 小结" width="200" height="150">
《Python大规模机器学习》—2.5 小结
2.5 小结 在本章中,我们学习了如何通过从磁盘文本文件或数据库流化数据进行非核心学习,无论数据规模多大。这些方法肯定适用于比我们的演示示例更大的数据集 (实际上我们的演示示例可以使用非平均的强...
-
Python大规模机器学习》—1.1.4 使用Python进行向外扩展" title="《Python大规模机器学习》—1.1.4 使用Python进行向外扩展" width="200" height="150">
《Python大规模机器学习》—1.1.4 使用Python进行向外扩展
1.1.4 使用Python进行向外扩展 这只需将多台计算机连接成一个集群即可。连接机器(向外扩展)时,你还可以使用更强大的配置(从而扩展CPU、内存和I/O)来扩展其中的每一个,从而应用前面提...
-
Python大规模机器学习》 —2.2.3使用pandas I/O工具" title="《Python大规模机器学习》 —2.2.3使用pandas I/O工具" width="200" height="150">
《Python大规模机器学习》 —2.2.3使用pandas I/O工具
2.2.3使用pandas I/O工具 我们可以使用pandas的read_csv函数替代csv模块。该函数专门用于上传CSV文件,pandas有大量支持多种文件格式的I/O函数,这是其中之一。相关文...
-
Python大规模机器学习》—3 实现快速SVM" title="《Python大规模机器学习》—3 实现快速SVM" width="200" height="150">
《Python大规模机器学习》—3 实现快速SVM
第3章 实现快速SVM 上一章内容已接触了在线学习,与批量学习相比,读者可能已经对其简单性、有效性和可扩展性感到惊讶。尽管每次只学习单个示例,SGD依然能得到很好的估计结果,就好像使用批处理算法处理存...
-
Python大规模机器学习》 —2.4数据流的特征管理" title="《Python大规模机器学习》 —2.4数据流的特征管理" width="200" height="150">
《Python大规模机器学习》 —2.4数据流的特征管理
2.4数据流的特征管理 数据流带来的问题是,不能像在处理一个完整的内存数据集那样进行评估。为找到给SGD非核心算法提供数据的正确且最佳的方法,要求首先调查数据(例如,获取文件初始实例),并查找你手头的...
-
Python大规模机器学习》 —3 实现快速SVM" title="《Python大规模机器学习》 —3 实现快速SVM" width="200" height="150">
《Python大规模机器学习》 —3 实现快速SVM
第3章实现快速SVM 上一章内容已接触了在线学习,与批量学习相比,读者可能已经对其简单性、有效性和可扩展性感到惊讶。尽管每次只学习单个示例,SGD依然能得到很好的估计结果,就好像使用批处理算法处理存储...
-
Python大规模机器学习》 —2.2.5关注实例排序" title="《Python大规模机器学习》 —2.2.5关注实例排序" width="200" height="150">
《Python大规模机器学习》 —2.2.5关注实例排序
2.2.5关注实例排序 作为数据流主题的总结,必须警告读者:数据流传输时实际上包含了学习过程中的隐藏信息,因为你的学习是按实例顺序进行的。 事实上,在线学习器会根据所评估的每个实例优化其参数,在优化过...