关于机器学习的三个阶段
1195
2022-05-30
无论你是想快速入手Python,还是想成为数据分析大神或者机器学习大佬,亦或者对Python代码进行优化,本文的python库都能为你提供一些帮助。
一 概述
Python生态系统的一些核心基础数据分析库:
NumPy:支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库,包含:
一个强大的N维数组对象 ndarray
广播功能函数
整合 C/C++/Fortran 代码的工具
线性代数、傅里叶变换、随机数生成等功能
SciPy:这也是一个功能强大的科学计算库,用于执行科学,数学和工程运算。包含的模块有最优化、线性代数、积分、插值、特殊函数、快速傅里叶变换、信号处理和图像处理、常微分方程求解和其他科学与工程中常用的计算。
Pandas:
Pandas 可以从各种文件格式比如 CSV、JSON、SQL、Microsoft Excel 导入数据。
Pandas 可以对各种数据进行运算操作,比如归并、再成形、选择,还有数据清洗和数据加工特征。
Pandas 广泛应用在学术、金融、统计学等各个数据分析领域。
Scikit-learn:代表“机器学习的科学工具包”。它是一个机器学习库,提供了各种有监督和无监督的算法,例如回归,分类,降维,聚类分析和异常检测。
Matplotlib:这是一个核心的数据可视化库,并且是Python中所有其他可视化库的基础库。它提供2D和3D绘图,图形,图表以及用于数据浏览的图形。它在NumPy和SciPy之上运行。
Seaborn:这是基于Matplotlib的,提供了易于绘制,高层次,互动性和更有条理的平面图。
Plotly:Plotly是一个数据可视化库。它提供了高质量的交互式图表,例如散点图,折线图,条形图,直方图,箱形图,热图和子图。
二 官网链接
Packages/Software
Description
NumPy
NumPy 官网 http://www.numpy.org/
NumPy 源代码:https://github.com/numpy/numpy
SciPy
SciPy 官网:https://www.scipy.org/
SciPy 源代码:https://github.com/scipy/scipy
Pandas
官网:https://pandas.pydata.org/
Matplotlib
Matplotlib 官网:https://matplotlib.org/
Matplotlib 源代码:https://github.com/matplotlib/matplotlib
Seaborn
官网:https://seaborn.pydata.org/
Scikit-learn
官网:https://scikit-learn.org/stable/
Anaconda
官网:https://www.anaconda.com/distribution/
三 安装指南
各组件的安装方法类似,以NumPy为参考。
Python 官网上的发行版是不包含 NumPy 模块的,我们可以使用以下几种方法来安装。
3.1、使用已有的发行版本
对于许多用户,尤其是在 Windows 上,最简单的方法是下载以下的 Python 发行版,它们包含了所有的关键包(包括 NumPy,SciPy,matplotlib,IPython,SymPy 以及 Python 核心自带的其它包):
Anaconda: 免费 Python 发行版,用于进行大规模数据处理、预测分析,和科学计算,致力于简化包的管理和部署。支持 Linux, Windows 和 Mac 系统。
Enthought Canopy: 提供了免费和商业发行版。持 Linux, Windows 和 Mac 系统。
Python(x,y): 免费的 Python 发行版,包含了完整的 Python 语言开发包 及 Spyder IDE。支持 Windows,仅限 Python 2 版本。
WinPython: 另一个免费的 Python 发行版,包含科学计算包与 Spyder IDE。支持 Windows。
Pyzo: 基于 Anaconda 的免费发行版本及 IEP 的交互开发环境,超轻量级。 支持 Linux, Windows 和 Mac 系统。
3.2、使用 pip 安装
安装 NumPy 最简单的方法就是使用 pip 工具:
pip3 install --user numpy scipy matplotlib
--user 选项可以设置只安装在当前的用户下,而不是写入到系统目录。
默认情况使用国外线路,国外太慢,我们使用清华的镜像就可以:
pip3 install numpy scipy matplotlib -i https://pypi.tuna.tsinghua.edu.cn/simple
3.3、使用pycharm安装
点击 pycharm
点击 preferences
点击 python interpreter
点击 +
检索安装
3.4、安装验证
测试是否安装成功:
>>> from numpy import *
>>> eye(4)
array([[1., 0., 0., 0.],
[0., 1., 0., 0.],
[0., 0., 1., 0.],
[0., 0., 0., 1.]])
四 上手应用
以NumPy为例,更多玩法请查看官方文档。
numpy.vdot() 函数是两个向量的点积。 如果第一个参数是复数,那么它的共轭复数会用于计算。 如果参数是多维数组,它会被展开。
import numpy as np
a = np.array([[1,2],[3,4]])
b = np.array([[11,12],[13,14]])
# vdot 将数组展开计算内积
print(np.vdot(a,b))
输出结果为:
130
整理不易,点个赞吧 !!!
Python 应用与数据集成平台 ROMA Connect
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。