※【python自学】7个Python生态系统核心库,你值得拥有

网友投稿 1149 2022-05-30

无论你是想快速入手Python,还是想成为数据分析大神或者机器学习大佬,亦或者对Python代码进行优化,本文的python库都能为你提供一些帮助。

一 概述

Python生态系统的一些核心基础数据分析库:

NumPy:支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库,包含:

一个强大的N维数组对象 ndarray

广播功能函数

整合 C/C++/Fortran 代码的工具

线性代数、傅里叶变换、随机数生成等功能

SciPy:这也是一个功能强大的科学计算库,用于执行科学,数学和工程运算。包含的模块有最优化、线性代数、积分、插值、特殊函数、快速傅里叶变换、信号处理和图像处理、常微分方程求解和其他科学与工程中常用的计算。

Pandas:

Pandas 可以从各种文件格式比如 CSV、JSON、SQL、Microsoft Excel 导入数据。

Pandas 可以对各种数据进行运算操作,比如归并、再成形、选择,还有数据清洗和数据加工特征。

Pandas 广泛应用在学术、金融、统计学等各个数据分析领域。

Scikit-learn:代表“机器学习的科学工具包”。它是一个机器学习库,提供了各种有监督和无监督的算法,例如回归,分类,降维,聚类分析和异常检测。

Matplotlib:这是一个核心的数据可视化库,并且是Python中所有其他可视化库的基础库。它提供2D和3D绘图,图形,图表以及用于数据浏览的图形。它在NumPy和SciPy之上运行。

Seaborn:这是基于Matplotlib的,提供了易于绘制,高层次,互动性和更有条理的平面图。

Plotly:Plotly是一个数据可视化库。它提供了高质量的交互式图表,例如散点图,折线图,条形图,直方图,箱形图,热图和子图。

二 官网链接

Packages/Software

Description

NumPy

NumPy 官网 http://www.numpy.org/

NumPy 源代码:https://github.com/numpy/numpy

SciPy

SciPy 官网:https://www.scipy.org/

SciPy 源代码:https://github.com/scipy/scipy

Pandas

官网:https://pandas.pydata.org/

Matplotlib

Matplotlib 官网:https://matplotlib.org/

Matplotlib 源代码:https://github.com/matplotlib/matplotlib

Seaborn

官网:https://seaborn.pydata.org/

Scikit-learn

官网:https://scikit-learn.org/stable/

Anaconda

官网:https://www.anaconda.com/distribution/

三 安装指南

各组件的安装方法类似,以NumPy为参考。

Python 官网上的发行版是不包含 NumPy 模块的,我们可以使用以下几种方法来安装。

3.1、使用已有的发行版本

对于许多用户,尤其是在 Windows 上,最简单的方法是下载以下的 Python 发行版,它们包含了所有的关键包(包括 NumPy,SciPy,matplotlib,IPython,SymPy 以及 Python 核心自带的其它包):

※【python自学】7个Python生态系统核心库,你值得拥有

Anaconda: 免费 Python 发行版,用于进行大规模数据处理、预测分析,和科学计算,致力于简化包的管理和部署。支持 Linux, Windows 和 Mac 系统。

Enthought Canopy: 提供了免费和商业发行版。持 Linux, Windows 和 Mac 系统。

Python(x,y): 免费的 Python 发行版,包含了完整的 Python 语言开发包 及 Spyder IDE。支持 Windows,仅限 Python 2 版本。

WinPython: 另一个免费的 Python 发行版,包含科学计算包与 Spyder IDE。支持 Windows。

Pyzo: 基于 Anaconda 的免费发行版本及 IEP 的交互开发环境,超轻量级。 支持 Linux, Windows 和 Mac 系统。

3.2、使用 pip 安装

安装 NumPy 最简单的方法就是使用 pip 工具:

pip3 install --user numpy scipy matplotlib

--user 选项可以设置只安装在当前的用户下,而不是写入到系统目录。

默认情况使用国外线路,国外太慢,我们使用清华的镜像就可以:

pip3 install numpy scipy matplotlib -i https://pypi.tuna.tsinghua.edu.cn/simple

3.3、使用pycharm安装

点击 pycharm

点击 preferences

点击 python interpreter

点击 +

检索安装

3.4、安装验证

测试是否安装成功:

>>> from numpy import *

>>> eye(4)

array([[1., 0., 0., 0.],

[0., 1., 0., 0.],

[0., 0., 1., 0.],

[0., 0., 0., 1.]])

四 上手应用

以NumPy为例,更多玩法请查看官方文档。

numpy.vdot() 函数是两个向量的点积。 如果第一个参数是复数,那么它的共轭复数会用于计算。 如果参数是多维数组,它会被展开。

import numpy as np

a = np.array([[1,2],[3,4]])

b = np.array([[11,12],[13,14]])

# vdot 将数组展开计算内积

print(np.vdot(a,b))

输出结果为:

130

整理不易,点个赞吧 !!!

Python 应用与数据集成平台 ROMA Connect

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:哈希吧,滚雪球学 Python 哈希表与可哈希对象
下一篇:Java---replace与replaceAll的区别
相关文章