Python数据分析入门之教你怎么搭建环境

2025-02-19 06:54:55

一、Anaconda

Anaconda（水蟒）是一个捆绑了Python、conda、其他相关依赖包的一个软件。包含了180多个可学计算包及其依赖。Anaconda3是集成了Python3的环境，Anaconda2是集成了Python2的环境。Anaconda默认集成的包，是属于内置的Python的包。并且支持绝大部分操作系统（比如：Windows、Mac、Linux等）。下载地址如下：https://www.anaconda.com/distribution/（如果官网下载太慢，可以在清华大学开源软件站中下载：https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/）。根据自己的操作系统，下载相应的版本，因为Anaconda内置了许多的包，所以安装过程需要耗费相当长的时间，大家在安装的时候需要耐心等待。在安装完成后，会有以下几个模块：Anaconda prompt、Anaconda Navigator、Spyder、jupyter notebook，以下分别做一些介绍。

二、naconda prompt

Anaconda prompt是专门用来操作anaconda的终端。如果你安装完Anaconda后没有在环境变量的PATH中添加相关的环境变量，那么以后你想在终端使用anaconda相关的命令，则必须要在Anaconda prompt中完成。

三、Anaconda Navigator

这个相当于是一个导航面板，上面组织了Anaconda相关的软件。

四、Spyder

一个专门开发Python的软件，熟悉MATLAB的同学会比较有亲切感，但在后期的学习过程中，我们将不会使用这个工具写代码，因为还有更好的可替代的工具。

五、jupyter notebook

一个Python编辑环境，可以实时的查看代码的运行效果。

使用jupyter notebook的姿势：

1. 先打开Anaconda Prompt，然后进入到项目所在的目录。

2.输入命令jupyter notebook打开jupyter notebook浏览器。

六、conda基本使用

conda伴随着Anaconda安装而自动安装的。conda可以跟virtualenv一样管理不同的环境，也可以跟pip一样管理某个环境下的包。以下来看看两个功能的用法。

环境管理：

conda能跟virtualenv一样管理不同的Python环境，不同的环境之间是互相隔离，互不影响的。为什么需要创建不同的环境呢？原因是有时候项目比较多，但是项目依赖的包不一样，比如A项目用的是Python2开发的，而B项目用的是Python3开发的，那么我们在同一台电脑上就需要两套不同的环境来支撑他们运行了。创建环境的基本命令如下：

shell
# conda create --name [环境名称] 比如以下：
conda create --name da-env

这样将创建一个叫做da-env的环境，这个环境的python解释器根据anaconda来，如果anaconda为3.7，那么将默认使用3.7的环境，如果anaconda内置的是2.7，那么将默认使用2.7的环境。然后你就可以使用conda install numpy的方式来安装包了，并且这样安装进来的包，只会安装在当前环境中。有的同学可能有想问，如果想要装一个Python2.7的环境，anaconda中没有内置Python2.7，那么该怎么实现呢？。实际上，我们只需要在安装的时候指定python的版本，如果这个版本现在不存在，那么anaconda会自动的给我们下载。所以安装Python2.7的环境，使用以下代码即可实现：

conda create --name xxx python=2.7

以下再列出conda管理环境的其他命令：

创建的时候指定需要安装的包：

conda create --name xxx numpy pandas

创建的时候既需要指定包，也需要指定python环境：

conda create --name xxx python=3.6 numpy pandas

进入到某个环境

windows: activate xxx mac/linux: source activate xxx

退出环境：

 deactivate

列出当前所有的环境：

conda env list

移除某个环境：

conda remove --name xxx --all

环境下的包导出和导入：

导出：conda env export > environment.yml。

导入：conda env create --name xxx -f environment.yml。

包管理：

conda也可以用来管理包。比如我们创建完一个新的环境后，想要在这个环境中安装包（比如numpy），那么可以通过以下代码来实现：

conda remove --name xxx --all

以下再介绍一些包管理常用的命令：

在不进入某个环境下直接给这个环境安装包：

conda remove --name xxx --all

列出该环境下所有的包：

 conda list

卸载某个包：

 conda remove [包名]

设置安装包的源：

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --set show_channel_urls yes

到此这篇关于Python数据分析入门之教你怎么搭建环境的文章就介绍到这了,更多相关Python搭建环境内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们！

python 数据分析实现长宽格式的转换

我就废话不多说了,大家还是直接看代码吧! # encoding=utf-8 import numpy as np import pandas as pd # 长宽格式的转换 # 1 data = pd.read_csv('d:data/macrodata.csv') print 'data:=\n', data print 'data.to_records():=\n', data.to_records() print 'data.year:=\n', data.year print 'data
python数据分析之员工个人信息可视化

一.实验目的 (1)熟练使用Counter类进行统计 (2)掌握pandas中的cut方法进行分类 (3)掌握matplotlib第三方库,能熟练使用该三方库库绘制图形二.实验内容采集到的数据集如下表格所示: 三.实验要求 1.按照性别进行分类,然后分别汇总男生和女生总的收入,并用直方图进行展示. 2.男生和女生各占公司总人数的比例,并用扇形图进行展示. 3.按照年龄进行分类(20-29岁,30-39岁,40-49岁),然后统计出各个年龄段有多少人,并用直方图进行展示. import pan
python学习之panda数据分析核心支持库

前言 Python是一门实现数据可视化很好的语言,他们里面的很多库可以很好的画出图形,形象明了. 今天我们就来说说:Pandas数据分析核心支持库初识Pandas: Pandas 是 Python 语言的一个扩展程序库,用于数据分析. Pandas 是一个开放源码.BSD 许可的库,提供高性能.易于使用的数据结构和数据分析工具. Pandas 名字衍生自术语 "panel data"(面板数据)和 "Python data analysis"(Python 数据分
Python数据分析库pandas高级接口dt的使用详解

Series对象和DataFrame的列数据提供了cat.dt.str三种属性接口(accessors),分别对应分类数据.日期时间数据和字符串数据,通过这几个接口可以快速实现特定的功能,非常快捷. 今天翻阅pandas官方文档总结了以下几个常用的api. 1.dt.date 和 dt.normalize(),他们都返回一个日期的日期部分,即只包含年月日.但不同的是date返回的Series是object类型的,normalize()返回的Series是datetime64类型的. 这里先简单
详解python爬取弹幕与数据分析

很不幸的是,由于疫情的关系,原本线下的AWD改成线上CTF了.这就很难受了,毕竟AWD还是要比CTF难一些的,与人斗现在变成了与主办方斗. 虽然无奈归无奈,但是现在还是得打起精神去面对下一场比赛.这个开始也是线下的,决赛地点在南京,后来是由于疫情的关系也成了线上. 当然,比赛内容还是一如既往的得现学,内容是关于大数据的. 由于我们学校之前并没有开设过相关培训,所以也只能自己琢磨了. 好了,废话先不多说了,正文开始. 一.比赛介绍大数据总体来说分为三个过程. 第一个过程是搭建hadoop环境.
python数据分析之用sklearn预测糖尿病

一.数据集描述本数据集内含十个属性列 Pergnancies: 怀孕次数 Glucose:血糖浓度 BloodPressure:舒张压(毫米汞柱) SkinThickness:肱三头肌皮肤褶皱厚度(毫米) Insulin:两个小时血清胰岛素(μU/毫升) BMI:身体质量指数,体重除以身高的平方 Diabets Pedigree Function: 疾病血统指数是否和遗传相关,Height:身高(厘米) Age:年龄 Outcome:0表示不患病,1表示患病. 任务:建立机器学习模型以准确预
PyCharm设置Ipython交互环境和宏快捷键进行数据分析图文详解

使用Python进行数据分析,大家都会多少学习一本经典教材<利用Python进行数据分析>,书中作者使用了Ipython的交互环境进行了书中所有代码的案例演示,而书中的Ipython交互环境用的是原生Python开发环境,在原生环境里,由于没有代码提示.自动格式等智能辅助给你,导致编码效率有点低下,之前就有很多人在问,能不能在PyCharm这款目前最流行最智能的python IDE里设置Ipython的交互环境,我自己也做了尝试,经过自己不断摸索和实践,总结出了在PyCharm设置Ipytho
Python Pandas数据分析工具用法实例

1.介绍 Pandas是基于Numpy的专业数据分析工具,可以灵活高效的处理各种数据集,也是我们后期分析案例的神器.它提供了两种类型的数据结构,分别是DataFrame和Series,我们可以简单粗暴的把DataFrame理解为Excel里面的一张表,而Series就是表中的某一列 2.创建DataFrame # -*- encoding=utf-8 -*- import pandas if __name__ == '__main__': pass test_stu = pandas.DataF
大数据分析用java还是Python

大数据学java还是Python? 大数据开发既要学习Python,也要学习java. 学习大数据开发,java语言是基础,主流的大数据软件基本都是java实现的,所以java是必学的, python也是重要的爬取数据的工具,也是大数据后续提高部分需要学习的. Python简介: python是一种面向对象的,解释型的计算机语言,它的特点是语法简介,优雅,简单易学.1989年诞生,Guido(龟叔)开发. 编译型语言:代码在编译之后,编译成2进制的文件,然后计算机就可用运行了.(C,C++,C#
用Python 爬取猫眼电影数据分析《无名之辈》

前言作者: 罗昭成 PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取 http://note.youdao.com/noteshare?id=3054cce4add8a909e784ad934f956cef 获取猫眼接口数据作为一个长期宅在家的程序员,对各种抓包简直是信手拈来.在 Chrome 中查看原代码的模式,可以很清晰地看到接口,接口地址即为:http://m.maoyan.com/mmdb/comments/movie/1208282.json?_v_=yes&o
Python数据分析之彩票的历史数据

一.需求介绍该需求主要是分析彩票的历史数据客户的需求是根据彩票的前两期的情况,如果存在某个斜着的两个数字相等,那么就买第三期的同一个位置处的彩票对于1.,如果相等的数字是:1-5,那就买6-10,如果相等的数字是:6-10,那就买1-5: 对于2.,如果相等的数字是:1-5,那就买1-5,如果相等的数字是:6-10,,那就买6-10. 然后,根据这个方案,有可能会买中,但是也有可能买不中,于是,客户希望我可以统计出来在100天中,按照这种方法,连续6次以及6次以上的购买彩票才能够命中一次奖
python数据分析工具之 matplotlib详解

不论是数据挖掘还是数学建模,都免不了数据可视化的问题.对于 Python 来说,matplotlib 是最著名的绘图库,它主要用于二维绘图,当然也可以进行简单的三维绘图.它不但提供了一整套和 Matlab 相似但更为丰富的命令,让我们可以非常快捷地用 python 可视化数据. matplotlib基础 # 安装 pip install matplotlib 两种绘图风格: MATLAB风格: 基本函数是 plot,分别取 x,y 的值,然后取到坐标(x,y)后,对不同的连续点进行连线. 面向对