很多朋友想学习机器学习,却苦于环境的搭建,这里给出windows上scikit-learn研究开发环境的搭建步骤。

Step 1. Python的安装

    python有2.x和3.x的版本之分,但是很多好的机器学习python库都不支持3.x,因此,推荐安装2.7版本的python。当前最新的python是2.7.12.链接如下:

    https://www.python.org/downloads/release/python-2712/

    里面可以看到有32位版和64位版的。如果你的机器是64位版的,那么32位和64位版的任选一个安装就可以了。如果机器是32位版的,就只能安装32位版的了。如果你搞不清楚你的机器的位数,那么就安装32位版的吧。也就是“Windows x86 MSI installer”。

Windows x86-64 MSI installer Windows for AMD64/EM64T/x64, not Itanium processors 8fa13925db87638aa472a3e794ca4ee3 19820544 SIG
Windows x86 MSI installer Windows   fe0ef5b8fd02722f32f7284324934f9d 18907136 SIG

    安装完毕后,可以设置下环境变量,把python目录加到PATH,比如我的Python装在 C:\Python27,那我就把C:\Python27\Scripts和C:\Python27加到环境变量。当然不加也可以。这样每次使用Python时加上python的全路径名。

    安装完成后,在windows的命令行输入python,如果能出来python的基本信息说明安装成功。

Step 2. Python包管理工具pip的安装

    我们需要包管理工具来方便python库的安装,包管理工具有很多,这里推荐我习惯使用的pip。

    下载pip的安装脚本。链接如下。下载get-pip.py。然后到你的下载目录,在命令行输入"python get-pip.py",跑完即可安装成功。

    https://pip.pypa.io/en/stable/installing/

    下载完毕后,记得跑下这个命令“pip install -U pip”,一是看看pip能不能正常工作,二是把pip升级到最新版本。

Step 3. 安装 Visual C++ Compiler for Python

    链接在这: https://www.microsoft.com/en-us/download/details.aspx?id=44266

    这个不装后面很多科学计算的都会装不了。

Step 4. 安装numpy和scipy

    这两哥们是科学计算和矩阵运算必备工具。

    由于numpy和scipy直接用pip安装经常会出各种各样的问题,因此一般推荐下载离线版的whl来安装numpy和scipy。

    首先安装离线版的numpy,这里我一般是在下面的链接下载numpy,当然scipy也是在这。

    http://www.lfd.uci.edu/~gohlke/pythonlibs/#numpy

    可以看到里面有很多版本的numpy可以下载,我们的python是2.7,windows 32位的,因此下载“numpy-1.11.2+mkl-cp27-cp27m-win32.whl

    下载完毕后进入下载目录,在命令行运行 "pip install numpy-1.11.2+mkl-cp27-cp27m-win32.whl" ,这样numpy就安装成功了。

    用同样的方法安装scipy。在下面的链接下载scipy。

    http://www.lfd.uci.edu/~gohlke/pythonlibs/#scipy

    我们的python是2.7,windows 32位的,因此选择scipy-0.18.1-cp27-cp27m-win32.whl下载。

    完了运行 "pip install scipy-0.18.1-cp27-cp27m-win32.whl"

    这样numpy和scipy两个好基友就搞定了。

Step 4. 安装matplotlib,pandas和scikit-learn

    这没有什么好说的,直接在命令行运行下面的命令即可。注意,先安装matplotlib再安装pandas

    pip install -U matplotlib

     

    pip install -U jinja2

    pip install -U jsonschema

    pip install -U pyzmq

    pip install -U pandas

    pip install -U scikit-learn

Step 5. 安装ipython和ipython notebook

    ipython notebook是最常用的python交互式学习工具,当然,现在叫做Jupyter Notebook。scikit-learn官方的例子都给出了用ipython notebook运行的版本。

    安装方式很简单:

    pip install ipython

    pip install jupyter

    官网在这:http://ipython.org/notebook.html

    安装完毕后,在命令行输入“jupyter-notebook”,输出会提示你notebook运行在http://localhost:8888

Step 6.  Hello World!尝试运行一个scikit-learn机器学习程序

    在scikit-learn官网下载一个机器学习的例子,比如: http://scikit-learn.org/stable/_downloads/plot_cv_predict.ipynb

    然后在下载目录运行"jupyter notebook",接着浏览器打开http://localhost:8888

    可以在浏览器看到你下载目录的内容,我们打开刚下载的plot_cv_predict.ipynb这个文件链接,可以看到python程序的内容,这时我们可以点上面的三角形按钮,一步步的运行程序,如果没有报错,最后可以看到一个线性回归的预测图。

    可以修改这个程序,重新一步步的跑,达到研究学习的目的。

    以上就是scikit-learn和pandas环境的搭建过程。希望大家都可以搭建成功,来研究机器学习。

(欢迎转载,转载请注明出处。欢迎沟通交流: pinard.liu@ericsson.com)

    

scikit-learn 和pandas 基于windows单机机器学习环境的搭建的更多相关文章

  1. Windows下UEFI环境的搭建

    Windows下UEFI环境的搭建 一.环境准备 1. 安装2012及以上VS https://visualstudio.microsoft.com/ 2.下载NASM 2.13.03  http:/ ...

  2. windows Android开发环境快速搭建和部署

    windows安装Android的开发环境相对来说比较简单,本文写给第一次想在自己Windows上建立Android开发环境的朋友们,为了确保大家能顺利完成开发环境的搭建,文章写的尽量详细,希望对初级 ...

  3. 基于Windows下python环境变量配置

    方法和Java环境变量配置是一样的,不懂的请移步这里 虽然这样说,还是唠唠叨叨几句吧QAQ 默认情况下,在windows下安装python之后,系统并不会自动添加相应的环境变量.此时不能在命令行直接使 ...

  4. 基于Windows服务器,从0开始搭建一个基于RTSP协议的直播平台

    作案工具下载 EasyDarwin 服务端程序,用来接受推流和拉流 FFmpeg 可以用来推流视频数据到服务端,也可以从服务端拉流下来播放,也可以从一个服务端拉流下来,转推到另一个服务端去. Easy ...

  5. Windows Phone 开发环境的搭建

    1. 系统 系统:Windows 7(32 位).Windows 7(64 位).Windows Vista SP2(32 位)和 Windows Vista(64 位)或者更高版本. 不支持 :Wi ...

  6. Windows和Linux环境下搭建SVN服务器

    --------------------------Windows下搭建SVN服务器----------------------------- 一.安装SVN服务端 软件包Setup-Subversi ...

  7. Windows下Python环境的搭建

    我刚开始接触Python没多久,当然这也是为初学者来更好的去入门Python,我电脑上既跑着Windows也跑着Red Hat的Linux,相比较而言,开发我还是更青睐于Linux系统,很多开发工具红 ...

  8. Windows平台kafka环境的搭建

    注意:Kafka的运行依赖于Zookeeper,所以在运行Kafka之前我们需要安装并运行Zookeeper 下载安装文件: http://kafka.apache.org/downloads.htm ...

  9. windows下wordpress环境快速搭建

    所需要软件下载网址:https://bitnami.com/ 安装使用说明网址:http://www.websoft9.com/wp-content/plugins/documente/documen ...

随机推荐

  1. php构造函数,引入数据库操作类函数

    <?php /**     * 基于左右值排序的无限分类算法     * 数据库结果为 CREATE TABLE om_catagory (      CatagoryID int(10) un ...

  2. gen already exists but is not a source folder ZT

    解决方法:1. 右键点击工程,选择 "Properties"2. 选择左边的 "Java Build Path" 3. 打开 "Source" ...

  3. listview使用checkbox批量删除出现的问题

    1.选中前面的checkbox导致后的checkbox被选中 2.选中后下滑listview,再上滑时被选中的checkbox又变成未选中状态. 问题大都是因为对listview进行代码优化重用con ...

  4. 2014辽宁ACM省赛 Prime Factors

    问题 L: Prime Factors 时间限制: 1 Sec  内存限制: 128 MB [提交][状态][论坛] 题目描写叙述 I'll give you a number , please te ...

  5. SQL-三级分类查询

    /*SQLyog 企业版 - MySQL GUI v8.14 MySQL - 5.5.40 : Database - appinfodb******************************** ...

  6. 1333:【例2-2】Blah数集

    1333:[例2-2]Blah数集 注意是数组,答案数组中不能有重复数字 q数组是存储答案的 代码: #include<iostream> #include<cstdio> # ...

  7. Unity&amp;UGUI

    UI:User Interface 用户交互接口,处理用户与程序直接的交互 新建一个UI控件,都会同时新建两个物体: --Canvas:画布,所有的UI控件都必须放到画布上 --EnventSyste ...

  8. django 用户管理系列:1 user

    :first-child{margin-top:0!important}.markdown-body>:last-child{margin-bottom:0!important}.markdow ...

  9. Java多线程——线程范围内共享变量和ThreadLocal

    多个线程访问共享对象和数据的方式 1.如果每个线程执行的代码相同,可以使用同一个Runnable对象,这个Runnable对象中有那个共享数据,例如,买票系统就可以这么做. package java_ ...

  10. Andrew Ng-ML-第十章-应用机器学习的建议

    1.如何改进性能不好的学习算法 图1.运用到测试集上效果不佳 当进行一个正则化线性回归时,最小化了代价函数得到参数,但是运用到新的测试集上,发现效果不好,那么如何改进? 1).增加训练集.但是实际上花 ...