设为首页收藏本站language→→ 语言切换

鸿鹄论坛

 找回密码
 论坛注册

QQ登录

先注册再绑定QQ

查看: 760|回复: 6
收起左侧

Python机器学习及数据分析

[复制链接]
发表于 2018-8-31 16:12:58 | 显示全部楼层 |阅读模式
Python是一种面向对象的解释型计算机程序设计语言,由荷兰人Guido van Rossum于1989年发明,第一个公开发行版发行于1991年。Python是纯粹的自由软件, 源代码和解释器CPython遵循 GPL(GNU General Public License)协议。Python语法简洁清晰,特色之一是强制用空白符(white space)作为语句缩进 .

1.应用
模式识别、数据挖掘(核心)、统计学习、计算机视觉、语言识别、自然语言处理
应用模式、流程
  训练样本 --> 特征提取 --> 学习函数 --> 预测
应用所需模块
  Numpy:科学计算库
  pandas:数据分析处理库
  Matplotlib:数据可视化库
Scikit-learn:机器学习库

数据分析流程
1)数据抽取
从外部源数据中获取数据
保存为各种格式的文件、数据库等
使用Scrapy爬虫等技术
2)数据加载
从数据库、文件中提取数据,变成DataFrame对象
pandas库的文件读取方法
3)数据处理
数据准备:
对DataFrame对象(多个)进行组装、合并等操作
pandas库的操作
数据转化:
类型转化、分类(面元等)、异常值检测、过滤等
pandas库的操作
数据聚合:
分组(分类)、函数处理、合并成新的对象
pandas库的操作
4)数据可视化

东方瑞通成立于1998年,总部在北京,分别在上海、广州、天津、武汉、济南、深圳、成都、重庆、杭州和西安建立了直营分部,全国拥有超过40间专业培训教室、40多位专职讲师及180多位签约讲师;作为国内企业级IT高级技术&管理培训的领军机构,为数千家企业客户提供员工外派(公开课)和团体定制培训服务,累计培训专业人才数十万名。

发表于 2018-8-31 17:38:04 | 显示全部楼层
okkkkkkkkkkkkkkkkkkkkkkkkkk
6# 2018-8-31 17:38:04 回复 收起回复
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 论坛注册

本版积分规则

QQ|Archiver|手机版|小黑屋|sitemap|鸿鹄论坛 ( 京ICP备14027439号 )  

GMT+8, 2024-4-25 15:22 , Processed in 0.165879 second(s), 9 queries , Redis On.  

  Powered by Discuz!

  © 2001-2024 HH010.COM

快速回复 返回顶部 返回列表