返回至“数据处理

软件

Python 3 数据分析 英文

"Python 是一种面向对象的解释型计算机程序设计语言,由荷兰人Guido van Rossum于1989年发明,第一个公开发行版发行于1991年。 Python是纯粹的自由软件, 源代码和解释器CPython遵循 GPL(GNU General Public License)协议 。 Python语法简洁清晰,特色之一是强制用空白符(white space)作为语句缩进。"

8:07:26 90个视频 更多介绍>>
初级
语言计算:文本和词汇
将文本当做词链表及简单的统计
自动理解自然语言
获取文本语料库
条件频率分布
词典资源
WordNet
从网络和硬盘访问文本
字符串:最底层的文本处理和使用Unicode进行文字处理
使用正则表达式检测词组搭配
规范化文本及用正则表达式为文本分词
分割和格式化
使用词性标注器
标注语料库
使用Python字典映射词及其属性
自动标注,N-gram标注和基于转换的标注
词的分类
监督式分类及案例
评估和决策树
朴素贝叶斯分类器和最大熵分类器
为语言模式建模
信息提取及分块
开发和评估分块器
语言结构中的递归
命名实体识别及关系抽取
中级
文法的用途
上下文无关文法及分析
依存关系和依存文法
文法开发
文法特征
处理特征结构
扩展基于特征的文法
自然语言理解
命题逻辑和一阶逻辑
英语语句的语义和段落语义层
语料库结构:案例研究
语料库生命周期
数据采集
XML的使用
Toolbox的使用
使用OLAC元数据描述语言资源
数据结构之间的运算
函数应用和映射
排序和排位次
相关性和协方差
NaN数据
等级索引和分级
读取CSV或文本文件中的数据
读写HTML文件
从XML读取数据
读写MicrosoftExcel文件
JSON数据
HDF格式
pickle——Python对象序列化
对接数据库
NoSQL数据库MongoDB数据读写
高级
数据准备
拼接
数据转换
离散化和面元划分
排序
字符串处理
数据聚合
组迭代
高级数据聚合
为图表添加更多元素
保存图表
处理日期值
线性图
直方图
条状图
条状图
饼图
高级图表
mplotd
多面板图形
串行爬虫
多线程爬虫
性能
1100万个网页
动态网页
对动态网页进行逆向工程
渲染动态网页
使用WebKit与网站交互
登录表单
支持内容更新的登录脚本扩展
使用Mechanize模块实现自动化表单处理
注册账号
光学字符识别
处理复杂验证码