Skip to content

demuxin/ML_basic

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

11 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

机器学习(入门)

第一部分:Python 语法与数据结构

在这个部分,了解 Python 的整数和字符串数据类型,学会使用变量存储数据,掌握使用内置的函数和方法。学习条件语句,循环语句完成复杂的统计。同时学会使用集合数据类型,包括列表、集合和字典等多种数据结构。

实战项目:分析电话和短信记录 在这个项目中,挑战一个数据分析的任务。应用学到的数据结构,字符串处理,循环等技巧,分析并回答与数据集中的短信与通话记录相关的问题。

第二部分:Python 文件与网络

使用 Python 标准库和第三方库中的模块,认识 Python 强大的库。并学会读取硬盘上的文件中的数据,使用在线资源解决实际问题。

实战项目:探索美国共享单车数据 借助 Python 完成对美国 3 个城市的共享单车行程数据的数据分析。编写交互式代码来查询数据,计算描述性统计数据。

第三部分:数据分析入门

学习使用 Python 了解数据分析流程的主要步骤,运用 Python 和 Pandas 处理多个数据集;并通过两个数据分析实战案例,学习使用 Python、Numpy 和 Pandas 进行数据清洗、探索、分析和可视化。

实战项目:数据分析入门 在本项目中,使用 Python 库整理并分析电影数据集,回答相关问题,掌握典型数据分析过程中所涉及到的所有步骤,提出可用给定数据集回答的问题,并解答这些问题。

第四部分:线性代数基础

线性代数是深度神经网络的基础。在这一部分中,从0基础开始学习线性代数中的向量以及交点知识以及实现向量的基本操作。

实战项目:线性代数 不借助外部库,过代码实现常见矩阵运算,高斯消元法和线性回归通,更深刻的理解线性代数的本质。

第五部分:模型的评估与验证

模型的评价指标是深度学习建模过程中非常重要的一环。在这一部分中,学习包括训练、验证和测试在内的整个机器学习过程,以及如何衡量深度学习模型以及其他机器学习模型好坏。

实战项目:预测未来房价 运用机器学习原理与基础统计分析工具针对房地产数据建立一个模型、评估模型的表现好坏并利用这个模型预测未来房价。


解决Github加载ipynb文件缓慢/失败

在Github上虽然能够直接加载 ipynb 文件,但是速度很慢,并且容易加载失败。利用 nbviewer 可以快速加载ipynb文件。

如何使用:

  1. 选择一个要打开的ipynb文件, 例如 https://github.com/feying/ML_basic/blob/master/5.boston_housing/boston_housing.ipynb
  2. 截取其中的 feying/ML_basic/blob/master/5.boston_housing/boston_housing.ipynb 部分。
  3. 添加至 https://nbviewer.jupyter.org/github/ 后面,最终得到 https://nbviewer.jupyter.org/github/feying/ML_basic/blob/master/5.boston_housing/boston_housing.ipynb ,打开链接即可。

About

machine learning basic project

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published