本项目共分为四大部分,分别为算法篇,工程篇、工具篇和数学篇
-
算法篇
计划包含机器学习、深度学习、NLP、推荐系统、优化算法、强化学习和编程
-
工程篇
计划包含Spark、Hadoop、Kafka、Flume、Flink、ES和Redis等
-
工具篇
计划包含Git、Vim、Linux、c++、go、java和python。
-
数学篇
计划包含高等数学、线性代数和概率论与数理统计。
上面列的大纲比较宽泛,学习过程中需谨记:有侧重点、结合实际,再就是构建自己框架
当前的项目目录如下 ,
.
├── README.md
├── 工具篇
│ ├── c++
│ │ └── README.md(todo)
│ ├── git
│ │ └── README.md(done)
│ ├── go
│ │ └── go.md(todo)
│ ├── java
│ │ └── README.md(todo)
│ ├── linux
│ │ └── README.md(doing)
│ ├── network
│ │ └── README.md(done)
│ └── python
│ ├── README.md
│ ├── python_tips.ipynb
│ └── 可视化(done)
│ ├── README.md
│ ├── pics
│ │ ├── matplotlib_summary_content.png
│ │ └── seaborn_summary_content.png
│ ├── plot_zh.ttf(中文字体文件)
│ ├── tutorials
│ │ ├── matplotlib_tutorial.ipynb
│ │ └── seborn_tutorials.ipynb
│ └── 探索整理.md
├── 工程篇
│ ├── hadoop
│ │ └── hadoop.md(done)
│ └── spark
│ └── spark.md(done)
├── 数学篇(todo)
│ └── 概率论与数理统计
│ └── README.md
└── 算法篇
├── ASR
│ └── ASR.ipynb(hold on)
├── DeepLearning
│ ├── CNN系列(done)
│ │ ├── CNN.md
│ │ └── README.md
│ ├── RNN系列(done)
│ │ ├── README.md
│ │ └── RNN.md
│ ├── 问题列表(continuing)
│ │ └── problem_lists.md
│ └── 深度学习基础
│ ├── README.md
│ └── deep_learning_foundation.md
├── MachineLearning
│ ├── Bagging&Boosting(done)
│ │ └── EnsembleLearning.md
│ ├── CatBoost(done)
│ │ └── CatBoost.md
│ ├── DecisionTree(done)
│ │ └── README.md
│ ├── LightGBM(done)
│ │ └── LightGBM.md
│ ├── LogisticRegression(done)
│ │ └── README.md
│ ├── Problem List.md(done)
│ ├── SVM(done)
│ │ └── svm.md
│ └── XGBoost(done)
│ └── XGBoost.md
├── NLP
│ ├── Q&A(todo)
│ ├── README.md
│ ├── 算法
│ │ ├── ALBert(todo)
│ │ ├── Bert(done)
│ │ │ ├── README.md
│ │ │ ├── pkg_keras_bert_demo.py
│ │ │ ├── pkg_keras_bert_model_image.png
│ │ │ ├── pkg_keras_bert_training_model_image.png
│ │ │ ├── self_keras_bert
│ │ │ │ ├── __init__.py
│ │ │ │ ├── backend.py
│ │ │ │ ├── bert.py
│ │ │ │ ├── layers.py
│ │ │ │ ├── train.py
│ │ │ │ └── utils.py
│ │ │ ├── self_keras_bert_demo.py
│ │ │ └── self_keras_bert_model_image.png
│ │ ├── DistillBert(todo)
│ │ ├── Ernie(todo)
│ │ │ ├── Ernie.md
│ │ │ ├── ernie_base10.pdf
│ │ │ └── ernie_base20.pdf
│ │ ├── RoBerta(todo)
│ │ ├── Transformer(done)
│ │ │ ├── Transformer.md
│ │ │ ├── keras_transformer
│ │ │ │ ├── pkg_transformer_layer2.png
│ │ │ │ ├── toy_example.py
│ │ │ │ └── translation_example.py
│ │ │ └── torch_transformer
│ │ │ └── self_practice_transformer.py
│ │ ├── Transformer-XL(done)
│ │ │ ├── keras_trans_xl.py
│ │ │ └── model.png
│ │ └── XLNet(done)
│ │ ├── keras_xlnet.py
│ │ └── xlnet.png
│ ├── 任务学习(doing)
│ │ ├── 多轮对话
│ │ ├── 文本分类
│ │ ├── 文本匹配
│ │ ├── 阅读理解
│ │ └── 命名实体识别
│ │ └── 命名实体识别综述.md
│ ├── 数据强化
│ └── 案例应用
├── OptimizationAlgorithms(done)
│ ├── CoordinateDescent
│ │ ├── CoordinateDescent.ipynb
│ │ └── README.md
│ ├── GradientDescent
│ │ ├── Gradient Descent.ipynb
│ │ └── README.md
│ └── NewtonMethod
│ └── NewtonMethod.md
├── Programming(doing)
│ ├── programming.ipynb
│ └── 数据结构与算法.md
├── Recommendation(todo)
│ └── README.md
└── basic_concepts(done)
├── ConvexFunctionTheory.ipynb
├── ParamBayesOptimization.md
├── Regularization.ipynb
├── gradient.ipynb
└── 点乘和叉乘.md
状态说明
状态 | 解释 |
---|---|
done | 目前已经总结完成 |
doing | 目前正在总结中 |
hold on | 暂停总结 |
continuing | 目前阶段整理完成,后面会持续更新 |
todo | 在计划中,未开始进行 |