1.基本机器学习模型:逻辑回归、决策树、GBDT、xgboost、lightgbm的原理和实现。以及评价指标。
「第1章」:机器学习基础篇
课程名称:【3211】【机器学习算法基础(基础机器学习课程)「解锁式学习」】
课程内容:机器学习基础算法的讲解,偏向于实现,对底层原理没有进行过多的阐述。
---考核---(可选择,联系教务老师)
「第2章」:机器学习工具篇
课程名称:【24941】【机器学习-Sklearn(第三版)「解锁式学习」】
课程内容:该课程主要讲解了经典算法决策树、随机森林、特征工程数据预处理、经典算法降维算法PCA、逻辑回归、聚类算法KMeans、支持向量机SVM、线性回归、朴素贝叶斯、 XGBoost及其相关案例
---考核---(可选择,联系教务老师)
--------------------------------------------------------------------------------
2.基本的NLP算法(深度学习):DNN、CNN、LSTM/GRU,seq2seq,bert,transformer。
课程目录:
「第1章」:深度学习基础篇
课程名称:【20379】【深度学习-【2020版】【深版】「NLP-解锁式学习」】
课程内容:深度学习深入知识的讲解,对神经网络等深度学习常用的算法进行了讲解
---考核---(可选择,联系教务老师)
「第2章」:深度学习工具篇
课程名称:【9555】【Pytorch学习「解锁式学习」】
课程内容:深度学习中的Pytorch框架的讲解于使用。
---考核---(可选择,联系教务老师)
「第3章」:NLP理论进阶篇
课程名称:【3014】【2、NLP人工智能(第二部分)---自然语言处理进阶「解锁式学习」】
课程内容:自然语言处理与深度学习的一些知识点的学习。
---考核---(可选择,联系教务老师)
「第4章」:NLP理论进阶篇
课程名称:【3024】【3、NLP人工智能(第三部分)---深度学习Bert进阶「解锁式学习」】
课程内容:深度学习中的文本匹配以及语料库的匹配等自然语言处理结合的课程。
---考核---(可选择,联系教务老师)
「第5章」:NLP理论
课程名称:【30416】【4、(2022)Transformer和预训练模型阶段「解锁式学习」】
课程内容:该课程主要讲解了自注意力机制以及Transformer、Teansformer的代码实现、基于Transformer的闲聊引擎、BERT中的Fine-tuning实例讲解、XLNet、ALBERT的应用、以及XLNet论文讲解。
---考核---(可选择,联系教务老师)
「第6章」:NLP理论进阶篇
课程名称:【27794】【NLP实战高手课「解锁式学习 」】
课程内容:该课程主要讲解NLP的基本任务和研究方向、智能问答系统、文本校验系统、深度学习框架GPU、AI部署、神经网络基础(RNN,CNN,Embedding、Pytorch基础)、文本分类实践、半自动特征构建方式、降纬方法、集成模型、神经网络建模、Transformer、时序建模、xDeepFM、图网络、模型融合、深度迁移学习模型、优化器、训练语言模型、长文本分类、依存分析、Tranx、ASDL和AST、wikiSQL、Q-learning、AutoML、算法结合、多模态表示学习、知识蒸馏、K8S部署等等自然语言处理知识
--------------------------------------------------------------------------------
3.科研方向备选:
(1)智能问答系统:检索式问答、生成式问答结合。
研究难点和创新点包括:
匹配模型:dssm、esim(局部)、sbert,simcse对比学习
意图理解:意图分类、意图槽、抽取式意图解析
「第1章」:NLP项目篇
课程名称:【30322】【2、自然语言处理-基于Seq2Seq、Transformer、BERT的词向量「解锁式学习」】
课程内容:该课程主要实现了NLP的一个整体的项目,讲解了项目导论与中文词向量实践、基于Seq2Seq架构的模型搭建、NLG过程的优化与项目的inference、OOV和Word-repetition问题的改进、基于Transformer特征提取器的改进、BERT在抽取任务中的效果、预训练模型在摘要任务中的改进、项目总结与回顾等知识点
---考核---(可选择,联系教务老师)
「第2章」:NLP项目篇
课程名称:【30415】【3、(2022)NLP项目集合「解锁式学习」】
课程内容:该课程讲解了自然语言处理中的图书分类项目、基于Seq2Seq的文本生成、基于Seq2Seq的机器翻译系统、Named Entity Recognition项目、Pointer NetWork以及Beam Search项目、智能营销项目营销文案生成论文、文本领域中的数据增强技术、NLP Lecture 话系统中的核心、检索模型等知识点的讲解
---考核---(可选择,联系教务老师)
「第3章」:NLP项目篇
课程名称:【30323】【3、自然语言处理-基于大规模预训练模型的机器阅读理解「解锁式学习」】
课程内容:该课程讲解了整个项目的开发过程,其中包括了机器阅读理解发展以及解析、常见的机器学习阅读理解模型、BERT与机器阅读理解、BERT的模型变体、其他的机器阅读理解模型、模型的集成与部署、项目总结整体的内容
---考核---(可选择,联系教务老师)
「第4章」:NLP项目篇
课程名称:【30759】【4、自然语言处理-企业级任务型对话机器人「解锁式学习」】
课程内容:该课程主要讲解了智能对话系统导论、使用RASA制作第一个对话机器人、基于rasa做KBQA、NLU的学习、HuggingFacesTransformer和基于规则的对话状态跟踪、基于模型的对话跟踪和基于规则的Dialogue Policy、NLU和DST联合建模方法、基于模版的对话生成和有限状态机(FSM)、端到端的对话系统和智能对话系统在工业中的应用
(2)知识图谱:本体构建,知识抽取和表示
研究难点和创新点包括:
NER:命名实体识别任务
KBQA:基于图谱的问答任务
「第1章」:知识图谱理论篇
课程名称:【8565】【知识图谱「自由式学习」】
课程内容:等待介绍文本
---考核---(可选择,联系教务老师)
「第2章」:知识图谱项目篇
课程名称:【28565】【自然语言处理-人工智能辅助信息抽取「自由式学习」】
课程内容:该课程主要讲解了知识图谱的概念以及应用、中文自然语言处理、文本相关的处理、关系抽取、PCNN、图像预训练、NLP预训练模型、BERT NER实践等知识点
---考核---(可选择,联系教务老师)
「第3章」:知识图谱项目篇
课程名称:【28567】【自然语言处理-医疗知识图谱构建及图表征学习「自由式学习」】
课程内容:该课程主要讲解了数据获取、数据处理、BiLSTM+CRF、Neo4j、图表征学习、已经额外的LSTM知识
---考核---(可选择,联系教务老师)
「第4章」:知识图谱项目篇
课程名称:【30722】【知识图谱项目实战「自由式学习」】
课程内容:该课程主要讲解完整项目的运行和部署、项目需求分析、知识图谱的设计、数据的获取以及导入、程序设计、知识图谱数据可视化等知识点
---考核---(可选择,联系教务老师)