深度学习在自然语言处理的应用v课件

上传人:枫** 文档编号:569430849 上传时间:2024-07-29 格式:PPT 页数:55 大小:1.85MB
返回 下载 相关 举报
深度学习在自然语言处理的应用v课件_第1页
第1页 / 共55页
深度学习在自然语言处理的应用v课件_第2页
第2页 / 共55页
深度学习在自然语言处理的应用v课件_第3页
第3页 / 共55页
深度学习在自然语言处理的应用v课件_第4页
第4页 / 共55页
深度学习在自然语言处理的应用v课件_第5页
第5页 / 共55页
点击查看更多>>
资源描述

《深度学习在自然语言处理的应用v课件》由会员分享,可在线阅读,更多相关《深度学习在自然语言处理的应用v课件(55页珍藏版)》请在金锄头文库上搜索。

1、深度学习在自然语言处理的应用张俊林畅捷通股份有限公司2014.10.31深度学习在自然语言处理的应用v课件大纲深度学习简介基础问题:语言表示问题Word Embedding不同粒度语言单元的表示字符/单字/单词/短语/句子/文档值得重点关注的模型RAE/Tensor Network/卷积网络NLP的应用语言模型中文分词知识挖掘情感计算机器翻译ParaphraseIR探讨与思考2深度学习在自然语言处理的应用v课件深度学习(表示学习)3深度学习在自然语言处理的应用v课件深度学习(表示学习)4深度学习在自然语言处理的应用v课件Layer-Wise Pre-Training5深度学习在自然语言处理的应

2、用v课件Denoising Autoencoder6深度学习在自然语言处理的应用v课件自然语言交互的时代7深度学习在自然语言处理的应用v课件大纲深度学习简介基础问题:语言表示问题Word Embedding不同粒度语言单元的表示字符/单字/单词/短语/句子/文档值得重点关注的模型RAE/Tensor Network/卷积网络NLP的应用语言模型中文分词知识挖掘情感计算机器翻译ParaphraseIR探讨与思考8深度学习在自然语言处理的应用v课件One-Hot 表示One Hot表示在传统NLP中很常用Similarity(dog,cat)=09深度学习在自然语言处理的应用v课件Word Emb

3、edding词向量:单词的分布向量表示(Distributional Representation)词向量表征了单词使用上下文中的句法语义特征One-Hot的字面匹配到DR的语义匹配Similarity(dog,cat)Similarity(dog,the)Similarity(“the dog smiles.”,“one cat cries.”)10深度学习在自然语言处理的应用v课件无监督训练获得单词的WE-word2vec单词:苹果11深度学习在自然语言处理的应用v课件无监督训练获得单词的WE-word2vec单词:长颈鹿12深度学习在自然语言处理的应用v课件无监督训练获得单词的WE-wo

4、rd2vec单字:张13深度学习在自然语言处理的应用v课件无监督训练获得单词的WE-word2vec单字:雯14深度学习在自然语言处理的应用v课件无监督训练获得单词的WE-word2vec单字:葱15深度学习在自然语言处理的应用v课件Word2vecCBOW:16深度学习在自然语言处理的应用v课件word2vecSkip-Gram:17深度学习在自然语言处理的应用v课件word2vecCBOW+ Hierarchical Softmax18深度学习在自然语言处理的应用v课件word2vecCBOW+Negative Sampling最大化:st:正例负例19深度学习在自然语言处理的应用v课件不

5、同粒度语言单元的表示-字符/单字字符上下文向量 英文:捕获构词法中文:捕获字搭配 英文拓展:字符N-Gram 中文拓展:单字N-Gram?20深度学习在自然语言处理的应用v课件不同粒度语言单元的表示-短语/句子/文档方法一:单词词向量取和(Summrization)很多情况都做此种简化处理过于简单,但是仔细思考有一定道理方法二:单词词向量加权求和Huangs Work权重:类似于IDF方法三:RNN21深度学习在自然语言处理的应用v课件不同粒度语言单元的表示-短语/句子/文档方法四:Matrix-Vector NN22深度学习在自然语言处理的应用v课件不同粒度语言单元的表示-短语/句子/文档方

6、法五:卷积神经网络23深度学习在自然语言处理的应用v课件大纲深度学习简介基础问题:语言表示问题Word Embedding不同粒度语言单元的表示字符/单字/单词/短语/句子/文档值得重点关注的模型RAE/Tensor Network/卷积网络NLP的应用语言模型中文分词知识挖掘情感计算机器翻译ParaphraseIR探讨与思考24深度学习在自然语言处理的应用v课件RAE(Recursive AutoEncoders)推导短语及句子级别的Word Embedding表示25深度学习在自然语言处理的应用v课件Neural Tensor Networks表达多个实体之间的关系 /两个单词之间某种操作

7、26深度学习在自然语言处理的应用v课件Neural Tensor Networks27深度学习在自然语言处理的应用v课件卷积网络( Convolutional Deep Neural Network )全局特征选择与融合/不定长转换为定长表示28深度学习在自然语言处理的应用v课件大纲深度学习简介基础问题:语言表示问题Word Embedding不同粒度语言单元的表示字符/单字/单词/短语/句子/文档值得重点关注的模型RAE/Tensor Network/卷积网络NLP的应用语言模型中文分词知识挖掘情感计算机器翻译ParaphraseIR探讨与思考29深度学习在自然语言处理的应用v课件语言模型3

8、0深度学习在自然语言处理的应用v课件语言模型Bilinear-LM31深度学习在自然语言处理的应用v课件语言模型RNNLM32深度学习在自然语言处理的应用v课件深度学习用于中文分词-思路133深度学习在自然语言处理的应用v课件深度学习用于中文分词-思路234深度学习在自然语言处理的应用v课件深度学习用于中文分词两者思路基本相同基于字的Word Embedding+三层神经网络+BEMS标记序列分类思路2引入全局的Viterbi解码(分类后处理)效果:和主流分词算法效果接近CRF/Maxent+二元特征类似思路同样可以套用到POS/NER/Parser等场景这是利用Word Embedding解

9、决NLP问题最直观的NLP应用思路考虑探索下非标准三层神经网络结构的复杂模型35深度学习在自然语言处理的应用v课件深度学习用于知识挖掘两大类问题现有知识库的新知识推理CYC,WordNet,FreeNet目前的文献做法大思路基本一致已知实体用Word Embedding表示实体关系用Tensor Network建模后向传播+SGD训练从自由文本中挖掘结构化知识36深度学习在自然语言处理的应用v课件现有知识库的新知识推理37深度学习在自然语言处理的应用v课件现有知识库的新知识推理最小化目标函数:正例:负例:38深度学习在自然语言处理的应用v课件从自由文本中挖掘结构化知识整体结构词法级特征39深度

10、学习在自然语言处理的应用v课件从自由文本中挖掘结构化知识句子级特征抽取:卷积网络40深度学习在自然语言处理的应用v课件机器翻译(通用模型)最常见的通用模型:Encoder-Decoder ModelEncoderDecoder语义向量41深度学习在自然语言处理的应用v课件机器翻译(Encoder-Decoder具体例子)ACL2014 Best Paper:Fast and Robust Neural Network Joint Models Joint Models for Statistical Machine Translation网络结构语言模型翻译模型42深度学习在自然语言处理的应用

11、v课件机器翻译-很多地方可以引入DL单词对齐短语对齐短语重排序语言模型翻译模型联合模型翻译结果重排序单词对齐43深度学习在自然语言处理的应用v课件情感计算核心的两个问题句子级的Word Embedding表示前面讲过这个问题如何将情感倾向编码到各级Word Embedding中半监督或者监督学习:通过训练过程将情感倾向编码到WE结构中44深度学习在自然语言处理的应用v课件Paraphrase(整体框架)S1:The judge also refused to postpone the trial date of Sept. 29.S2: Obus also denied a defense m

12、otion to postpone the September trial date.Paraphrase的问题:Semantic(S1)=Semantic(S2)?45深度学习在自然语言处理的应用v课件Paraphrase(RAE)Darling!Im here!Darling!Im here!46深度学习在自然语言处理的应用v课件Paraphrase(Dynamic Pooling)应用拓展:很明显这个方法可以照搬不动放到应用拓展:很明显这个方法可以照搬不动放到QA问题匹配中问题匹配中(一篇灌水论文就此诞生了!)(一篇灌水论文就此诞生了!)欧式距离:越小越好47深度学习在自然语言处理的应用

13、v课件DL for IR一种直观的方法48深度学习在自然语言处理的应用v课件DL for IR一种没那么直观的方法49深度学习在自然语言处理的应用v课件大纲深度学习简介基础问题:语言表示问题Word Embedding不同粒度语言单元的表示字符/单字/单词/短语/句子/文档值得重点关注的模型RAE/Tensor Network/卷积网络NLP的应用语言模型中文分词知识挖掘情感计算机器翻译ParaphraseIR探讨与思考50深度学习在自然语言处理的应用v课件探讨与思考与传统方法比较DL的优势所在抛掉特征选择步骤简洁地融入语义级特征很多应用可以直接绕过NLP的中间场景比如POS,句法,减少错误累

14、加语言长程依赖容易建模:词向量+卷积网络可以解决语言模型的数据稀疏问题:15-Gram很多场景如果优化速度非常快,方便应用的工程化实用化51深度学习在自然语言处理的应用v课件探讨与思考目前研究模式中最基础和重要的问题短语、句子、段落、文档级别的有效Word Embedding表示文档级别表示很多应用直接受益:分类,IR等问题:文档级别采用低维表示,是否丢失细节信息?只能作为辅助手段?句子级别的低维表示很有意义,最关键。如何更能体现“深度”的思想目前还说不上很Deep:WE为主是否有除了“Word Embedding”外更Deep的模式?目前看DL在NLP哪些方面好哪些一般?涉及语义处理的应用:

15、表现好不涉及太多语义的应用:State-of-the-art说明什么?Word Embedding已经把传统ML方法使用特征融合进去了语义级别特征效果体现明显52深度学习在自然语言处理的应用v课件探讨与思考与CRF的比较及区别与联系CRF:线性 VS DL:非线性CRF:高维离散特征 VS: DL:低维连续特征结论:非线性模型对于低维连续特征有效,对高维离散特征无效DL在推荐系统方面应用方法的思考不成熟的初步思路我个人看好DL在NLP方面的作用与传统方法比有明显优点发展初期:机会多、挑战大NLP方向博士生的黄金时代非常容易想到很多New Idea一把新的锤子,很多钉子可以去敲53深度学习在自然语言处理的应用v课件广告时间54深度学习在自然语言处理的应用v课件Thanks!55深度学习在自然语言处理的应用v课件

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 工作计划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号