建立这个博客已经两年多,自己从来还没有在这上面写过关于个人的东西。当初对这个博客的定位是希望能督促自己多写出一些技术类的文章,一来可以一边学习一边总结,二来也给自己留一个底,方便打捞自己曾经学习过的东西,三来获取能够帮助到别人。 今天想要写些关于自己的东西,多年没有动笔写作,才发觉文笔生疏了很多,想起五六年前还在读本科的自己,动不动地就在空间里文笔大攉强说愁,现在想来除了觉得有点可笑和幼稚之外,也 ...
Read more »

本文的话题老生常谈,文本分类应该是很多NLPer非常常遇到和熟悉的任务之一了,下面总结一下博主在处理这类任务的过程中特征工程方面的经验,希望对各位NLP入门者或者在做此类任务的新手有所帮助。对于其他的文本处理任务,也会有一定的参考意义。 概述文本分类,顾名思义,就是根据文本内容本身将文本归为不同的类别,通常是有监督学习的任务。根据文本内容的长短,有做句子、段落或者文章的分类;文本的长短不同可能会导 ...
Read more »

导读目前采用编码器-解码器 (Encode-Decode) 结构的模型非常热门,是因为它在许多领域较其他的传统模型方法都取得了更好的结果。这种结构的模型通常将输入序列编码成一个固定长度的向量表示,对于长度较短的输入序列而言,该模型能够学习出对应合理的向量表示。然而,这种模型存在的问题在于:当输入序列非常长时,模型难以学到合理的向量表示。 在这篇博文中,我们将探索加入LSTM/RNN模型中的atte ...
Read more »

上篇博文:聊天机器人中的深度学习技术之一:导读主要从宏观上对目前聊天机器人所用到的主要技术进行了介绍。这篇博文会介绍并实现一个基于检索的模型,使用了双层Decoder的LSTM模型,通过这个模型可以实现聊天机器人。 本文涉及到的数据和代码见Github仓库地址。 基于检索模型的聊天机器人本文我们将介绍和实现一个基于检索模型的聊天机器人。检索模型所使用的回复数据通常是预先存储且知道(或定义)的数据 ...
Read more »