今天在家里没有连V的情况下,发现博客的评论竟然加载不出来了(我说这么最近半年博文的评论数直线下降(大雾))…搜了一下才知道原来半年前国内就不能正常访问disqus了,因为本站用到了disqus作为评论系统,所以自然是挂了… 真是感叹国内的互联网环境的安(xian)全(e),看了一下解决方法:首先检测当前访问下能不能正常加载disqus(即在一定时间内有响应);如果能,那么走正常的流程,调disqu ...
Read more »

建立这个博客已经两年多,自己从来还没有在这上面写过关于个人的东西。当初对这个博客的定位是希望能督促自己多写出一些技术类的文章,一来可以一边学习一边总结,二来也给自己留一个底,方便打捞自己曾经学习过的东西,三来获取能够帮助到别人。 今天想要写些关于自己的东西,多年没有动笔写作,才发觉文笔生疏了很多,想起五六年前还在读本科的自己,动不动地就在空间里文笔大攉强说愁,现在想来除了觉得有点可笑和幼稚之外,也 ...
Read more »

本文的话题老生常谈,文本分类应该是很多NLPer非常常遇到和熟悉的任务之一了,下面总结一下博主在处理这类任务的过程中特征工程方面的经验,希望对各位NLP入门者或者在做此类任务的新手有所帮助。对于其他的文本处理任务,也会有一定的参考意义。 概述文本分类,顾名思义,就是根据文本内容本身将文本归为不同的类别,通常是有监督学习的任务。根据文本内容的长短,有做句子、段落或者文章的分类;文本的长短不同可能会导 ...
Read more »

导读目前采用编码器-解码器 (Encode-Decode) 结构的模型非常热门,是因为它在许多领域较其他的传统模型方法都取得了更好的结果。这种结构的模型通常将输入序列编码成一个固定长度的向量表示,对于长度较短的输入序列而言,该模型能够学习出对应合理的向量表示。然而,这种模型存在的问题在于:当输入序列非常长时,模型难以学到合理的向量表示。 在这篇博文中,我们将探索加入LSTM/RNN模型中的atte ...
Read more »