算法 第一章作业

一、代码规范

该学期使用的代码规范为Google C++:http://zh-google-styleguide.readthedocs.org/en/latest/google-cpp-styleguide/

 

二、《数学之美》读后感

  在打开这本书之前,我是很抗拒读的,因为我觉得这种书讲的东西一般都太高深了,以我目前的水平,看完后也是云里雾里,不知所云,只留下满满的枯燥。但它给了我很大的惊喜,这是一本让我可以带着兴趣看下去,并且学到东西的书。我主要读了两个章节,一是余弦定理和新闻的分类,二是闪光的不一定是金子-谈谈搜索引擎作弊问题。

  计算机其实读不懂新闻,它只能快速计算,所以我们其实是用一组数字,或者说一个向量来描述一篇新闻。它详细讲述了我们可以根据新闻中所有实词的单文本词汇频率、逆文本频率值(TF/IDF)去获得属于新闻的特征向量,并指出如果两篇新闻的特征向量相近,则对应的新闻内容相似,它们应当归在一类,反之亦然。且如果两个向量的方向一致,及夹角接近零,那么这两个向量就相近。而余弦定理就是我们判断向量是否相近的有力工具。当夹角的余弦接近于一时,两条新闻相似,从而可以归为一类。在我学习余弦定理时,我从来没想过它还可以和新闻扯上关系,它的作用远远超出我的想象。

  而对于“闪光的不一定是金子”,我一开始是有些害怕的,因为我搜索关键词时最多翻到第三页,那我所见到的有多少是真实的,又有多少是通过作弊得到的呢?幸运的是,吴军博士告诉我们,作弊是可以被抓到的。而抓作弊的方法很像信号处理中的去噪音的办法。我们如果在发动机很吵的汽车里用手机打电话,对方可能听不清;但是如果我们知道了汽车发动机的频率,我们可以加上一个和发动机噪音相反的信号,很容易地消除发动机的噪音,这样,收话人可以完全听不到汽车的噪音。作弊者所做的事就是像在手机中加入杂音一样,所以消除方法也是对应来消除,一些靠作弊上去的网站,不是不会被抓,只是抓取需要时间。一个网站要想要长期排名靠前,就需要把内容做好,同时要和那些作弊网站划清界限。

  总的来说,《数学之美》是一本有意思,并且可以学到知识的书。

你可能感兴趣的:(算法 第一章作业)