Web161 - web161.com

General Information:

Latest News:

【转】数据分析入门必看 20 Jun 2012 | 10:07 am

今早突然有个想法,就是经常有网友会对数据分析方面有一些困惑,并且咨询我该怎么办?并且经常是同样的问题,所以觉得 [...]

百度发布Web2.0反垃圾攻略 3 May 2012 | 02:15 pm

为了扼制Web2.0页面越来越严重的垃圾信息、群发信息,以及不断蔓延的在Web2.0页面做外链、做SEO的趋势,百度站长平台今日发布了Web2.0反垃圾详细攻略。 根据《Web2.0反垃圾详细攻略》,百度站长平台不仅警告了在博客、论坛、SNS等Web2.0页面发垃圾信息以SEO的部分站长,也对网站管理员提出了防止垃圾信息的建议。百度站长 平台《Web2.0反垃圾详细攻略》如下: 一、web2.0站...

谈SEO中的冰山理论 11 Apr 2012 | 02:38 am

文学界海明威说:“冰山运动之雄伟壮观,是因为他只有八分之一在水面上。”文学作品中,文字和形象是所谓的“八分之一”,而情感和思想是所谓的“八分之七”。前两者是具体可见的,后两者是寓于前者之中的。 冰山绝大部分的质量是在海平面以下的,所以光从露在外面的体积是无法估计整座冰山到底有多大。而露在最外面的确实是引人瞩目的。附图: “冰山理论”告诉我们:冰山所能为我们看见的部分只是它整体的1/8,而其7/8的...

正向最大匹配算法 9 Apr 2012 | 01:39 am

正向最大匹配算法基本思想:假设字典中最长的词语字数为m,先根据汉语标点符号及特征词把汉语句子切分为短语,然后去取短语的前m个字,在字库里面查找时候存在这个词语,如果存在,短语就去掉在个词;如果不存在就去掉这m个字的最后一个字,检查是否是单字,若是输出此字并将短语减去此字,若不是则继续判断看字库是否存在这个词,如此反复循环,直到输出一个词,此后继续取短语的前m个字反复循环。这样就可以将一个短语分成词...

QQ圈子让社交关系更广泛 6 Apr 2012 | 12:33 am

社交是人类的一个最基本的需求。但是,自然给我们人类的大脑,只能让我们维系150-200个左右的好友。超出这个范围,就会有好友慢慢地被淡忘。很多社会群体的平均大小是150,这个数也被称为顿巴数(Dunbar Number)。例如,公元前6000年左右,中东地区新石器时代村落的人数大约在120-150人之间。在罗马共和国时期,罗马军队的一个基本作战单位的人数大约为130。20世纪50年代以来,社会学家...

从模拟点击谈SEO用户体验 3 Apr 2012 | 02:26 am

没有想过写这篇文章,之所以写是领导给我发了一段话。下面引用这段话“模拟用户,就的点击原理。今天写这篇文章,也不知道大家是否会觉得这个是在骗点击,但是我又想要把这个干货分享到极致。刚刚写文章的时候,我就让大家模拟用户,去搜索“太原搬家网”,然后去点击第三个!点击后,我也一直在引导你们去看里面的布局,这个就是在让延长访问时间。重点:你可以去找20个朋友,不同的IP,搜索这个关键词,然后点击这个网站,挂...

通过淘宝分词算法看百度和Google 16 Mar 2012 | 02:36 am

很早的一篇文章了,不过内容还不错,重新放上来给大家看看。 首先,我们搜索“男女人字拖鞋”这个关键词。 http://search.taobao.com/search?shopf=newsearch&q=%C4%D0%C5%AE%C8%CB%D7%D6%CD%CF%D0%AC 找到宝贝是264件。(数据可能因为有新宝贝上架或者宝贝下架而发生变化) 按一般人的理解,“男女人字拖鞋”,他是一个完整的词,...

统计学术语(一) 16 Mar 2012 | 02:29 am

1、统计学(statistics):主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为相关决策提供依据和参考。也就是收集、处理、分析、解释数据并从数据中得出结论的科学。主要又分为描述统计学和推断统计学。 2、概率(proability):度量一随机事件发生可能性大小的实数,其值介于0 与1 之间。一随机事件的慨率可看作在相同条件下重复试验时,该事件...

信任排名机制 15 Mar 2012 | 02:43 am

信任排名的基本观点就是互联网上“好的”和“值得信赖”的网页都紧密的链接在一起,然后让垃圾网页只能在这个核心外游荡。因此,通过迭代算法和类似于页面排名的衡量标准让只有来自信任网站的源(trusted seed sources)传递更多的排名权重。信任排名可以用来预报某个网页的质量高低和是否是垃圾网页。 信任排名概念图 当搜索引擎不披露有关这个衡量标准的相关数据时,有可能某种“距离可信赖信息源距离“的...

SEO中的词组、非词组、停止词 15 Mar 2012 | 02:14 am

词组(phrase)是指由两个以上的词语组合而成的语法单位。我们在搜索引擎中使用和在平常使用时的意义稍有不同。我们在使用搜索引擎时,将几个词放在一起作为一个词来搜索。搜索引擎称这些放在一起的词为“词组”。 非词组(antiphrase)非词组就是搜索者键入一些搜索词,其中有些搜索项对搜索结果是无关紧要的词,例如:“什么是搜索引擎营销”这个词组中“什么是”对于找到合适的网页毫无用处,甚至会引导搜索引...

Recently parsed news:

Recent searches: