6月 192011
 

solidot by blackhat

朽木 写道 “在Google的输入框中输入“filetype:txt site:10086.cn”进行搜索,反馈的结果页面让人惊掉了下巴:中国移动手机用户的私人短信竟然被显示出来!如果注意结果页面的链接地址,你该庆幸还是提心吊胆?因为链接的域名几乎全是gd.10086.cn,也就是说可能只是广东移动用户的短信被搜索出来。”这些短信内容与个人隐私关系不大,推测是测试之用。

例如:

gd.10086.cn/zf/cx/mms_file/20091227/1008010/text.txt
在边度啊!想不想去雄师会玩吖,我现在.在雄师玩,想来就打电话给我!

gd.10086.cn/zf/cx/authormms_file/20100205/1034/-M0000001046.txt
小丫头慧儿:虽然爱你很累很辛苦,但我还是决定爱你的心不变,因为你是我此生不变的老婆!除非有一天你不再爱我!我希望那天再我们的日子里不再有,如果有那么一天我会 …

gd.10086.cn/zf/cx/authormms_file/20100213/1096/-M0000001137.txt
大宝,爱老虎油!

gd.10086.cn/zf/cx/mobanmms_file/20101031/9009/________.txt
我现在过你那了你下来. Continue reading »

3月 112009
 

DMOZ是全球最大的开放网络目录之一,将你的网站成功提交到DMOZ并被其收录,将对你的网站推广起到至关重要的作用,这是因为有许多非常重要的搜索引擎和在线的门户网站都使用DMOZ的搜索结果作为其自身的搜索结果。因其可浏览分类目录的编辑工作全部由人工完成。所以在向 DMOZ提交你的网站时,为确保网站被成功收录,请注意以下事项:

1.确保网站页面美观整洁、无错误

尽管编辑看的是一个网站的实际内容,不过他们也和我们一样,网站中的错误拼写及拙劣的外观会使他们对你网站的印象大打折扣。根据我的经验,那些经过专业设计且内容良好的站点,总是会为DMOZ收录的。

2.确保提交的网站是非采集的正规网站

如果你的网站内容都是通过采集其他网站而来的,那么你的提交极有可能被DMOZ拒绝。DMOZ不予收录那些转载、镜象或复制站点。对于收录的站点,一旦发现它们是镜象、复制或非原创,DMOZ也会将其剔除出来如果非要采集的话,建设最大限度的将采集的内容和标题修改成“伪原创”。这样DMOZ的编辑会认为你的网站至少提供了一些原创的内容。

3.不要短时间内反复向DMOZ重复提交 Continue reading »

9月 102008
 

腾讯科技消息

据百度方面透露,由于淘宝屏蔽百度严重损害卖家利益,大批淘宝卖家已经通过电子邮件等方式,直接联系百度申请收录其网店页面。
百度相关负责人表示考虑建立绿色通道,为直接收录淘宝卖家网页信息提供便利,但具体措施尚未出台。9月8日,淘宝网宣布推出一项消费者保障计划,该计划首次向外界宣布淘宝屏蔽搜索引擎百度的举措。淘宝官方解释称“部分屏蔽搜索引擎是为杜绝不良商家欺诈。”

淘宝称目前80%以上的消费者投诉源于极少数不良商家。这些不良商家通过技术或商业手段优化通用搜索的页面结果,获得较高排名骗取消费者点击。通过屏蔽部分搜索引擎,可以最大限度地避免消费者上当受骗。

据相关互联网搜索引擎专家表示,网页要被百度索引库索引,一般是通过百度“蜘蛛爬虫”抓取的方式,但如果网页建设者和搜索引擎双方都愿意,直接将网页URL地址放入百度索引库,也并不存在任何技术方面的难题。

据了解,在美国,ebay也在使尽办法压制Google C2C抬头。但ebay不敢屏蔽Google,主要是不敢损害店主利益,不敢得罪店主。

百度于今天宣布C2C支付平台名为“百付宝”,并表示C2C平台很快上线。

8月 312008
 

文/月光博客

  中国的网民出现了很奇怪的现象:大量的新网民和菜鸟新手喜欢用百度搜索,因为百度往往搜索到很多别处搜索不到的页面,但内容的匹配度则令人质疑,而专业人士和老鸟则更喜欢用Google,个人站长则普遍和百度有“个人恩怨”。因此百度在业界的Blog以及社区中口碑都不太好,但在普通的低层次的网民心中却不错,这些大量的普通网民给百度带来了大量流量。那么,Google和百度收录网站页面的标准到底存在怎样的不同呢?

  首页规则

  搜索引擎的索引更新速度是衡量搜索质量的一个重要的参数,对于大型网站(比如门户新闻网站)以及其他更新量大的网站,百度和Google的索引速度都很快,基本上都能做到当天更新。

  但是对于更新量小的网站,例如博客,两者就有较大区别,Google对高权重并提交Sitemaps和Ping的网站,索引速度可以达到分钟级别,有时刚刚写完一篇文章,几分钟后,就能在Google中搜索到解决,但是对于百度来说,索引速度较慢,通常仅仅更新了博客网站的首页,搜索文章标题,排在前面的是博客首页或者目录页,而不是文章页。

  总的来说,百度对于网站首页的关注以及权重给的似乎特别高。

  半个月规则

  百度对于更新量较小的博客,收录页面有一个奇怪的时间规则限制:半个月规则,根据我对于月光博客文章收录速度的观察,通常情况下,半个月之内发布的文章,使用百度搜索文章标题,排在前面的基本上都是门户网站转载或聚合我的文章,我写的原始文章不见踪影。而使用Google搜索,我的原文基本上都是第一位。

  而大约半个月之后,我的文章的原始内容才在百度上出现,这时候搜索文章的标题,我的原文才会成为百度搜索结果的第一位。 Continue reading »