10月 122011
 

阿舍在用指令操作 Ubuntu 的時候,經常會需要知道檔案的路徑,所以,也就常常會用到搜尋檔案的指令,阿舍比較常用的是 whereis 和 find,其實,還有 locate 和 which 二個指令可用,這四個指令都有不同的功能,阿舍一直時間去搞清楚,今天花了點時間,就把它整理如下了。

find
這個算是功能最多的指令,可以用依檔名、擁有者、群組和權限…等等一堆來搜尋檔案,不過,find 指令是一定要指定搜尋的路徑,否則就只有搜尋目前所在的資料夾,例如,阿舍在家目錄用 find hosts 的指令來搜尋 hosts 檔的話,就一定找不到東西,如果改用 find /etc hosts 的話,就會出現一堆檔案名稱裡有 hosts 這個四個字的所有檔案出來,如果再改成 sudo find /etc -name hosts 就會找出更接近我們要找的檔案列表出來的。

locate
這個指令和其他三個指令不同的地方是,locate 指令並不是宜的去搜尋檔案,而是去搜尋由 updatedb 指令所建立和更新的資料庫並讀入記憶體中,所以,locate 指令的搜尋速度遠比其他的指令來的快, Continue reading »

6月 162011
 

搜狐IT 北京时间6月15日消息

据国外媒体报道,谷歌搜索部门高级副总裁艾伦•尤斯塔斯(Alan Eustace)在Inside Search搜索产品发布会上阐述了首席执行官拉里•佩奇(Larry Page)对互联网搜索的新理念。

包括
1、应提供更加有组织和逻辑的搜索结果,
2、在搜索前就提供相关结果;
3、谷歌应提供更好的背景资料。

尤斯塔斯还认为,移动搜索将很快超过桌面搜索。 Continue reading »

4月 042009
 

谷歌音乐来势汹汹,百度股价应声下跌

2009年3月30日,根据消息人士透露,谷歌音乐搜索将与包括华纳、索尼、百代以及环球等上百家唱片公司签下合作协议,并即将发布谷歌音乐搜索正式版。在此之前,谷歌音乐的音乐搜索这项功能一直为测试版本,搜索服务则是由巨鲸音乐网代为提供。去年的8月5日,谷歌正式投资巨鲸音乐网,并推出了免费的正版MP3搜索和试听服务。

《华尔街日报》在本周一的出版的报纸上报道称,谷歌已经与华纳、环球、百代、索尼四大唱片公司在内的超过140家超片公司达成将近110万首歌曲的正版授权,用户可以通过谷歌音乐进行搜索并且免费下载。谷歌方面会在音乐搜索栏目中嵌入部分广告,并以版税的形式将部分广告费用返还给唱片公司。

谷歌大众化区总裁李开复表示:“ 其他对手相比,谷歌MP3搜索一举解决了音乐版权问题。” 今年年初,曾有消息称,谷歌中国正研发一项全新的MP3搜索技术,该技术支持语音搜索功能,用户通过“哼歌”就可以搜索到想要的歌曲。 Continue reading »

11月 172008
 

这两天,互联网上出现了这样的观点:“垃圾信息是搜索不公正主因” 。

谷歌中国认为,这是在搜索的“公正性”与“准确性”两个不同层次的事情间偷换概念,我们认为中国搜索行业最需要做的、最紧迫的事情,就是正视公正性与客观性对中国搜索行业的根本性意义,没有搜索公正性,搜索的准确性就无从谈起。

或者让我们用反垃圾信息(这也只是搜索准确性的技术领域之一)来举例。

在海洋般浩瀚的互联网世界里,任何搜索引擎都会受到垃圾乃至不良信息影响,然而这些垃圾或不良信息在不的商业模式面前面临着两种不同的生存可能:一种是鬼鬼祟祟千方百计去骗取网民的注意力;一种是掏点小钱就能“漂白”身份登堂入室畅通无阻。对于搜索厂商而言,能否杜绝前者,只是技术问题;能否根除后者,则是价值观问题。就好比一个人,人可以有能力的不同,但所有人都必须堂堂正正。

事实上,谷歌中国相信,今天搜索行业的技术水平已远远超出了靠人工干预解决垃圾信息的初级水准。在这方面的技术研发上,谷歌从诞生第一天开始就进行积累,至今已有10年历史,而通过机器、技术手段来解决垃圾信息早就成为世界通行的法则,现实已经证明了它的成功。所以,在垃圾信息和公正性上,我们旗帜鲜明的认为:

– 不能用搜索“准确性”混淆甚至代替搜索“公正性”的概念和基础地位
– 世界反垃圾信息技术水准无时无刻不在突飞猛进,不能让反垃圾信息成为大规模人工干预搜索结果的借口

在正式切入公正性的定义、搜索引擎的根本之前,我想讲两个故事,这两个故事都同中文搜索的公正性直接相关。这两个故事或许会让每一个致力于中文搜索技术进步的工程师感到痛心。我们不妨思索这样一个问题——如果搜索结果页面的黄金位置注定是广告,那搜索技术的创新还有什么意义?中文用户会有怎样畸形的体验?

1.迷失的中文搜索“黄金三角区”。
通常搜索引擎结果页面都有一个最最重要的黄金三角区——“搜索结果左上角”,也就是最前面的五个搜索结果,这个区域就好比一张报纸的头版头条一样珍贵和重要。用户期待在这里看到最准确的他们最需要的信息。
我们看到一个调查报告,美国用户在他们最常使用搜索引擎的搜索结果页面上,目光主要聚焦在搜索结果的“黄金三角区”,大概用时30秒,而中国用户的目光却散落在整个页面,用时超过60秒,所谓“黄金三角区”对中文搜索居然毫无意义。这很重要的一个原因,是用户在原本的关键位置无法找到非广告内容所致,他们需要自己满屏地、甚至翻屏的辛苦寻找有用信息。合计起来,中文用户每天比美国用户在搜索上浪费超过250万小时(或者超过10万天)的时间。

   Continue reading »

8月 302008
 

新闻来源:计世网

用户可以利用链接后面包含的向上、向下的箭头和按钮对谷歌的搜索结果进行顺序调整、发表评论。谷歌已经在其搜索结果网页上进行了公开测试。

当地时间本周二,谷歌著名的工程师本·戈麦斯在公司的官方博客上写道:“我在这一点上说不清楚我们希望通过这一功能得到什么,我们只是对用户如何使用这一功能感到好奇。”

这些测试网页的一个屏幕截图还显示了搜索结果链接后有一个“x”按钮,显然是不让用户看到测试功能。

如果谷歌决定将这一功能整合为缺省功能,这一改变将是谷歌让用户参与搜索结果网页互动而迈出的重大一步。谷歌为注册有谷歌帐户的用户提供了许多定制化和个性化选项,例如通过Web History服务记录用户的搜和上网活动。但在这次测试中,新功能显然对所有用户都有效。

业界曾一直在批评谷歌过于依赖计算机算法,不给用户提供对搜索结果进行反馈、控制和评价的机会。随着Web 2.0服务的流行,用户参与各种服务也成了“家常便饭”。

为了挑战谷歌在搜索领域的霸主地位,数年来,各种搜索引擎服务如雨后春笋般迅速发展,试图给用户提供更多的参与机会,例如詹森·卡拉卡尼斯的Mahalo、雅虎的Delicious社交网络服务和吉米·威尔士的Wikia Search。

8月 052008
 

cnbeta 2008-08-05

===PS: 试用了一下谷歌音乐(google music), 音质确实不错! 速度也很快.值得推荐!===

谷歌中国和巨鲸音乐网正式宣布,在谷歌中国的整合搜索推出音乐搜索功能的实验版—谷歌音乐搜索(http://www.google.cn/music).此项新功能通过由巨鲸音乐网提供音乐内容、谷歌提供搜索技术、音乐界与巨鲸音乐网分享广告收入的模式来满足中国用户不断增长的互联网娱乐需求.

此次谷歌中国在 www.google.cn 平台率先推出该功能的实验版,也是谷歌在全球第一次尝试音乐搜索服务.目前,在实验阶段,谷歌整合搜索的音乐功能可以为用户提供上百家唱片公司旗下的数万首歌曲的搜索服务.在此次发布的整合搜索音乐功能实验版中,先期囊括了上百家唱片公司的数万首中文歌曲,这一正版音乐搜索功能的推出,可避免用户以往音乐搜索死链频频、下载速度慢、歌曲质量差如音效差、不完整甚至受到病毒侵害的苦恼.

此次合作创建了一种崭新的商业模式,即由巨鲸音乐网与音乐产业对巨鲸音乐广告收入分成,为正版音乐的合法下载提供了一种可持续的解决之道,谷歌通过自身强大的搜索技术和用户基础为巨鲸音乐带来新的产品功能、体验和大量用户.

分析指出这种合作盈利模式的出现,搭建了一个多方共赢的平台:广大用户自此可以合法地、方便地、免费的、高质量试听、下载正版音乐;唱片公司通过授权,合理、合法地维护了自己的版权;谷歌则获得新的用户群,同时通过负责任的方式提升用户搜索体验.

巨鲸音乐网CEO陈戈表示:”针对中国上亿网民巨大的免费音乐下载、视听等使用需求,是时候建立相应的商业模式,用服务于广告主的音乐广告平台、广告产品及服务来回馈于音乐的创造者.我们非常高兴谷歌同我们分享同样的理念.”

谷歌大中华区总裁李开复博士表示:”谷歌十分认同巨鲸音乐网一直倡导的下载正版音乐的做法,互联网产业绝不应该成为音乐产业的对立面,此次通过与巨鲸音乐网合作,共同在整合搜索中发布音乐功能实验版,实现了用户利益、关联产业利益、谷歌利益的良好平衡,谷歌一直深信共赢而非独大才是致力于长远的发展之道.”

11月 022007
 

   最近因为工作需要,在网上寻找数据采集软件,刚开始下载了好几种采集软件,发现不是功能有限制,就是功能不足满足不了我的需要(因为我想要采集的网站结构比较复杂,具体是什么网站保密~),偶然发现了一个以前没见过的TOPFISHER数据采集软件,看到网站的介绍,说是能够精确的采集到数字及日期类型的数据,也没有什么功能限制,而这正是我想要的啊,于是就下载下来试试看。

   下载下来一看郁闷了一下,TOPFISHER这个软件是用编写脚本代码的方式来分析网站架构的,不像其它的软件都是配置一大堆对话框的那种。不管怎么样,先找一些例子程序运行一下试试看吧,我试运行了三个例子:第一个是采集百度搜索结果数据,结果真的是可以采集,这个虽然比较强,但用处不大。第二个是采集和下载一个手机待机图片的网站数据,这个确实很不错,不但把图片都下载到了一个指定的目录中,而且还把图片相关的数据直接放到了一个MDB文件中。第三个是下接采集某站的手机号码归属地的数据,这个相信对多数站长都是非常有用的(包括我自己),这个也不错,也是直接把结果放到了一个MDB文件中,而且目标网站是以POST方式来传递参数的,TOPFISHER也可以轻松拿下。 Continue reading »

7月 292007
 

    维基百科创始人吉米·威尔斯今年有一个宏大的计划,就是开发开源、开放的搜索引擎维基搜索,这一项目被誉为今年国际互联网的两个黑马产品之一.周五,威尔斯透露了这一项目的一些进展.

    据称,他已经收购了一家拥有抓取技术的公司,另外,维基搜索将依靠成千上万的用户电脑来分布式地抓取网页,而不是构建自己的“蜘蛛”服务器群.

    威尔斯表示,他正在把若干个技术模块组建成完整的维基搜索,预计到今年年底,维基搜索将会提供一个公开测试版,这一依靠人工编辑优化网页搜索结果的全新搜索引擎将对Google公司和雅虎公司发起挑战. Continue reading »