12月 072010
 

作者:zhiyi.us

七、数据库

几乎所有操作最后都要落到数据库身上,它又最难扩展(存储也挺难)。对于mysql,什么样的表用myisam,什么样的表用innodb,在开发之前要确定。复制策略、分片策略,也要确定。表引擎方面,一般,更新不多、不需要事务的表可以用myisam,需要行锁定、事务支持的,用innodb。 myisam的锁表不一定是性能低下的根源,innodb也不一定全是行锁,具体细节要多看相关的文档,熟悉了引擎特性才能用的更好。现代WEB应用越来越复杂了,我们设计表结构时常常设计很多冗余,虽然不符合传统范式,但为了速度考虑还是值得的,要求高的情况下甚至要杜绝联合查询。编程时得多注意数据一致性。

复制策略方面,多主多从结构也最好一开始就设计好,代码直接按照多主多从来编写,用一些小技巧来避免复制延时问题,并且还要解决多数据库数据是否一致,可以自己写或者找现成的运维工具。

分片策略。总会有那么几个表数据量超大,这时分片必不可免。分片有很多策略,从简单的分区到根据热度自动调整,依照具体业务选择一个适合自己的。避免自增ID作为主键,不利于分片。

用存储过程是比较难扩展的,这种情形多发生于传统C/S,特别是OA系统转换过来的开发人员。低成本网站不是一两台小型机跑一个数据库处理所有业务的模式,是机海作战。方便水平扩展比那点预分析时间和网络传输流量要重要的多的多。

NoSQL。这只是一概念。实际应用中,网站有着越来越多的密集写操作、上亿的简单关系数据读取、热备等,这都不是传统关系数据库所擅长的,于是就产生了很多非关系型数据库,比如Redis/TC&TT/MongoDB/Memcachedb等,在测试中,这些几乎都达到了每秒至少一万次的写操作,内存型的甚至5万以上。例如MongoDB,几句配置就可以组建一个复制+自动分片+failover的环境,文档化的存储也简化了传统设计库结构再开发的模式。很多业务是可以用这类数据库来替代mysql的。

八、缓存。

数据库很脆弱,一定要有缓存在前面挡着,其实我们优化速度,几乎就是优化缓存,能用缓存的地方,就不要再跑到后端数据库那折腾。 Continue reading »

12月 072010
 

作者:zhiyi.us

开了自己域名的博客,第一篇就得来个重磅一点的才对得起这4美金的域名。作为一个技术从业者十年,逛了十年发现有些知识东一榔头西一棒槌的得满世界 看个遍才整理出个头绪,那咱就系统点的从头一步一步的说,一个从日几千访问的小小网站,到日访问一两百万的小网站,怎么才能让它平滑的度过这个阶段,别在 技术上出现先天不足,写给一些技术人员,也写给不懂技术的创业者。

对互联网有了解的人都有自己的想法,有人就把想法付诸实现,做个网站然后开始运营。其实从纯网站技术上来说,因为开源模式的发展,现在建一个小网站 已经很简单也很便宜。当访问量到达一定数量级的时候成本就开始飙升了,问题也开始显现了。因为带宽的增加、硬件的扩展、人员的扩张所带来的成本提高是显而 易见的,而还有相当大的一部分成本是因为代码重构、架构重构,甚至底层开发语言更换引起的,最惨的就是数据丢失,辛辛苦苦好几年,一夜回到创业前。

减少成本就是增加利润。很多事情,我们在一开始就可以避免,先打好基础,往后可以省很多精力,少操很多心。

假设你是一个参与创业的技术人员,当前一穷二白,什么都要自己做,自己出钱,初期几十万的资金,做一个应用不是特别复杂的网站,那么就要注意以下几点:

一、开发语言

一般来说,技术人员(程序员)创业都是根据自己技术背景选择自己最熟悉的语言,不过考虑到不可能永远是您一个人写程序,这点还得仔细想想。无论用什么语言,最终代码质量是看管理,所以我们还是从纯语言层面来说实际一点。现在流行的java、php、.net、python、ruby都 有自己的优劣,python和ruby,现在人员还是相对难招一些,性能优化也会费些力气,.net平台买不起windows server。java、php用的还是最多。对于初期,应用几乎都是靠前端支撑的网站来说,php的优势稍大一些,入门简单、设计模式简单、写起来快、 性能足够等,不过不注重设计模式也是它的劣势,容易变得松散,隐藏bug稍多、难以维护。java的优势在于整套管理流程已经有很多成熟工具来辅助,强类 型也能避免一些弱智BUG,大多数JAVA程序员比较注重设计模式,别管实不实际,代码格式看起来还是不错的。这也是个劣势,初学者可能太注重模式而很难 解决实际需求。

前端不只是html、css这类。整个负责跟用户交互的部分都是前端,包括处理程序。这类程序还是建议用php,主要原因就是开发迅速、从业人员广泛。至于后端例如行为分析、银行接口、异步消息处理等,随便用什么程序那个只能是根据不同业务需求来选择不同语言了。 Continue reading »

11月 192010
 

2010-11-19 来源:第一财经周刊  CBN记者 朱小坤 实习记者 王海伦 霍然

网络世界里到处都是保证书,因为这里到处都是错误。

郑昀再一次在《行政执法通知书》上签下名字,按上手印。离开谈话室,他想再不应该到这里来了。北京市广渠门内白桥大街22号,北京市(政府)新闻办公室,是网站管理的几个核心部门之一。

这是在2009年年底。在此之前,郑昀已经陆陆续续被找去谈话了5次。每一次对方都会拿出一些打印好的网站截图,批评他又做错了什么,问他准备怎么整改。郑昀则必须做出口头保证,“一定加强管理。”之后他被要求在一份《行政执法通知书》上按手印—不是每次都需要签名,但每次肯定要按手印。回了公司,郑昀还要尽快把公司整改措施的实施情况写邮件汇报给相关部门,这样算走完了一个流程。

郑昀是玩聚网的创始人之一和CEO。玩聚网创建于2006年,它主要追踪IT业界人士使用的各种社会化媒体分享源,如微博客、阅读器分享、网摘收藏等,综合分享推荐的次数、推荐者权重和信息源类型等多种因素,自动聚合然后推荐。该网站2008年推出了玩聚SR(SNS搜索引擎),很快在IT圈内获得一批用户。按照郑昀的想法,这个网站将在“自动发现热点”方面做到中国第一。

曾任新浪科技频道主编的曹增辉最初并不看好玩聚网,SR改变了他的看法,他在博客里写道:“上周推出的玩聚SR,终于让人眼前一亮。”曹增辉认为玩聚SR正好解决了blog缺乏聚合平台的短板。 Continue reading »

11月 102010
 

2010-11-09 来源:蓝鲸的网站分析笔记

面对一个新网站,从哪里入手开始进行网站分析?流量?内容?转化?访客行为?在进行网站分析时我们该关注哪些报告,哪些维度,哪些指标?访客在网站中的哪些行为是正确的?哪些行为是有问题的?如何快速的为一个新网站完成一次全面的网站分析,并最终获得Insight?这是我最近一直很纠结的一个问题。是否有一套完整的网站分析体系可以解决这些问题呢?本系列记录了一些我不太成熟的想法。欢迎大家拍砖指正。

本系列文章共分为三篇:

网站分析体系101(上)—明确并分解网站目标

网站分析体系101(中)—聚焦目标并度量成功

网站分析体系101(下)—创建并优化网站分析体系

网站目标的定义:

网站目标是你期望网站达到的成果,简单的说就是你创建网站时的原始动力。是哪一种想法或冲动让你创建了这个网站,通常这个想法或者冲动就是你网站的目标。例如:我创建网站的原始动力就是帮我赚钱,那么赚钱就是你网站的目标。(这也是大部分网站的目标)

网站目标要符合6个原则才是一个合格的目标,P——精确(Precise) R——现实性(Realistic)A——可实现性(Achievable) M——可测量性(Measurable) K——知名性(Known) U——被理解性(Understand)否则再好的目标也只能是一个梦想。

如何获得网站目标:

网站目标

获得网站目标的方法有两种:

第一种方法,亲自登录到网站上浏览几个页面,或是完成几个操作,如果你运气好的话很快就能发现这个网站的目标所在。因为在一个目标明确的网站中,每一个流程,每一个页面,甚至每一行文字都会散发出网站目标的浓烈气味。

如何你没有在网站中找到目标的气味,那么这个网站肯定或多或少的存在一些问题。这时候可以使用第二种方法。 Continue reading »

11月 102010
 

2010-11-09 来源:网易科技 专栏作者 李黎

佐丹奴网上商城的总经理侯彤最近问我,“V+的客户与众不同,他们很挑剔,写的评论也很长,你知道原因是什么?”

其实佐丹奴在V+的生意很不错,上个月的销售额129万,超过了淘宝商城的旗舰店。今年佐丹奴也陆续进了卓越亚马逊、京东商城、当当等B2C平台,目前V+和京东商城的销售额在所有平台来说最高。不过,侯彤发现,V+的消费者和其他平台都不一样。

为什么?

我在围脖上问大家,各种回答都有:

“V+主要是女人用户居多,女人就喜欢评论神马的~~”

“数据表明喜欢写评论的人网络购物频次更频繁。”

“客户群体所致,V+的客户群是网络一代!习惯短信习惯聊天习惯帖子的一代。”

“因为京东、淘宝、Amazon和当当都是在卖货,而V+是在卖品牌货。用户对V+的认知不一样。”

…… ……

是的,都很有道理。围脖就是好,给了佐丹奴那么多有用的答案!我也绞尽脑汁想了想,觉得大概是这个样子的:

目前V+没有做大力推广,50%左右的用户是从VANCL过来的。那么我们来看VANCL的顾客——VANCL有60%以上购买都是来自于互联网上的推广,也就是说,VANCL的用户以网民居多。目前VANCL仍然有相当部分的购买来自于客户端,比如迅雷、QQ等,他们属于深度网民,对互联网应用极为熟悉。

网民的特点是什么?叽歪,喜欢在网上絮絮叨叨和闷骚。特别是互联网深度网民,也许他(她)在生活中看上去沉静如水,在网上却是个话篓子。当然,就如围脖里的网友所说,VANCL以女性用户居多,其上千万的注册用户里,55%都是女性。 Continue reading »

3月 112009
 

DMOZ是全球最大的开放网络目录之一,将你的网站成功提交到DMOZ并被其收录,将对你的网站推广起到至关重要的作用,这是因为有许多非常重要的搜索引擎和在线的门户网站都使用DMOZ的搜索结果作为其自身的搜索结果。因其可浏览分类目录的编辑工作全部由人工完成。所以在向 DMOZ提交你的网站时,为确保网站被成功收录,请注意以下事项:

1.确保网站页面美观整洁、无错误

尽管编辑看的是一个网站的实际内容,不过他们也和我们一样,网站中的错误拼写及拙劣的外观会使他们对你网站的印象大打折扣。根据我的经验,那些经过专业设计且内容良好的站点,总是会为DMOZ收录的。

2.确保提交的网站是非采集的正规网站

如果你的网站内容都是通过采集其他网站而来的,那么你的提交极有可能被DMOZ拒绝。DMOZ不予收录那些转载、镜象或复制站点。对于收录的站点,一旦发现它们是镜象、复制或非原创,DMOZ也会将其剔除出来如果非要采集的话,建设最大限度的将采集的内容和标题修改成“伪原创”。这样DMOZ的编辑会认为你的网站至少提供了一些原创的内容。

3.不要短时间内反复向DMOZ重复提交 Continue reading »

2月 042009
 

2009-01-22 来源:译言 作者:zhengyongmw

核心提示:您了解您的博客读者吗?是什么内容吸引了他们来到您的网站?如果您的网站每天有上万名访问者,却只有极少数的人成为你的客户或忠实读者,那么你一定得看看本文!

互联网是一个快节奏的环境。世界各地的人们在任何时间都能来到你的站点,你的每个访客都有不同的目的和需求。不像实体零售商店,你不能看到谁来到了你的商店以及在柜台前浏览了哪些商品。你不了解你的访客,如何才能为所有这些客人展开一个粗略的轮廓呢?

你每天都能从访客在你站点的进行的交互活动得到他们的一些信息,他们有些注册了网站帐户,有些留下了注释,有些给你发送的电子邮件。不过,他们中的大多数是“不可见”的,他们找到您的网站,看看你的这样那样,点一下网站链接然后消失。

当前我们可以结合可见的用户活动(比如:注释/电子邮件)和统计数据(比如:访问频率/访问停留时间)来了解访客目的。不过这些信息对于大多数的商务网站和博客来说已经足够了吗?是的,但是我认为如果能够更多的了解和认识你的听众,这将对你的在线生意更有帮助。

在营销和广告活动中,我们积极主动地确定我们的目标受众。以最终目标为开始,然后以正确的言论和词组组织我们的网站/广告,间距、样式、关键词以及呼吁人们作为消费者/用户/读者的观点。收集访问我们的网站的访客资料,使我们更有效的市场营销。

为你的受众分析和构一个全面的形象非常有益,即使它可能需要重新定位,因为它提供一系列的资讯,允许你更好的提升内容范围,网站可用性,转换率以及行销活动。我们把这个过程分为两个阶段:统计分析和数据收集。

一、统计分析:从你已经了解的开始 Continue reading »

12月 302008
 

核心提示:解读失败网站原因,让站长少走弯路。

许多原因将会导致网站的失败。大部分无法赚到钱或吸引访问者。甚至可能无法正常的工作。甚至,像许多的网站那样,根本无法运作。所以,在建设你的网站前必须注意,小心这些可能毁掉你计划的危险。下面总结了网站十个失败的原因。

一、来自于合作者的破坏。

不要笑。多数网站开发者所面临的最大障碍不是技术、资金或则网络带宽;而是人的因素。人和他们小规模的办公室政治。如果你的项目不是由一个团队中的关键人物来维护的话,那么你将几乎肯定的遭受到来自于各方面的破坏。

二、无法确定用户。

大多数成功的网站能够很好的满足明确类型用户的明确需求。相反,失败的网站不知道谁在使用和为什么要使用他们网站。

三、对竞争的低估。

这是商业上一个经典的错误,对于竞争认识的失败,或没有意识到所在的领域已发生变化。WEB的发展是迅速的,竞争会从想象不到的地方冒出来。不想落伍就得密切注意来自于竞争的威胁。

四、对用户群的高估。

另一个经典的错误:这个很简单嘛!当你对某个产品或主题充满激情的时候,便会假象所有的人和你有同样的感觉。其实并不是这样。所以,当你开始之前,现实的考虑你的网站究竟可以吸引多少访问者。 Continue reading »