12 月 092010
 

作者: 孤风颠影

之前也有一些介绍大型网站架构演变的文章,例如LiveJournal的、ebay的,都是非常值得参考的,不过感觉他们讲的更多的是每次演变的结果,而没有很详细的讲为什么需要做这样的演变,再加上近来感觉有不少同学都很难明白为什么一个网站需要那么复杂的技术,于是有了写这篇文章的想法,在这篇文章中将阐述一个普通的网站发展成大型网站过程中的一种较为典型的架构演变历程和所需掌握的知识体系,希望能给想从事互联网行业的同学一点初步的概念,:),文中的不对之处也请各位多给点建议,让本文真正起到抛砖引玉的效果。

架构演变第一步:物理分离webserver和数据库

最开始,由于某些想法,于是在互联网上搭建了一个网站,这个时候甚至有可能主机都是租借的,但由于这篇文章我们只关注架构的演变历程,因此就假设这个时候已经是托管了一台主机,并且有一定的带宽了,这个时候由于网站具备了一定的特色,吸引了部分人访问,逐渐你发现系统的压力越来越高,响应速度越来越慢,而这个时候比较明显的是数据库和应用互相影响,应用出问题了,数据库也很容易出现问题,而数据库出问题的时候,应用也容易出问题,于是进入了第一步演变阶段:将应用和数据库从物理上分离,变成了两台机器,这个时候技术上没有什么新的要求,但你发现确实起到效果了,系统又恢复到以前的响应速度了,并且支撑住了更高的流量,并且不会因为数据库和应用形成互相的影响。

看看这一步完成后系统的图示:
Continue reading »

12 月 092010
 

【51CTO独家特稿】随着IT技术在上世纪90年代开始在中国普及,这个产业也簇生了国内第一批系统管理员、网络管理员的诞生。相对于现在无所不在的以Windows为基础的企业网络和奔跑在无数Linux服务器上的网站,90年代的IT基础架构还处于非常原始的状态。互联网进入国内差不多是 1995年左右,而1999年正是IT行业飞速发展的一个转折点。那个时候的技术人们,无论是开发者还是运维们,虽然可以获取的资讯和技术知识相对贫乏,但是那时的人们都充满着对技术的热情,投入到新技术的学习和使用当中。

国内著名的Linux专家曹江华老师,就是1999年投入到运维领域的。51CTO系统频道近日对曹江华老师进行了邮件专访,请曹江华老师谈了谈自己的职业发展经历。一方面让大家了解一下那个时候的系统运维的工作状况,另一方面也给现在的系统运维们分享一些学习经验(这些经验之谈可能不仅仅影响到你在Linux方面的学习)。

嘉宾简介:

曹江华,1999年开始从事构建网络、管理维护、数据库管理工作。1999年后开始接触LINUX,将工作中的经验总结后已出版《Linux服务器安全策略详解》,《Linux服务器安全策略详解》(第二版),《Red Hat Enterprise Linux 5.0服务器构建与故障排除》,《Linux系统最佳实践工具:命令行技术》四本堪称Linux系统管理员日常工具书的热销图书,目前关注开放系统和网络安全。

51CTO:首先单的介绍一下您自己吧。能否简单的介绍一下您在运维领域的经历?比如什么时候进入这行,现在在哪里工作等等。

曹江华:我毕业于工科大学机电一体化专业,当时从事的是CAD设计。后来开始从事小型数据库的应用。1999年开始从事构建网络、管理维护、数据库管理工作,1999年后开始接触LINUX成为Linux系统管理员。目前关注Linux和网络安全管理。现在是linuxpilot(现在是唯一的中文 Linux专业纸媒体了)的专栏作家和自由撰稿人。

51CTO:您最初接触系统管理员这方面的工作是怎样的情况?看您的一些介绍,好像您一开始是从事CAD设计的吧。能跟我们描述一下当时您是如何进入运维这个领域的么?您当时的工作环境是怎样的?如何学习一项新的技能呢? Continue reading »

12 月 092010
 

October 4, 2010

9月27号,在Bare Virtual Server上看到RLS Hosting折后才不到三美元的VPS,而且,配置还不错,256M内存,512M共享内存,10G空间,100G流量,于是动心了,当时就和朋友商量买这个,很快便用Paypal付了款,几乎是付款的同时,便收到了VPS已经成功开通的消息,拿到IP和密码,立即试了试,速度也还比较满意,国内下载稳定在1.05MB/S,算是很不错了。于是连忙把PhotonVPS的BEAN 1上放的几个博客全部迁移到了RLS Hosting的新VPS里。搬进去后都感觉不错,2.97刀的价格尤其吸引人,一乐还写了篇文章来专门推荐这个便宜速度又不错的VPS。

悲剧出现在30号下午,博客已经打不开了,SSH也无法登陆,于是只好打开 VPS ControlPanel,进去一看,硬盘空间和流量情况显示正常,但当前使用内存的情况却一直为零,VPS状态显示正常在线。

VPS空间和流量显示正常,内存显示异常

于是试着重启VPS,发现情况仍然没有改变,偶然一起重启,发现VPS内存占用在启动开始的几秒里,达到惊人的 1.89G:

VPS空间和流量显示正常,内存异常,近2G

开始以为是VPS内存占用过高,被系统给kill掉了,于是想着用 Serial Console把服务进行一些调整,先关掉一些再看情况。进去一后才发现,几乎什么都动不了,apache和mysql进程全部无法启动,VPS也无法使用网络,连ping 127.0.0.1都提示“Network is unreachable”。初步判断,与这个VPS无关,但与服务商肯定有关。 Continue reading »

12 月 092010
 

发表于 11/05/2010 由 Jesson

越来越多的人都喜欢将自己的Blog搬到国外去,好处太多了,坏处只有一条——速度有点慢。选择高性价比的VPS就成了最头痛的事情,打从我入手Burst VPS以后,在他们家待了大半年,稳定性还是不错的。每每打开一个网页都需要等待N秒,我不得已就撤退啦!

先是搬到了Spacerich.com的芝哥机房,速度比Burst有明显的提升,使用25%的折扣码之后,2个IP每个月不到9美金。价格很优惠,但PING值还是维持在300左右。刚好Buyvm.Net推出特价15美金一年的VPS,虽然内存只有128m,但其线路是属于西海岸的佛里蒙1号机房,这个机房号称是中美最快的机房。加上Buyvm支持PPTP VPN,所以没怎么考虑就拿下了一个。速度是很不错,当然抽风的时候例外。

在Spacerich待了两个月,觉得他们家的速度跟Buyvm比起来还是差很多,所以就有搬出来的打算。这时一家丹麦的IDC服务商NordicVPS.com进入了眼中,其推出的同样是佛里蒙特机房的特价主机128m $15/Year。就这样,我Canceled Spacerich的计划。打算用两个128m的主机来运行我这几个小破网站。

如意算盘打的太好了不是件好事,128m的内存根本就是个玩具,除了做SSH或VPN之后,就真的只能玩玩。你想运行LNMP?除非你不装 eAccelerator、Zend这些支持组件,并且只给Nginx开一个进程还差不多,不然肯定是不够的。所以我就发Ticket给NordicVPS升级到256的计划,$35/年。

有了256M的内存,我选择Debian做为系统支持,适当优化之后开了5个Nginx进程、5个php-fpm,占用200M内存。目前已稳定运行18天,抽风好象只抽过一次,其它时间都还算挺稳定的。

这几个月装了N回系统,配置了N回环境,弄的我都有点吐了。还好现在总算不需要再折腾了。温馨提醒一点,如果你买的不是个玩具,就不要买128M内存的VPS。

PS.以上所提到的VPS接受代购,稳定性都还不错,只是速度或价格有区别。个人觉得可以适当选择,比如我就不会选择Linode,虽然很稳定,但是就目前的情况下来看,He.net的Fremont很可能就杯具了。我宁愿选择Burst+Fremont来组建反向代理。

12 月 092010
 

引言:你知道Alexa百强中文网站域名中谁的年岁最大吗?你知道百强中最短的域名是几位吗?最长的域名呢?哪年注册的域名最多?还有,你知道哪个网站没解析根域名?

不知道?没关系,那就继续看老门的解密吧……

2007年,老门曾写过一篇Alexa百强中文网站域名分析的文章,被搜狐网、艾瑞网、站长网、万网等近百家网站转载。三年之后的今天,Alexa 百强中文网站发生了不少变化,老门再次做域名分析,分析内容也从当时年的域名组成、域名长度、域名后缀三类,新增了网站类型、域名时间、综合分析等,其中域名时间又分别按注册时间、域名年龄、注册年、注册月、注册日分析。

在Alexa百强中文网站数据获取方面,2007年取自站长之家(中国站长站),这次则直接取自Alexa官网。由于Alexa官网的原始数据未经任何处理,包括几家作弊网站和英文网站,老门在分析时删除了他们。当然,也不是说留下的就没有作弊,仅作参考吧。

一、域名组成

1、 拼音域名:即域名全部由中文拼音组成,共24个,以新兴网站为主;其中全拼23个:baidu.com、taobao.com、youku.com、 tudou.com、renren.com、tianya.cn、alibaba.com、douban.com、xunlei.com、 youdao.com、gougou.com、paipai.com、ganji.com、alimama.com、hudong.com、 dianping.com、dangdang.com、qiyi.com、huanqiu.com、zhaopin.com、qidian.com、 xici.net、duowan.com,拼音首字母一个:jrj.com.cn。

2、 英文域名:即域名全部由英文单词组成,共22个;其中全英15个:pconline.com.cn、homeway.com.cn、 eastmoney.com、people.com.cn、yesky.com、tom.com、onetad.com、verycd.com、 autohome.com.cn、china.com、pchome.net、chinanews.com.cn、skycn.com、 onlinedown.net、focus.cn,简英7个:csdn.net、ynet.com、cncmax.cn、enet.com.cn、 cntv.cn、xcar.com.cn、pptv.com。

3、 数字域名:即域名本身全部由数字组成,共12个,分别是163.com、360.cn、56.com、118114.cn、51.la、126.com、58.com、10086.cn、2345.com、39.net、4399.com、51.com。 Continue reading »

12 月 082010
 

On Wednesday 8th December 2010, @wikileaks said:

STATEMENT: “We will not be gagged” #cablegate #censorship

Following the detention of Wikileaks founder and editor-in-chief Julian Assangem, Wikileaks spokesman Kristinn Hrafnsson said:

“Today, Wikileaks editor-in-chief Julian Assange was refused bail by a UK court. While we are troubled by this bizarre decision, we know Julian is grateful for the support of both his legal team and prominent figures such as Ken Loach, Jemima Khan and John Pilger.

“However, this will not stifle Wikileaks. The release of the US Embassy Cables – the biggest leak in history – will still continue. This evening, the latest batch of cables were released, and our media partners released their next batch of stories.

“We will not be gagged, either by judicial action or corporate censorship. Today Visa joined Mastercard, Paypal, Amazon, EveryDNS and others in cutting off their links.

“Wikileaks is still online. The full site is duplicated in more than 500 locations. Every day, the cables are loaded more than 50 million times.

“US Senator Joe Lieberman today attacked the New York Times for its decision to publish the cables, just days after calling for companies to boycott Wikileaks.

“Just minutes later, the State Department announced the US will host next year’s UNESCO Press Freedom day. The irony is not lost on us. We hope in future, UNESCO celebrates press freedom somewhere where it exists.” Continue reading »

12 月 082010
 

时钟的跃变,有时候会导致很严重的问题。许多应用程序依赖连续的时钟——毕竟,这是一项常见的假定,即,取得的时间是线性的,一些操作,例如数据库事务, 通常会地依赖这样的事实:时间不会往回跳跃。

不幸的是,ntpdate调整时间的方式就是我们所说的”跃变“:在获得一个时间之 后,ntpdate使用settimeofday(2)设置系统时间,这有几个非常明显的问题:

第一,这样做不安全。ntpdate的设 置依赖于ntp服务器的安全性,攻击者可以利用一些软件设计上的缺陷,拿下ntp服务器并令与其同步的服务器执行某些消耗性的任务。由于ntpdate采 用的方式是跳变,跟随它的服务器无法知道是否发生了异常(时间不一样的时候,唯一的办法是以服务器为准)。

第二,这样做不精确。一旦 ntp服务器宕机,跟随它的服务器也就会无法同步时间。与此不同,ntpd不仅能够校准计算机的时间,而且能够校准计算机的时钟。

第三, 这样做不够优雅。由于是跳变,而不是使时间变快或变慢,依赖时序的程序会出错(例如,如果ntpdate发现你的时间快了,则可能会经历两个相同的时刻, 对某些应用而言,这是致命的)。

因而,唯一一个可以令时间发生跳变的点,是计算机刚刚启动,但还没有启动很多服务的那个时候。其余的时 候,理想的做法是使用ntpd来校准时钟,而不是调整计算机时钟上的时间。

=======
dovecot, 经常会在ntpdate修改时间后,进程会死掉,且不能自动重启.
解决dovecot的问题有2个方式,
1. 将校准时间的方式由 ntpdate 更改为ntpd(此方式会有一个daemon常驻后台)
2. 在每次执行utpdate后,延迟一段时间,自动重启dovecot服务.
(这种方式只适用于邮件服务不是关键服务的情况,如果要保证dovecot稳定运行,还是建议采用第1种方式)

在ubuntu server的脚本如下
sudo nano /etc/cron.weekly/timeupdate

然后写入
#!bin/sh
ntpdate cn.pool.ntp.org

#脚本休息120秒,然后再继续.一般来说一个星期偏差120秒已经是足够足够足够大的了.#
sleep 120
service dovecot restart

12 月 072010
 

1.时区设置

有些时候,当你在PHP里使用date或mktime函数时,由于时区的不同,它会显示出一些很奇怪的信息。下面是解决这个问题的方法之一。就是设置你的服务器的时区。你可以在这里找到所有支持的时区的清单。

SetEnv TZ Australia/Melbourne  

2. 搜索引擎友好的301永久转向方法

为什么这是搜索引擎友好的呢?因为现在很多现代的搜索引擎都有能根据检查301永久转向来更新它现有的记录的功能。

Redirect 301 http://www.aqee.net/home http://www.aqee.net/  

3. 屏蔽下载对话框

通常,当你下载东西的时候,你会看到一个对话框询问你是保持这个文件还是直接打开它。如果你不想看到这个东西,你可以把下面的一段代码放到你的.htaccess文件里。

AddType application/octet-stream .pdf  
AddType application/octet-stream .zip  
AddType application/octet-stream .mov   Continue reading »