Google Reader如何查找已经读过的文章

Google Reader无疑是一款非常优秀的在线RSS阅读器,我用它订阅了100多个Blog,读到了很多有用有趣的文章,用Google Reader读取最新的Blog基本成了日常工作。Google Reader有很多不错的功能,这里有篇文章给了一个不错的技巧来查找已经读过的文章。

如果你已经登陆Google Reader,可以点击这里打开已读文章列表。实际上这个列表也有一个专门的Feed地址,只是要获得这个地址需要一点小技巧。首先要获得你在Google的USER_ID,登陆Google Reader后在地址栏输入下面的javascript代码并回车:


javascript:prompt(“User ID”, _USER_ID);void(0);

在弹出的对话框中就是你的USER_ID,其实也不用如此高科技,Google Reader有一个分享阅读(Shared Items)的功能,点进去后可以发现里面关于你的共享阅读的几个链接(比如:See your shared items page in a new window.)里都有一长串数字,那就是你的USER_ID。

那么你已读过的文章列表的Feed地址就是http://www.google.com/reader/atom/user/USERID/state/com.google/read,将其中的USERID替换成你实际的USER_ID,用Google Reader订阅该地址,然后在搜索框后面的下拉列表中,选择这个Feed进行查找,就可以在你已经读过的所有文章中进行查找啦。注意这个Feed必须使用对应的帐号登陆以后才有效,在其他帐号中是没有权限读取的。

你还没用过Google Reader?那赶快体验一下,用Google Reader订阅我的Blog吧^_^

Google的高可扩展架构与海量数据处理

Google需要处理数据真正可以称得上海量,这依赖于其分布式的高扩展架构,否则,再强的小型机大型机也扛不住互联网每天产生的“信息垃圾”。Google的Jeff Dean同学为我们解密了Google的高可扩展性架构,ppt可以从这里下载。

一、底层架构

负载并行分配到多个硬件机器上
软件必须采用容错处理,不依赖具体的某一个台机器运行
大量采用刀片服务器和PC Server,低端存储和网络设备
机器追求性价比而不是盲目的高性能
基于Linux

二、分布式系统

调度系统:Scheduling System
调度系统是一个底层支撑系统,负责调度监控Cluster资源

文件存储:GFS
Master节点负责管理文件系统元数据
Chunkserver存放具体数据,以64MB为单元分布
客户端通过master查找文件
客户端直接从chunkserver获得需要的数据
目前运行超过200套GFS群集
超过5000台机器
超过5PB数据
为10000台以上客户端提供服务

数据存储:BigTable
采用多维稀疏映射图模型,每一个数据单元Cell可以存储不同时间截的数据
将表按行分隔成Tablet,分布到不同服务器上存储
底层存储架构采用GFS
Master节点处理元数据和负载均衡
Tablet服务器存储数据
锁服务器(Lock Service)控制数据访问的一致性
超过500个数据单元
最大的单元存储超过6000TB的数据,使用了超过3000台机器
最忙的单元支撑了500000次以上的操作

数据处理:MapReduce
MapRedule是Google的批量数据处理工具,分为两大功能

  • 映射(Map):根据输入生成(key,value)键值对
  • 简化(Reduce):合并存储(key,value)键值对

MapReduce用于Google的大多数产品中,包括Google Earth,News,Analytics,Search Quality,Indexing等等

目前,调度系统/GFS/BigTable/MapReduce可以在同一个群集内协同工作

三、未来的发展方向

跨越数据中心的分布式系统
更高的自动化程度

BloggerMap发布同城地图Widget

Update:本文发完没多久就收到了作者cosbeta的留言,然后又跑到bloggermap看了下,准备提个意见,结果发现首页下面的链接到的居然是storyday,貌似piner的blog模板原型就是从他这里获得的,还去逛了好几次的。不得不感叹,这个世界真小。另外,我是第132个用户,赶了个大早啊,呵呵。

小众软件上发现了BloggerMap,可以在Google地图上显示blog的地址,还可以通过API在自己blog上显示同城地图上的其他blogger,弄一个放在自己的blog上,还是挺有意思的。只是目前似乎人气不够,可能是刚刚发布的原因,整个上海也没几个blog注册,稀稀拉拉的,空间真大啊^_^

可以采用卫星地图,也可以采用平面地图,本来Google自带的地图数据可以切换平面地图,但是由于中国的特殊性,所以google专门为中国地图设置了不同的API地址。

下面是卫星地图效果:

Read more of this post

Google即将收购Feedburner?

最近传言说Google将以1亿美元的现金收购FeedBurner,在Google上搜索“Google FeedBurner”可以看到大量的网站和Blog都在谈论这笔收购。

FeedBurner是一家提供RSS转向服务的公司,相当于给经常搬家的Blogger们提供了一个全球唯一地址,每次blog变更后,只需要修改FeedBurner上的设置,就可以无缝的继续给订阅者们提供RSS源,本站也使用了FeedBurner的服务。国内也有类似的模仿网站FeedSky。

上个星期,FeedBurner还推出了中文Beta版,不过翻译的效果只能算差强人意,有意思的是,有个Blogger跳出来承认这是他翻译的(我承认:Feedburner是我翻译的),刚才我再去FeedBurner看了下,中文版本已经被下线了,估计是译者跟FeedBurner有过沟通。如此仓促的推出中文版,FeedBurner究竟是急于讨好中文用户,还是增加收购谈判的筹码,不得而知。不过,这也算是摆了个乌龙了,其实虽然翻译不是太好,也勉强能看懂,既然说了是Beta版,大可继续保留,慢慢修改,也比出来两天就撤退的效果来得好吧^_^

无觅相关文章插件,快速提升流量