eygle.com   eygle.com
eygle.com  
 
Digest Net: IT新闻 Archives

Recently in IT新闻 Category

(原文链接 http://news.cyzone.cn/news/2011/12/05/219410.html
抵制一淘,京东商城捍卫的是什么?是数据。阿里巴巴最有价值的是什么?是数据。

  谁对中国20-40岁女性的身材(三围)最了解?这个人不是别人,而是阿里巴巴的老大马云----他只要下个命令,让数据挖掘工程师把淘宝某段时间内20-40岁女性购买相关商品的数据汇总,再做个简单的挖掘,答案就放在那了。

  2010年以来,随着凡客、京东与苏宁易购这两类B2C电商的崛起,国内掀起了又一次B2C电商的热潮,与以往的电商热不同,这次电商热的主流 参与者是众多传统企业。面对这种局面,淘宝祭出了建立2年却不温不火的淘宝商城,将其独立拆分运营,旨在吸引更多传统大中企业来此安家落户,而不要自己做 独立电商。

  但是很显然,淘宝商城是拦不住数以万计、十万甚至百万计的大中小型传统企业最终做独立B2C的趋势的。而且,接下来还会有更多的凡客、京东杀出来。这种趋势是会让马云睡不着觉的,因为这种趋势发展下去,会把淘宝王国一点一点解构掉。

  为了让自己能睡着觉,马云拿出了一个用他自己的话说是"要让百度睡不着觉"的对策,也就是一淘。一淘的底子实际上是原来淘宝的站内搜索,拆分独立后嫁接了全网搜索尤其是电商网站产品页抓取的技术。一淘的推出,标志着马云第一次大张旗鼓地把触角伸到了非阿里--淘宝体系的独立电商领域。一淘对于马云 来说绝不仅仅是个电商搜索工具,从战略上说,他是希望一淘最终能成为中国电子商务网站的搜索、导航门户。如果能做到这点,纵使独立电商的大潮如何汹涌,马 云都可高枕无忧。

  但是事情却没那么顺利。一淘一推出就毁誉参半,京东等大型的独立B2C网站首先表示将用技术手段封杀一淘的抓站蜘蛛或爬虫。一淘想从包括京东在内的大小独立电商网站获得什么?京东等抵制一淘的网站捍卫的又是什么?答案很简单:数据。

  如果你问我马云旗下这些公司最有价值的是什么,我的答案也是:数据。如今很多互联网企业对数据重视程度不断提高,但多数其他互联网企业的数据,其价值都无法与阿里巴巴所掌握的数据相提并论。

  这里我们回想一句马云在2008年2月的"冷预言":冬天来了,准备过冬吧。这句话在莺歌燕舞的2008年冒出来,几乎所有的人的反应都是:这是疯人疯语。

  但令人意想不到的是,半年多后,大洋彼岸就传来了美国次贷危机进而引发全球金融危机的消息。马云为什么能如此先知先觉?答案跟本文开篇部分那个 半开玩笑的问题一样,马云不仅能从淘宝数据知道中国女性的身材情况,他同样能通过阿里巴巴的数据知道海量中小企业的经营状况,甚至能部分地知道美欧等国当 地居民消费力水平的变化。把这些数据结果跟不断恶化的次贷危机趋势一叠加,他就很容易地成了"先知"了。

  如今业界对阿里巴巴旗下公司的标准描述是:阿里巴巴是中国最大的B2C平台;淘宝是国内最大的C2C平台;支付宝是中国最大的互联网第三方支付工具;拆分出来的淘宝商城有望成为国内最大的B2C平台;而一淘的目标则是成为基于商品搜索的网购门户。

  把上面描述的加在一起等于什么?等于阿里巴巴通过旗下的各项业务积累了海量网民网购行为特征数据、众多商家的基本交易数据。然后呢?如今中外很多互联网公司手上也都掌握着很多数据,但是,我们也没有看到什么真正的奇迹发生。

  马云你能创造奇迹吗?如果把阿里系所掌握的所有数据,再配以先进的数据挖掘技术,阿里巴巴将从一个B2B、B2C、C2C交易平台变身成为一家 超级商业智能(BI)企业。从很早开始,阿里内部就建立了强大的数据挖掘部门,其掌握的数据挖掘技术在国内互联网行业内应是数一数二的;其次,今年上半 年,阿里巴巴悄然收购了作针对中小网站流量统计的CNZZ,此举目的很明确,那就是把百万量级的中小网站的数据也逐步整合到阿里的数据体系中。而且,这些 数据不仅仅是部分中小电商网站的数据,更多是海量网民在众多网站间的行为数据。

  如果这就是马云秘而不宣的下一个梦想,那么一淘的出现就已经暴露了他的新野心。


新浪科技讯 6月16日午间消息,针对淘宝分拆微一淘、淘宝网和淘宝商城三家公司一事,阿里巴巴董事局主席兼马云刚刚对内发布员工邮件,他认为淘宝分拆能创造更大的产 业价值、公司价值和股东利益。马云认为阿里的整体利益和整个行业的规模和未来一致,"我们不排除未来集团整体上市的可能性"。

以下为邮件全文:

各位阿里人:

经 过数月的思考及准备,集团决定从二零一一年六月十六日起把淘宝分拆为三家公司。三家公司为:一淘网( www.etao.com ),淘宝网( www.taobao.com ),和淘宝商城( www.tmall.com )。这次分拆影响重大,所以我向大家汇报主要的出发点和意义。

1. 全球互联网和电子商务的形势发生了巨大的变化,我们决定把"大淘宝"战略提升为"大阿里"战略。近两年来,互联网在搜索、SNS(社区化)和电子商务领域 里发生了格局性的变化,新公司层出不穷。2009年启动的"大淘宝"战略取得了阶段性进展,初步建立了一个强大的以消费者为中心的网购生态系统。为了更好 适应今天行业的快速发展,集团决定提升"大淘宝"战略为"大阿里"战略。"大阿里"将和所有电子商务的参与者充分分享阿里集团的所有资源----包括我们所服 务的消费者群体、商户、制造产业链,整合信息流,物流,支付,无线以及提供数据分享为中心的云计算服务等,为中国电子商务的发展提供更好, 更全面的基础服务。大阿里战略的核心使命仍是建设开放,协同,繁荣的电子商务生态系统,促进新商业文明。

2. 客户的需求发生了很大的变化。一方面,网上消费购物在淘宝的引导和努力下已经从生活的补充变成了生活的必需,我们要为消费者提供更专业和个性化的服务。另 一方面,随着内需的展开和企业的转型,越来越多的企业将会使用电子商务来服务客户,他们需要的支持和服务也是今非昔比了。所以我们必须从以淘宝网为主的消 费者平台升级为"无处不在"的供需双赢的消费平台。这新平台将由阿里巴巴B2B和三家"Tao"公司一起完成对不同客户的服务:我们希望一淘网的购物搜 索,淘宝网价廉物美的社区化创新以及淘宝商城的精品专业体验给消费者以全新的感受;同时,也能更加专业化的帮助更多企业和创业者开展积极的电子商务服务和 营销。

3. 新商业文明的建设必然会要求企业内部管理发生根本性变化,我们必须主动创新。阿里公司在短期内发展成那么大,但竞争优势不是凭个子大。我们必须在组织结构 上不断尝试和创新,才能摸索出适合互联网发展的新型企业管理的思路和模式,保持创造力和先进性。阿里的惯例就是把大公司化成小公司来做,这样才能建立更加 创新的机制,才能让更多的年轻人和新同事成长起来,在"小"环境里让大家有更多机会展示才华和能力。

4. 我们相信淘宝分拆能创造更大的产业价值、公司价值和股东利益,今天的分拆看起来似乎令淘宝失去规模优势,从"有"变成了"无",但这是无处不在的"无"! 我们把淘宝融入到大阿里战略的核心,将为整个行业和集团的发展创造巨大的价值,给无数电子商务的从业者更多公平竞争和发展的机会。我们坚信,中国电子商务 发展的好和阿里可能没有太大关系,但发展的不好和阿里一定有关系。今天阿里的整体利益一定是和整个行业的规模和未来一致的。我们不排除未来集团整体上市的 可能性,让一直相信和支持我们的员工和股东们分享成果。

这次战术变革需要强大的团队执行。在大阿里战略中,B2B上市公司承担重要职责,为 此集团决定为B2B配置最优秀的领导团队。即日起,陆兆禧将专职担任上市公司首席执行官,支持陆兆禧的团队包括:首席财务官武卫、ICBU总经理彭翼 捷,CBU总经理叶朋,人力资源副总裁邓康明、技术副总裁李昂 以及供应商服务部付总裁吴敏芝等。

淘宝分拆后的三家公司依总裁加董事长的机 制运营。一淘的管理团队由总裁"东邪"吴泳铭领衔,汇报给一淘董事长彭蕾。淘宝网的管理团队由总裁"三丰"姜鹏领衔,汇报给淘宝网董事长陆兆禧。淘宝商城 的管理团队由总裁"逍遥子"张勇领衔,汇报给淘宝商城董事长曾鸣。"苏筌"戴珊负责领导技术和公共服务支撑大平台,全力支持各公司的业务发展,直接汇报给 集团CEO马云。

阿里人,我们应该为自己骄傲!有几家公司敢在处于遥遥领先地位、业务快速发展之际,还能摆脱对优势的依赖,能有自我变革的意志和力量,实施主动调整。我相信,我们的团队经过这次分拆,会走得更好,变得更有效率,更加优秀。

阿 里人,变化是痛苦的,没有一次变化会顺利发生。但我们必须变化,我们必须变化在变化之前。我们的商业模式从诞生的第一天起就和这个社会的发展和责任紧密相 连,时代成就了我们,我们不能辜负时代。电子商务只是刚刚起步,要记住,我们今天追求的不仅仅是最佳的商业模式,既然我们有幸能参与改变商业历史的进程, 我们还应该更积极的去推动和探索新商业文明的发展之道!

阿里巴巴集团CEO

马云

2011.6.16



如何高效处理全球信息一直是Google的狂热追求,而其自行开发的C++编程工具MapReduce就在其中扮演着关键角色。它可以多线程同时执行大规模数据集(1TB以上)的并行运算,是日常超大计算量的完美方案。

Google今天自豪地宣布,他们只需要短短68秒钟就能完成对1TB数据的排序处理。这些数据都是未压缩的文本文件,使用Google File System文件系统存储在1000台计算机上。在此之前,Google处理分布于910台计算机上的等量数据需要耗时209秒,效率只有现在的三分之一 左右。

当然,信息爆炸时代的数据量远远不只是TB级别,更常见的是一千倍的PB级别。在今年1月份的时候,Google MapReduce平均每天的数据处理量是20PB,相当于美国国会图书馆今年5月份存档网络数据的240倍。

那么Google MapReduce对4000台计算机上的1PB数据进行排序处理需要多长时间呢?答案是6小时零2分钟。放眼全球,除了Google还没有谁具备这种高速处理能力。

Google还透露,这1PB数据是存储在48000个硬盘上的(当然并没有全部填满),不过考虑到测试的持续时间、涉及的硬盘数量、硬盘的使用寿命,每次进行测试都会有至少一块硬盘挂掉。为此Google文件系统会为每个文件备份三个拷贝,并分别放在三块硬盘上。

Link:http://www.cioage.com/art/200901/77364.htm

At Google we are fanatical about organizing the world's information. As a result, we spend a lot of time finding better ways to sort information using MapReduce, a key component of our software infrastructure that allows us to run multiple processes simultaneously. MapReduce is a perfect solution for many of the computations we run daily, due in large part to its simplicity, applicability to a wide range of real-world computing tasks, and natural translation to highly scalable distributed implementations that harness the power of thousands of computers.

In our sorting experiments we have followed the rules of a standard terabyte (TB) sort benchmark. Standardized experiments help us understand and compare the benefits of various technologies and also add a competitive spirit. You can think of it as an Olympic event for computations. By pushing the boundaries of these types of programs, we learn about the limitations of current technologies as well as the lessons useful in designing next generation computing platforms. This, in turn, should help everyone have faster access to higher-quality information.

We are excited to announce we were able to sort 1TB (stored on the Google File System as 10 billion 100-byte records in uncompressed text files) on 1,000 computers in 68 seconds. By comparison, the previous 1TB sorting record is 209 seconds on 910 computers.

Sometimes you need to sort more than a terabyte, so we were curious to find out what happens when you sort more and gave one petabyte (PB) a try. One petabyte is a thousand terabytes, or, to put this amount in perspective, it is 12 times the amount of archived web data in the U.S. Library of Congress as of May 2008. In comparison, consider that the aggregate size of data processed by all instances of MapReduce at Google was on average 20PB per day in January 2008.

It took six hours and two minutes to sort 1PB (10 trillion 100-byte records) on 4,000 computers. We're not aware of any other sorting experiment at this scale and are obviously very excited to be able to process so much data so quickly.

An interesting question came up while running experiments at such a scale: Where do you put 1PB of sorted data? We were writing it to 48,000 hard drives (we did not use the full capacity of these disks, though), and every time we ran our sort, at least one of our disks managed to break (this is not surprising at all given the duration of the test, the number of disks involved, and the expected lifetime of hard disks). To make sure we kept our sorted petabyte safe, we asked the Google File System to write three copies of each file to three different disks.

Significantly improved handling of the so-called "stragglers" (parts of computation that run slower than expected) was a key software technique that helped sort 1PB. And of course, there are many other factors that contributed to the result. We'll be discussing all of this and more in an upcoming publication. And you can also check out the video from our recent Technology RoundTable Series.

Link:http://googleblog.blogspot.com/2008/11/sorting-1pb-with-mapreduce.html

海量数据 10 PB 到底有多大?

| 12 Comments
原文链接。原文时间:2011.1.16

1PB(PetaByte)等于2的50次方,等于1024TB,10PB是目前整个互联网现有数据存档的两倍。但这些数字听上去太抽象了,10PB到底有多大呢?数据存储服务公司Backblaze制作了几张图片,能让大家一目了然:

按硬盘盒的数量算,10PB数据可存满137个硬盘盒,每个盒子里装有45块硬盘。

按硬盘数算,10 PB相当于2280个2TB硬盘,3166个1.5TB硬盘,再加上749个1TB硬盘。

Backblaze现有硬盘数量为6195个,这些硬盘摞在一起高达2968英尺(约为905米),比迪拜的哈利法塔还高。


原文链接

  自本报前天报道了盛大半路杀出抢购华友世纪一事后,一些更为内幕的细节逐渐浮现出来。

  昨日,有独立财团人士向记者透露,自从公开向华友世纪股东发布联系邮箱后,已有5%以上股东明确表示,假如华友董事会与盛大秘密谈判没有结果,或公布收购价低于独立财团的每股4美元报价,他们将起诉以王秦岱为首的董事会侵害其利益。

  "收购华友花费几千万美元,对盛大而言数额不大,而且王秦岱也把盛大当作救命稻草,所以我们的胜算不大。盛大肯定会出更高价钱,如他们出高价,我们就撤,如果盛大出价不高于4美元,我们还会重提方案。"独立财团一人士说。

  目前,独立财团矛头所指是,华友董事会不与其接触,不给其参与竞购的机会。而华友则通过相关渠道避重就轻地提出独立财团的构成没有公开化。

  独立财团某人士透露,在此前的收购过程中,由于意识到王秦岱是收购的最大障碍,因此不久前通过股东迫使王秦岱卸任CEO。"去年10月,找王秦岱谈收购的时候,王秦岱并不愿意,说我们根本出不起想要的价位,其实是不想谈。后来我们转头寻找其他大股东,毕竟王秦岱只占10%的股份,在某些大股东压力下,王秦岱被迫辞任CEO,其现为非执行董事长,不能参与公司经营决策。"这位人士说,"后来,王秦岱要求全部出售股份,我们只同意收购51%。因此,如果卖给自己引入的盛大,王秦岱会更有台阶下,而我们不会给他台阶下。"他这样解释盛大出现的背景。

  此前,华友世纪曾与盛大、光线传媒、灵通网、猫扑网等进行过四次合并谈判,但无一成功,其股价从10美元一路下行,华友的股东也不知道原因。这位人士表示,原因在于王秦岱总能找到一些方法操控董事会来阻挠收购,王秦岱希望一直操控华友世纪。

  "王秦岱现在既难以全部高额套现,又只是个挂名董事长,所以现在是为荣誉而战,肯定不会卖给视为仇人的独立财团,所以迫使我们必须公开。"他说。"我们没有得到任何竞价机会,说明董事会完全被王秦岱操控。"

  按照上述人士的说法,由于独立财团施压,王秦岱丢掉了CEO位置,且不能向独立财团全部套现,为了体面地下场,其宁愿由盛大来接盘,哪怕价格较低。

  据了解,作为一家老SP公司,除了现金储备充裕和有一个唱片公司外,华友世纪业务已经没有多大潜力,去年,其净亏损1200万美元。据分析,盛大收购这个壳极有可能是打算将盛大文学板块并入其中。

  欢乐传媒原是一家集影视制作、文化经纪、媒介经营业务于一体的娱乐公司,其总裁董朝晖2004年投资500万美元收购文学网站 "榕树下",开始向互联网进军。董朝晖表示,整合华友的业务,他有信心将公司股价从近期的1美元做到7美元以上。


类似的SP上市公司壳资源不止华友一家,董朝晖们为何对华友世纪情有独钟?他说,因为这家公司股东分散,目前公司最大的持股者也不超过12%。

  其实,另一重要原因被他回避了。华友世纪手握大笔现金,而且这些现金的价值甚至高于公司市值。据华友世纪的财报显示,截至2008年12月31日,华友世纪持有的现金及短期存款为5947万美元

  在董朝晖提出收购之前,华友世纪的股价已经跌落至1.50美元,其市值大约在3280万美元。即便以董朝晖3.5美元每股的报价计算,其估值也不过 7654万美元。此次董朝晖收购华友世纪51%股份,同时还要求将华友世纪的当前管理层赶下台,建立以他为首的新团队。董称他的新团队中包含数位娱乐业的资深人士,足以帮助华友世纪摆脱困境。


Pages

Powered by Movable Type 6.3.2

About this Archive

This page is an archive of recent entries in the IT新闻 category.

Oracle摘 is the next category.

回到 首页 查看最近文章或者查看所有归档文章.