Recently in Oracle摘 Category

Oracle跟踪和诊断的利器: ORADEBUG 手册

By eygle on September 30, 2018 12:52 PM

转载自：http://psoug.org/reference/oradebug.html

Oracle ORADEBUG

Version 11.1

GENERAL

Background Processes List

SELECT b.name, p.pid
FROM gv$bgprocess b, gv$process p
WHERE b.paddr = p.addr
ORDER BY 1;

Dispatcher Processes List

SELECT d.name, p.pid
FROM gv$dispatcher d, gv$process p
WHERE d.paddr = p.addr;

Job Queue Process List

SELECT s.paddr, s.sid, j.job
FROM gv$session s, dba_jobs_running j
WHERE s.sid = j.sid;

SELECT pid
FROM gv$process
WHERE addr = '17';

Parallel Execution Slave Processes List

SELECT pid, server_name, status
FROM gv$px_process;

Shared Server Processes List

SELECT s.name, p.pid
FROM gv$shared_server s, gv$process p
WHERE s.paddr = p.addr;

SGA Variables List

SELECT ksmfsnam
FROM x$ksmfsv
WHERE ksmfsnam LIKE '%\_' ESCAPE '\';

Switches

Switch	Format	Description
-G	<Inst-List \| def \| all>	Parallel oradebug command prefix
-R	<Inst-List \| def \| all>	Parallel oradebug prefix return output

CALL

Invoke function with arguments

oradebug call <func> [arg1] ... [argn]

SQL> oradebug call ?

CLOSE_TRACE

Close trace file

oradebug close_trace

SQL> oradebug close_trace

CORE

Dump core without crashing process

oradebug core

SQL> oradebug core

CURRENT_SQL

Get current SQL

oradebug current_sql

SYS	UWCLASS
conn / as sysdba	conn uwclass/uwclass
GRANT execute ON dbms_support TO uwclass;
	SELECT pid FROM gv$process WHERE addr = ( SELECT paddr FROM gv$session WHERE sid = sys.dbms_support.mysid);
oradebug setorapid 26
	SELECT t.tablespace_name FROM all_tables t, all_indexes i WHERE t.tablespace_name = i.tablespace_name;
oradebug core

DELETE

Delete a watchpoint

oradebug delete <local|global|target> watchpoint <id>

SQL> oradebug delete ?

DIRECT_ACCESS

Fixed table access

oradebug direct_access <set/enable/disable command | select query>

TBD

DMPCOWSGA

Dump & map SGA as COW

oradebug dmpcowsga <SGA dump dir>

SQL> oradebug dmpcowsga "c: emp"

DUMP

Invoke named dump

oradebug dump <dump_name> <lvl> [addr]

-- dump_name values can be obtained from oradebug dumplist

SQL> oradebug setmypid
SQL> oradebug dump library_cache 4

Invoke ASH dump

SQL> oradebug setmypid
SQL> oradebug dump ashdump 10

DUMPLIST

Print a list of available dumps

oradebug dumplist

SQL> oradebug dumplist

Available Dumps
ADJUST_SCN	HANGDIAG_HEADER	MMAN_ALLOC_MEMORY
ALRT_TEST	HEAPDUMP	MMAN_CREATE_DEF_REQUEST
ARCHIVE_ERROR	HEAPDUMP_ADDR	MMAN_CREATE_IMM_REQUEST
ASHDUMP	HM_FW_TRACE	MMAN_IMM_REQUEST
ATSK_TEST	INSTANTIATIONSTATE	MMON_TEST
AWR_FLUSH_TABLE_OFF	IOERREMUL	MODIFIED_PARAMETERS
AWR_FLUSH_TABLE_ON	IOERREMULRNG	NEXT_SCN_WRAP
AWR_TEST	IR_FW_TRACE	OBJECT_CACHE
BC_SANITY_CHECK	JAVAINFO	OCR
BG_MESSAGES	KCBO_OBJ_CHECK_DUMP	OLAP_DUMP
BLK0_FMTCHG	KDLIDMP	OPEN_FILES
BUFFER	KRA_OPTIONS	PGA_DETAIL_CANCEL
BUFFERS	KRA_TRACE	PGA_DETAIL_DUMP
CALLSTACK	KRB_BSET_DAYS	PGA_DETAIL_GET
CHECK_ROREUSE_SANITY	KRB_CORRUPT_INTERVAL	PIN_BLOCKS
CONTEXTAREA	KRB_CORRUPT_REPEAT	PIN_RANDOM_BLOCKS
CONTROLF	KRB_CORRUPT_SIZE	POKE_ADDRESS
CROSSIC	KRB_CORRUPT_SPBAD_INTERVAL	POKE_LENGTH
CRS	KRB_CORRUPT_SPBAD_REPEAT	POKE_VALUE
CSS	KRB_CORRUPT_SPBITMAP_INTER	POKE_VALUE0
CURSOR_STATS	KRB_CORRUPT_SPBITMAP_REPEA	POOL_SIMULATOR
CURSORDUMP	KRB_CORRUPT_SPHEADER_INTER	PROCESSSTATE
CURSORTRACE	KRB_CORRUPT_SPHEADER_REPEA	REALFREEDUMP
DATA_ERR_OFF	KRB_FAIL_INPUT_FILENO	RECORD_CALLSTACK
DATA_ERR_ON	KRB_OPTIONS	RECOVERY
DBSCHEDULER	KRB_OVERWRITE_ACTION	REDOHDR
DROP_SEGMENTS	KRB_PIECE_FAIL	REDOLOGS
DUMP_ADV_SNAPSHOTS	KRB_SET_TIME_SWITCH	REFRESH_OS_STATS
DUMP_ALL_COMP_GRANULES	KRB_SIMULATE_NODE_AFFINITY	ROW_CACHE
DUMP_ALL_COMP_GRANULE_ADDR	KRB_TRACE	RULESETDUMP
DUMP_ALL_OBJSTATS	KRB_UNUSED_OPTION	RULESETDUMP_ADDR
DUMP_ALL_REQS	KRBMRSR_LIMIT	SAVEPOINTS
DUMP_PINNED_BUFFER_HISTORY	KRBMROR_LIMIT	SELFTESTASM
DUMP_TEMP	KRC_TRACE	SET_NBLOCKS
DUMP_TRANSFER_OPS	KSDTRADV_TEST	SET_TSN_P1
DUMPGLOBALDATA	KSFQP_LIMIT	SHARED_SERVER_STATE
ENQUEUES	KSKDUMPTRACE	SIMULATE_EOV
ERRORSTACK	KTPR_DEBUG	SYSTEMSTATE
EVENT_TSM_TEST	KSTDUMPALLPROCS	SYSTEMSTATE_GLOBAL
EXCEPTION_DUMP	KSTDUMPALLPROCS_CLUSTER	TEST_DB_ROBUSTNESS
FAILOVER	KSTDUMPCURPROC	TEST_GET_CALLER
FBHDR	KUPPLATCHTEST	TEST_SPACEBG
FBINC	KXFPCLEARSTATS	TEST_STACK_DUMP
FBTAIL	KXFPDUMPTRACE	TR_CRASH_AFTER_WRITE
FILE_HDRS	KXFPBLATCHTEST	TR_CORRUPT_ONE_SIDE
FLASHBACK_GEN	KXFXCURSORSTATE	TR_READ_ONE_SIDE
FLUSH_CACHE	KXFXSLAVESTATE	TR_SET_ALL_BLOCKS
FLUSH_JAVA_POOL	LATCHES	TR_SET_BLOCK
FULL_DUMPS	LDAP_KERNEL_DUMP	TR_SET_SIDE
GC_ELEMENTS	LDAP_USER_DUMP	TRACE_BUFFER_OFF
GES_STATE	LIBRARY_CACHE	TRACE_BUFFER_ON
GLOBAL_AREA	LOCKS	TREEDUMP
HANGANALYZE	LOGERROR	TR_RESET_NORMAL
HANGANALYZE_PROC	LOGHIST	UPDATE_BLOCK0_FORMAT
HANGANALYZE_GLOBAL	LONGF_CREATE	WORKAREATAB_DUMP

DUMPSGA

Dump fixed SGA

oradebug dumpsga

oradebug dumpsga <bytes>

SQL> oradebug dumpsga
c:\oracle\product\admin\orabase\udump\orabase_ora_2120.trc

DUMPTYPE

Print/dump an address with type info

oradebug dumptype <address> <type> <count>

TBD

DUMPVAR

Print/dump a fixed PGA/SGA/UGA variable

oradebug dumpvar <pga|sga|uga> <name> [level]

SQL> oradebug setmypid
SQL> oradebug dumpvar SGA kcbnbh

EVENT

Set trace event in process

oradebug EVENT <event>
TRACE NAME CONTEXT FOREVER, LEVEL <level>

SQL> oradebug setmypid

SQL> oradebug EVENT 10046 TRACE NAME CONTEXT FOREVER, LEVEL 12

SQL> oradebug unlimit

FFBEGIN

Flash Freeze the Instance

oradebug ffbegin

SQL> oradebug ffbegin

FFDEREGISTER

FF deregister instance from cluster

oradebug ffderegistger

SQL> oradebug ffderegister

FFRESUMEINST

Resume the flash frozen instance

oradebug ffresumeinst

SQL> oradebug ffresumeinst

FFSTATUS

Flash freeze status of instance

oradebug ffstatus

SQL> oradebug ffstatus

FFTERMINST

Call exit and terminate instance

oradebug ffterminst

SQL> oradebug ffterminst

FLUSH

Flush the current contents of the trace buffer to the trace file use

oradebug flush

SQL> oradebug flush

HANGANALYZE

Analyze system hang for stand-alone

oradebug hanganalzye [level] [syslevel]

SQL> oradebug setmypid;
SQL> oradebug hanganalyze;
SQL> oradebug flush;

Analyze system hang for RAC

SQL> oradebug setmypid;
SQL> oradebug -g def hanganalyze 1
SQL> oradebug flush;

HELP

Describe one or all commands

oradebug help

oradebug help <command>

SQL> oradebug help
SQL> oradebug help flush

LKDEBUG

Invoke global enqueue service debugger

oradebug lkdebug

SQL> oradebug lkdebug

MAPCOWSGA

Map SGA as COW

oradebug mapcowsga <SGA dump dir>

SQL> oradebug mapcowsga "c: emp"

NSDBX

Invoke CGS name-service debugger

oradebug nsdbx

SQL> oradebug nsdbx

PEEK

Print/Dump memory

oradebug peek <addr> <len> [level]

SQL> oradebug peek 0x20005F0C 12

POKE

Modify memory. Never perform this function on a production database!

oradebug poke <addr> <len> <value>

SQL> oradebug poke 0x20005F0C 4 0x46495845

PROCSTAT

Dump process statistics

oradebug procstat

SQL> oradebug setmypid

SQL> oradebug procstat

RESUME

Resume execution

oradebug resume

SQL> oradebug resume

SESSION_EVENT

Set trace event in session

oradebug session_event <text>

SQL> oradebug session_event 10053 TRACE NAME CONTEXT FOREVER, LEVEL 1

SETINST

Set instance list

oradebug setinst <instance# .. | all>

SQL> oradebug setinst "1"

SETMYPID

Sets the oradebug PID to the current process

oradebug setmypid

SQL> oradebug setmypid

SETORAPID

Set PID of Oracle process to debug

oradebug setorapid <orapid> ['force']

SELECT pid
FROM gv$process
WHERE addr = (
SELECT paddr
FROM gv$session
WHERE sid = DBMS_SUPPORT.MYSID);

or

SELECT pid
FROM gv$process
WHERE addr = (
SELECT paddr
FROM gv$session
WHERE sid = (SELECT sid FROM gv$mystat WHERE ROWNUM = 1));

/*
or one of the processes from the background, dispatcher, job queue, parallel, or shared server process lists
*/

SQL> oradebug setorapid 19

SETOSPID

Set OS pid of process to debug

The operating system process ID is the PID on Unix systems and the thread number for Windows systems

oradebug setospid <ospid>

Do not use as it often fails. Use setorapid instead.

SETORAPNAME

Set Oracle process name to debug

oradebug setorapname <orapname>

TBD

SETVAR

Modify a fixed PGA/SGA/UGA variable

oradebug setvar <pga|sga|uga> <name> <value>

SQL> oradebug setvar SGA kcfdfk 200

SGATOFILE

Dump SGA to file

oradebug sgatofile <SGA dump dir>

SQL> oradebug ffbegin
SQL> oradebug sgatofile "c: emp"
SQL> oradebug ffresumeinst

SHORT_STACK

Get abridged OS stack

oradebug short_stack

SQL> oradebug short_stack

SHOW

Show watchpoints

oradebug show <local|global|target> watchpoint <id>

SQL> oradebug show?

SKDSTTPCS

Helps translate PCs to names

oradebug skdsttpcs <ifname> <ofname>

SQL> oradebug skdsttpcs?

SUSPEND

Suspends the current process

oradebug suspend

SQL> oradebug suspend

TRACEFILE_NAME

Get trace file name

Will not return a value on Windows systems

oradebug tracefile_name

SQL> oradebug tracefile_name

UNLIMIT

Unlimit the size of the trace file

oradebug unlimit

SQL> oradebug unlimit

WAKEUP

Wake up Oracle process

oradebug wakeup <orapid>

SELECT pid
FROM gv$process
WHERE addr = (
SELECT paddr
FROM gv$bgprocess
WHERE name = 'SMON');

SQL> oradebug wakeup 7

WATCH

Watch a region of memory

oradebug watch <address> <len> <self|exist|all|target>

SQL> oradebug watch?

Demo

Taking a heap dump during a large (sorting) query

-- This example requires two sessions, session 1 logged on SYS AS SYSDBA and session 2 which
-- executes the query. In session 2 identify the PID using

SELECT pid
FROM gv$process
WHERE addr IN (
SELECT paddr
FROM gv$session
WHERE sid = dbms_support.mysid);

In this example the PID was 12

In session 1 set the Oracle PID using

ORADEBUG SETORAPID 12

In session 2 start the query

SELECT ... FROM t1 ORDER BY ....

In session 1 suspend session 2

ORADEBUG SUSPEND

The query in session 2 will be suspended

In session 1 run the heap dump

ORADEBUG DUMP HEAPDUMP 1

The heapdump will show the memory structures allocated for the sort. At this point further dumps e.g. subheap dumps can be taken.

In session 1 resume session 2

ORADEBUG RESUME

The query in session 2 will resume execution

Oracle群英录 - 2013上海OOW名人录

By eygle on July 26, 2013 4:38 PM

以下是出席2013上海Oracle Open World（甲骨文全球技术大会）的官方重要人名名单及履历，在这次大会上马克赫德因飞机故障最终未能出席。

马克·赫德
甲骨文公司总裁
马克·赫德先生目前担任甲骨文公司总裁及董事会成员。他于2010年加入甲骨文，拥有超过30年与领先技术行业、计算机硬件以及执行管理相关的丰富经验。作为总裁，赫德负责甲骨文公司全球市场运营的企业发展方向和战略，包括市场、销售、咨询、联盟与渠道以及支持。他主要关注战略、管理、创新和客户。赫德先生说："作为一个企业，我们的任务就是帮助客户节省成本并进行创新。"

在加入甲骨文之前，赫德先生曾担任惠普公司的董事会主席、首席执行官以及总裁，负责客户、创新、提高运营效率及执行管理，在其领导下，公司业务取得显著增长。在此之前，他在NCR公司工作了25年，并在该公司担任过包括管理、运营、销售、市场等多项职位，最终成为该公司的首席执行官和总裁，成功带领该公司提升运营效率、增强产品线并促进业务增长。

赫德被《福布斯》（Forbes）评为2009年"最佳管理者"之一。2007年，赫德入选《财富》杂志25位年度最有影响力的商业人士。他也曾多次入选《Business 2.0杂志》的50位最重要人物（Who Matter Now）以及《巴伦周刊》的最佳CEO名单。《旧金山纪事报》将其评为2008年年度CEO。他曾3年入选CRN的25位最有影响力的管理人员名单，两次成功入选最佳25强管理人员。

John Fowler
甲骨文公司系统事业部执行副总裁
John Fowler现任甲骨文公司系统事业部执行副总裁，在公司战略、系统以及软件开发方面拥有深厚的从业经验。

John Fowler于2010年加入甲骨文，此前，Fowler先生已供职Sun公司超过14年，并相继担任过一些重要职务，包括Sun系统集团执行副总裁、Sun软件事业部首席技术官、以及Sun x64系统集团执行副总裁等，主要负责为Solaris、Linux和Windows开发行业标准的网络计算系统。

在甲骨文，John Fowler继续负责所有Sun系统产品的开发工作，包括SPARC和基于x64的服务器，以及网络和磁盘与磁带存储产品等。此外，他还负责系统软件工作，包括Oracle Solaris等。

Steve Miranda
甲骨文公司应用产品开发执行副总裁
作为甲骨文公司应用产品开发执行副总裁，Steve Miranda负责全面领导Oracle应用产品和相关云服务的产品政策、产品发展和产品交付。这些产品包括Oracle Fusion Applications和Oracle针对顾客服务与支持、商业和人才管理所设计的最新产品。

Miranda先生于1992年加入Oracle，担任过多项领导职务。2007年，他曾经出任Oracle新一代软件应用套件和Oracle Fusion Applications 的主要负责人。在Miranda先生的领导下，Oracle不断履行着帮助应用软件客户赢得创新、保持竞争力的承诺，并且利用Oracle新产品与服务帮助客户优化其IT投资的价值。在加入Oracle之前，Miranda先生曾就职于GE Aerospace。他拥有斯坦福大学的数学和计算科学学位。

Andrew Mendelsohn
甲骨文公司数据库技术产品高级副总裁
Andrew Mendelsohn现任甲骨文公司数据库技术产品高级副总裁，主要负责开发和管理甲骨文的各类数据库产品，包括软件类产品中的Oracle数据库、Oracle TimesTen 内存数据库、Oracle Berkeley数据库、 Oracle NoSQL 数据库，以及 Oracle Exadata 数据库云服务器、 Oracle数据库机和Oracle大数据机等集成设计系统。

Mendelsohn先生于1984年5月加入甲骨文，曾担任过甲骨文数据库5.1版本的开发者。在加入甲骨文之前，他曾在惠普和ESVEL公司供职。Mendelsohn先生拥有普林斯顿大学电子工程和计算机科学的工程学理学位，并在麻省理工学院完成计算机科学的研究生学习。

David Vap
甲骨文公司应用开发集团副总裁
David Vap目前担任甲骨文公司应用开发集团副总裁，负责基于云的甲骨文用户服务产品系列的战略及管理，并协同包括销售、服务、市场营销及商业应用在内的整个甲骨文用户体验产品线的战略。

作为拥有20年经验的科技领域资深从业者，Vap先生在2012年因RightNow公司的收购而加入甲骨文。在RightNow时，他担任产品副总裁，负责产品战略、产品管理及市场营销。

加入RightNow之前，Vap先生担任Software AG的销售及市场营销副总裁。任职期间，他定义并推广了领先的商务流程SOA套件Software AG Crossvision，同时主导其销售工作。他还曾担任内容管理厂商Artesia Technologies产品副总裁，负责产品管理、开发及质量控制。在加入Artesia前，他成立了一家专注于基于CASE工具环境的包装解决方案的专业服务公司并成功将其出售。他在华盛顿的PwC开始他的职业生涯。

Nandini Ramani
甲骨文公司Java客户开发副总裁
Nandini Ramani是甲骨文公司Java客户开发副总裁。她负责Java客户平台业务，长久以来为Sun公司的创新和未来发展做出了很大贡献。

Nandini发起了JavaFX平台及工具的开发，自2007年5月JavaFX平台的开发启动以来，一直积极参与其中。加入客户机部门之前，Ramani女士在"软件首席技术官办公室"工作，负责推动实施孵化项目的新技术部门的工作。她在硬件和软件领域都拥有丰富经验，一直参与"图形加速（Accelerated Graphics）"部门的硬件架构和仿真团队以及JavaME部门的图形和媒体团队的工作。她参加了XML标准的开发，是W3C"可缩放矢量图形（Scalable Vector Graphics）"工作组的联合主席，也是W3C"复合文件格式（Compound Document Formats）"工作组的成员。她还是JCP的几个图形及UI相关专家组的成员。

Peter Utzschneider
甲骨文公司Java产品管理副总裁
Peter Utzschneider现任甲骨文公司产品管理副总裁。Utzschneider先生现在负责Java产品的市场策略，包括Java SE、JavaFX、Java ME 以及Java 嵌入式产品等，以持续推动Java产品的商业成功、Java社区的振兴以及甲骨文公司对Java语言和技术的持续承诺。

Utzschneider先生曾在欧洲和美国工作超过20年。通过将早期的市场需求转换为广泛的市场部署能力，他在市场营销和销售行业领先软件解决方案方面取得了很大的成功。在加入Oracle之前，Utzschneider先生曾担任Tangosol公司市场副总裁。加入Oracle之后，他进一步推动Cohenrence产品的发展，使其成为业界领先的数据网格解决方案，并成为Oracle融合中间件的一个重要组成部分。

Cameron Purdy
甲骨文公司云应用基础副总裁
Cameron Purdy现任甲骨文公司开发副总裁，主要负责Java EE平台、Web服务器和应用服务器等产品的研发工作。

在加入甲骨文之前，Purdy先生曾担任数据网格软件公司Tangosol的首席执行官，该公司具有创新性的Coherence数据网格（Coherence Data Grid）产品, 可为企业提供可靠的和可扩展的数据管理。自1996年起，Purdy先生开始从事Java和Java相关技术的工作，他还是JCP（Java Community Process）组织的规范领导者。

作为一位软件专家和行业领袖，Purdy先生经常在行业大会中发表演讲，并因其对Java社区发展的特殊贡献而多次获得嘉奖，其中包括三次被授予"JavaOne RockStar"奖并入选TheServerSide的"企业Java名人堂（Who's Who in Enterprise Java）"。

Amit Zavery
甲骨文公司融合中间件集团副总裁
Amit Zavery先生是甲骨文公司融合中间件集团副总裁，目前负责融合中间件产品的产品策略、发展线路图、产品定位以及上市推广计划，包括云应用基础、服务整合、业务流程管理、数据整合、商务智能、内容管理、企业门户、身份认证与访问管理以及开发工具等。

自从1995年加入甲骨文公司以来，Zavery先生曾在产品开发、产品管理、产品战略和咨询等领域担任要职。在负责Oracle应用服务器之前，他主要负责Oracle电子商务应用软件的产品开发和管理，包括Oracle iStore, iPayment, 以及iMarketing。Zavery先生还负责在印度创建了甲骨文CRM研发中心。

Zavery先生最早在甲骨文视频服务器产品团队担任解决方案架构师。随后，他在甲骨文咨询部门工作，负责实施大量的互动电视应用以及随着Web的普及为客户创建互联网应用。他还曾服务于Oracle数据库集团，负责规划和定义Oracle 9i数据库。Zavery先生拥有奥斯汀得克萨斯大学的电气和计算机工程理科学士学位，同时还持有美国的卡内基梅隆大学计算机科学和商业硕士学位。

Neil de Crescenzo
甲骨文公司健康科学事业部高级副总裁兼总经理
Neil de Crescenzo现任甲骨文公司健康科学高级副总裁兼总经理，负责甲骨文全球范围内的健康和生命科学市场业务，全面管理该行业解决方案团队、战略规划、产品开发、销售及服务支持。Neil de Crescenzo在健康和生命科学领域拥有超过25年的丰富经验及全球客户和合作伙伴资源，他在工作中充分展示了杰出运营能力及IT领导力。

加入甲骨文前，Neil de Crescenzo曾作为高层领导在IBM效力十年，负责该公司在全球的健康和生命科学客户管理。深耕IT行业之前，他曾在医药中心和健康保险公司领导层任职。Neil de Crescenzo多次以主题演讲者的身份出席众多全球性的行业大会，并在相关领域话题上广受推崇。Neil de Crescenzo毕业于耶鲁大学拥有政治学学士学位，并随后在美国东北大学取得高科技工商管理学硕士学位。

Chris Baker
甲骨文公司全球ISV/OEM/JAVA销售高级副总裁
Chris Baker任甲骨文公司全球ISV/OEM/JAVA销售部门主管，负责与ISV/OEM伙伴合作，同时最大化甲骨文的业务价值，进一步为合作伙伴的终端用户提供优质服务。在担任此职务前，Chris是Oracle EMEA管理组的成员之一，并担任甲骨文公司高级副总裁，负责核心技术业务。

Chris于1997年1月加入Oracle，曾担任一系列高级管理职务，包括负责英国、爱尔兰及以色列地区的技术许可业务高级副总裁，英国、爱尔兰及南非地区的咨询副总裁兼部门主管，以及英国、爱尔兰和南非地区的应用与技术产品副总裁。此外，他还担任过Oracle支持部门的英国区总监。

在加入Oracle之前，Baker曾在Digital Equipment工作13年，曾担任英国区销售总监，负责公司的外包业务。Baker是一名资深的土木工程师，获有邓迪大学的土木工程学士学位，并在IT领域拥有超过25年的丰富经验。

Lyle Ekdahl
甲骨文公司集团副总裁兼JD Edwards总经理
Ekdahl 先生自2009年开始担任甲骨文公司集团副总裁兼JD Edwards产品总经理，包括JD Edwards EnterpriseOne及JD Edwards World系列。此前，在2005年至2009年，他曾任JD Edwards全产品线的产品策略及管理副总裁。

Ekadah先生于2003年加入JD Edwards EnterpriseOne团队。在此之前，他先后于Siebel Systems、Scopus Technology、Platinum Software和Channelpoint等公司担任高层管理职务。同时，Ekdahl先生在一系列国际高科技企业拥有超过20年的从业经历，对产品研发、管理、市场营销、分析及运营等领域均有丰富的经验。

Robert K. Weiler
甲骨文公司全球行业事业部执行副总裁
Robert K. Weiler现任甲骨文公司全球行业事业部执行副总裁。此前，他曾在临床试验与医药安全领域数据管理解决方案领先供应商Phase Forward担任董事长和首席执行官。Weiler先生在科技领域拥有30余年的领导经验，比如曾在Giga Information Group过担任董事长、总裁和首席执行官。在他的事业生涯早期，Weiler先生曾在Eastman Software（原名Wang Software）公司担任过总裁和首席执行官，也曾在Lotus Development Corporation担任过全球市场销售高级副总裁，对公司Lotus Notes的业务拓展发挥了至关重要的作用。

Weiler先生目前是SADD（青少年毒品及犯罪防治组织）董事会成员之一，也曾是Waterville Valley Company、Saint Anselm's College、Corporate Software、Distributed Management Systems、Cullinet Software Interleaf、DataLogix和Giga Information Group的董事会成员。Weiler先生拥有Saint Anselm's College的学士学位，并于2000年获得荣誉博士称号。他曾荣获美国新英格兰区2010年度安永医疗IT领域企业家荣誉称号；2006年，他名列PharmaVOICE 100强；Weiler先生也因其在商业及科技领域优秀的领导才能获得麻州科技领导协会的认可，荣获2006年度首席执行官的奖项。

Barry Clark
甲骨文公司集团副总裁兼全球零售事业部销售负责人
Barry Clark拥有30年的销售和综合管理经验, 于2011年3月甲骨文收购ATG时加入甲骨文。Barry Clark先生于2011年3月至2013年6月期间出任甲骨文集团副总裁，负责公司全球商业销售业务。在加入甲骨文之前，Barry Clark先生曾在Schoolkidz Inc., Domino Printing Sciences, AM Multigraphics 和 Digital Equipment等公司担任多项重要的销售以及管理工作。

Chet Kamat
甲骨文金融服务软件有限公司首席执行官兼董事总经理
Chet Kamat现担任甲骨文金融服务软件有限公司首席执行官兼董事总经理。该公司是一家甲骨文控股子公司和甲骨文金融服务全球事业部的重要组成部分。凭借着25年多深厚的金融服务、咨询和业务转型经验，Chet Kamat在Oracle金融服务软件领域发挥了重要作用。

在加入甲骨文之前，Chet Kamat是一家领先的私人股权投资公司STG的董事总经理，该公司主营投资软件和企业服务公司。在STG，其负责投资组合公司的转型和运作，并特别关注这些公司在全球经营模式上的运用。

在这之前，Chet曾在埃森哲及一家零售金融创业公司担任CEO。其1986年加入埃森哲，曾在印度、美国、瑞典、匈牙利和菲律宾等多国，从事广泛业务咨询和大范围的系统整合工作。离开埃森哲前，Chet掌管埃森哲印度交付中心网络的合作伙伴，负责从无到有，建立并发展到拥有13000多个员工，服务于200多个全球客户的事业部。

Gregory Midtbo
甲骨文公司全球金融服务事业部行业副总裁兼全球负责人
作为甲骨文公司金融服务事业部全球负责人，Gregory Midtbo先生带领着一支行业专家团队，管理着甲骨文在全球金融服务行业领域的Go-to-market活动。

此前，Gregory Midtbo先生曾在甲骨文公司负责过纽约地区管理应用软件的销售以及亚太区域金融行业应用软件的销售。1995年加入甲骨文前，Gregory Midtbo先生曾在Treasury Services Corporation担任亚太区运营负责人，也曾在NCR和AT&T担任过多项销售和管理工作。他28年的工作经验无论是与市场信息技术还是金融服务产业都密切相关。Gregory Midtbo先生毕业于美国明尼苏达大学（University of Minnesota）并荣获金融本科学位。

Sonny Singh
甲骨文公司金融服务事业部高级副总裁兼总经理
Sonny Singh先生现在担任甲骨文金融服务行业事业部高级副总裁兼总经理，管理着甲骨文银行、保险及资本市场等行业相关产品的销售、咨询、工程以及支持等领域。

在甲骨文工作23年期间，Sonny Singh先生在公司及业务的创新执行方面以及新市场策略方面展示了其卓越领导力，不断推动着甲骨文硬件、软件和服务产品线在业界的影响力。

此前，Sonny Singh先生担任甲骨文行业事业部高级副总裁，负责甲骨文的上市策略，比如跨越甲骨文整个产品线和服务线的产品市场推广，竞争分析，市场培训，销售推动以及收购整合。此外，Sonny Singh先生负责提升甲骨文策略性客户的关系维护能力，比如针对所有行业的解决方案和专业技能计划，不断提升甲骨文品牌价值引擎竞争力的甲骨文洞察力计划以及甲骨文解决方案中心。在领导甲骨文行业事业部之前，Sonny Singh先生担任甲骨文咨询事业部的集团副总裁，领导着针对北美策略客户的甲骨文服务领域。

邹晓兵
甲骨文公司融合中间件产品管理副总裁
邹晓兵先生目前在甲骨文公司主要负责甲骨文市场领导融合中间件产品的上市策略，特别是合作伙伴计划以及跨平台解决方案。邹晓兵同时也负责基于整个Oracle融合中间件堆栈创建解决方案和策划上市方案，比如针对融合应用的甲骨文中间件。

邹晓兵先生因甲骨文收购身份管理软件领导者Bridgestream公司而加入甲骨文公司。他在Bridgestream公司负责市场、产品管理以及策略合作伙伴。在加入Bridgestream公司之前，邹晓兵先生曾担任TIBCO软件公司商业整合部总经理。他同时拥有南加州大学电机工程学硕士学位以及加州大学洛杉矶分校安德森商学院MBA学位。

Mark C. Lewis
甲骨文公司亚太区联盟与渠道部高级副总裁
Mark Lewis现任甲骨文公司亚太区联盟与渠道部高级副总裁，也是公司亚太区管理团队的成员之一。

Lewis先生常驻新加坡，主要负责制定和推动所有Oracle产品的渠道销售、市场和合作伙伴发展战略。其中包括与战略合作伙伴联盟、分销商以及平台合作伙伴发展成功的长期合作关系，并将所有渠道整合入亚太合作伙伴的生态系统之中。
在甲骨文工作的十年时间里，Lewis先生担任过销售、市场和企业并购等多项高层职务。在出任现职务之前，他负责甲骨文公司亚太区的运营工作，包括销售、市场发展、活动推广和企业内部沟通。Lewis先生于2001年加入甲骨文，此前他曾在Arthur Andersen和IBM供职，担任过泛亚地区销售、市场和咨询方面的职务。
Lewis先生拥有悉尼科技大学的数学学士学位，以及麦考瑞大学研究生管理学院的工商管理学硕士学位。他也拥有商业和市场推广方面广泛的专业背景和会员资格。

潘少海
甲骨文公司高级副总裁及大中华区董事总经理
潘少海于2012年出任甲骨文高级副总裁及大中华区董事总经理一职，负责公司在大中华地区的整体业务，其主要职责包括推动甲骨文在中国的增长计划，加速甲骨文全线产品的市场渗透，提升市场占有率和市场领导力，致力于兑现对大客户及核心合作伙伴的承诺，进一步扩展甲骨文的业务领域。

潘少海从2008年起，出任甲骨文亚太咨询服务（OCS）高级副总裁，全面负责甲骨文在亚太地区的咨询业务，这些业务包括市场进入模式，跨行业、跨地域解决方案组合、市场竞争力建立，为关键客户提供转型服务以兑现甲骨文的承诺。

潘少海在2007上半年加入甲骨文，主要负责提升甲骨文ERP咨询服务能力，加强甲骨文在大中华地区和韩国的ERP服务市场进入。凭借其在地区性咨询管理专业的广度和深度，成功帮助甲骨文建立了策略性的目标，确保了甲骨文对北亚市场潜力的挖掘和掌握。

在加入甲骨文以前，潘少海在惠普公司工作20年，曾担任该公司在亚太地区的多项高层管理角色，包括亚太及日本地区惠普服务公共部门总经理，亚洲和澳大利亚地区惠普咨询总经理，以及大中华区惠普咨询总经理等要职。

喻思成
甲骨文公司副总裁兼大中华区技术总经理
喻思成先生现任甲骨文公司副总裁兼大中华区技术总经理，负责管理售前技术团队。喻思成先生于2008年6月随甲骨文收购BEA而加入甲骨文公司。在BEA期间，曾任职于BEA公司北美研发部门，负责BEA的系统整合产品WebLogic Integration（WLI）的开发。2001年，喻思成先生从BEA美国总部调任中国，负责对BEA中国区售前技术团队的组建和管理，参与了BEA在中国的迅猛发展。

喻思成先生拥有加拿大Lakehead University工程硕士学位，并获得北京大学光华管理学院EMBA学位。1997年始担任美国西雅图FactoryMall 公司的CTO，专攻网上电子商务领域的创新。

潘杰君
甲骨文公司全球副总裁及大中华区应用软件总经理
潘杰君于2010年出任甲骨文全球副总裁及大中华区应用软件总经理一职，负责公司在大中华地区的应用软件的整体业务，其主要职责包括推动甲骨文在中国大陆，香港以及台湾的应用软件的业务增长，加强甲骨文应用软件产品的市场渗透，占有率和市场领导地位，并为客户带来完整的端到端的业务解决方案。

潘杰君从2007年起加入甲骨文，出任甲骨文亚太咨询服务全球副总裁，负责甲骨文在亚太地区的金融/电信/媒体/电力等的咨询业务，为关键客户提供转型服务，实施咨询并兑现甲骨文的承诺。潘杰君加入甲骨文前，也曾担任过仁科PeopleSoft大中国区总经理， JD Edwards北亚区总经理，也曾担任大型咨询公司在亚太地区的多项高层管理角色，并取得优异的业务成绩。

刘松
甲骨文公司大中华区技术战略部总经理
刘松先生现任甲骨文公司大中华区技术战略部总经理，负责甲骨文中国战略性产品方向的规划与执行，新技术与解决方案的推广，并担任公司技术发展趋势的主要发言人；通过众多大型IT项目的实际介入，与国内各个行业信息主管的深入沟通，结合国内客户与合作伙伴的具体情况，他的工作重点是帮助国内企业的信息主管在理解技术趋势的基础上更好的使用IT技术，用于行业应用。作为几个软件行业媒体的专栏作者，他的许多言论被国内的知名IT媒体作为行业技术趋势方面的内容来源之一。

刘松先生在中国IT市场拥有15年的工作经验，在加入甲骨文公司之前分别在IBM、BEA等公司担任多种技术与市场职位。

谢鹏
甲骨文公司大中华区企业应用咨询总经理
谢鹏先生现任甲骨文大中华区应用产品解决方案咨询总经理，负责大中华区应用产品解决方案的销售支持和业务咨询，包括ERP、SCM、CRM、HCM 和Application Cloud等应用产品和方案。其主要职责是领导顾问团队在理解和洞察客户需求的基础上为客户提供引领创新及业务驱动的信息化解决方案，并帮助其导入业务运营之中。同时他还专注不断地向市场和企业传递沟通新的管理理念和方法，以及甲骨文新的产品方向和策略，致力于建立企业基于IT的核心竞争力并使总体拥有成本最低。

谢鹏先生是甲骨文公司首席应用架构师，擅长信息技术和业务变革的融合创新。在不同类型的大中小企业都有成功咨询和项目导入的经验，包括国企、民企和跨国企业等。谢鹏先生在企业应用领域有超过20年的工作经验，曾担任凯捷咨询副总裁等高层管理角色。

何伟信
甲骨文公司中国区管理软件--中型企业市场总经理
何伟信现任甲骨文公司中国区管理软件--中型企业市场总经理，负责中国区高增长城市的应用软件业务,包括ERP, HCM, CRM, 专有软件, 商业分析软件以及SaaS云解决方案等的推广和销售, 为不同行业的客户提供完整的端到端的业务解决方案。

在担任此职之前，何伟信曾先后担任甲骨文香港区董事总经理和甲骨文公司华南区董事总经理，负责领导该地区的整体业务，以及掌管策略和管理运营。何伟信在甲骨文香港及大中华区拥有超过20年的丰富管理经验。

加盟甲骨文前，何伟信在IT及互联网公司担任多项要职，汲取了宝贵的销售和合作伙伴管理经验，并取得了卓越的业务佳绩。他曾出任雅虎香港搜索营销总监，并在此前担任BEA系统香港有限公司区域总经理，成功赢得金融服务行业、通讯行业及政府重大项目中的多项中间件解决方案业务。何伟信于1998年至2005年期间在Sun先后担任多个要职。

Hadoop 简介 - 福布斯:你不得不了解的大数据工具

By eygle on April 8, 2012 7:15 PM

福布斯：Hadoop----你不得不了解的大数据工具 (原文链接： http://cloud.csdn.net/a/20120220/312061.html )

如今Apache Hadoop已成为大数据行业发展背后的驱动力。Hive和Pig等技术也经常被提到，但是他们都有什么功能，为什么会需要奇怪的名字（如Oozie，ZooKeeper、Flume）。

Hadoop带来了廉价的处理大数据（大数据的数据容量通常是10-100GB或更多，同时数据种类多种多样，包括结构化、非结构化等）的能力。但这与之前有什么不同？

现今企业数据仓库和关系型数据库擅长处理结构化数据，并且可以存储大量的数据。但成本上有些昂贵。这种对数据的要求限制了可处理的数据种类，同时这种惯性所带的缺点还影响到数据仓库在面对海量异构数据时对于敏捷的探索。这通常意味着有价值的数据源在组织内从未被挖掘。这就是Hadoop与传统数据处理方式最大的不同。

本文就重点探讨了Hadoop系统的组成部分，并解释各个组成部分的功能。

MapReduce----Hadoop的核心

Google的网络搜索引擎在得益于算法发挥作用的同时，MapReduce在后台发挥了极大的作用。MapReduce框架成为当今大数据处理背后的最具影响力的"发动机"。除了Hadoop，你还会在MapReduce上发现MPP（Sybase IQ推出了列示数据库）和NoSQL（如Vertica和MongoDB）。

MapReduce的重要创新是当处理一个大数据集查询时会将其任务分解并在运行的多个节点中处理。当数据量很大时就无法在一台服务器上解决问题，此时分布式计算优势就体现出来。将这种技术与Linux服务器结合可获得性价比极高的替代大规模计算阵列的方法。Yahoo在2006年看到了 Hadoop未来的潜力，并邀请Hadoop创始人Doug Cutting着手发展Hadoop技术，在2008年Hadoop已经形成一定的规模。Hadoop项目再从初期发展的成熟的过程中同时吸纳了一些其他的组件，以便进一步提高自身的易用性和功能。

HDFS和MapReduce

以上我们讨论了MapReduce将任务分发到多个服务器上处理大数据的能力。而对于分布式计算，每个服务器必须具备对数据的访问能力，这就是HDFS（Hadoop Distributed File System）所起到的作用。

HDFS与MapReduce的结合是强大的。在处理大数据的过程中，当Hadoop集群中的服务器出现错误时，整个计算过程并不会终止。同时 HFDS可保障在整个集群中发生故障错误时的数据冗余。当计算完成时将结果写入HFDS的一个节点之中。HDFS对存储的数据格式并无苛刻的要求，数据可以是非结构化或其它类别。相反关系数据库在存储数据之前需要将数据结构化并定义架构。

开发人员编写代码责任是使数据有意义。Hadoop MapReduce级的编程利用Java APIs，并可手动加载数据文件到HDFS之中。

Pig和Hive

对于开发人员，直接使用Java APIs可能是乏味或容易出错的，同时也限制了Java程序员在Hadoop上编程的运用灵活性。于是Hadoop提供了两个解决方案，使得Hadoop编程变得更加容易。

•Pig是一种编程语言，它简化了Hadoop常见的工作任务。Pig可加载数据、表达转换数据以及存储最终结果。Pig内置的操作使得半结构化数据变得有意义（如日志文件）。同时Pig可扩展使用Java中添加的自定义数据类型并支持数据转换。

•Hive在Hadoop中扮演数据仓库的角色。Hive添加数据的结构在HDFS（hive superimposes structure on data in HDFS），并允许使用类似于SQL语法进行数据查询。与Pig一样，Hive的核心功能是可扩展的。

Pig和Hive总是令人困惑的。Hive更适合于数据仓库的任务，Hive主要用于静态的结构以及需要经常分析的工作。Hive与SQL相似促使其成为Hadoop与其他BI工具结合的理想交集。Pig赋予开发人员在大数据集领域更多的灵活性，并允许开发简洁的脚本用于转换数据流以便嵌入到较大的应用程序。Pig相比Hive相对轻量，它主要的优势是相比于直接使用Hadoop Java APIs可大幅削减代码量。正因为如此，Pig仍然是吸引大量的软件开发人员。

改善数据访问：HBase、Sqoop以及Flume

Hadoop核心还是一套批处理系统，数据加载进HDFS、处理然后检索。对于计算这或多或少有些倒退，但通常互动和随机存取数据是有必要的。 HBase作为面向列的数据库运行在HDFS之上。HBase以Google BigTable为蓝本。项目的目标就是快速在主机内数十亿行数据中定位所需的数据并访问它。HBase利用MapReduce来处理内部的海量数据。同时Hive和Pig都可以与HBase组合使用，Hive和Pig还为HBase提供了高层语言支持，使得在HBase上进行数据统计处理变的非常简单。

但为了授权随机存储数据，HBase也做出了一些限制：例如Hive与HBase的性能比原生在HDFS之上的Hive要慢4-5倍。同时 HBase大约可存储PB级的数据，与之相比HDFS的容量限制达到30PB。HBase不适合用于ad-hoc分析，HBase更适合整合大数据作为大型应用的一部分，包括日志、计算以及时间序列数据。

获取数据与输出数据

Sqoop和Flume可改进数据的互操作性和其余部分。Sqoop功能主要是从关系数据库导入数据到Hadoop，并可直接导入到HFDS或Hive。而Flume设计旨在直接将流数据或日志数据导入HDFS。

Hive具备的友好SQL查询是与繁多数据库的理想结合点，数据库工具通过JDBC或ODBC数据库驱动程序连接。

负责协调工作流程的ZooKeeper和Oozie

随着越来越多的项目加入Hadoop大家庭并成为集群系统运作的一部分，大数据处理系统需要负责协调工作的的成员。随着计算节点的增多，集群成员需要彼此同步并了解去哪里访问服务和如何配置，ZooKeeper正是为此而生的。

而在Hadoop执行的任务有时候需要将多个Map/Reduce作业连接到一起，它们之间或许批次依赖。Oozie组件提供管理工作流程和依赖的功能，并无需开发人员编写定制的解决方案。

Ambari是最新加入Hadoop的项目，Ambari项目旨在将监控和管理等核心功能加入Hadoop项目。Ambari可帮助系统管理员部署和配置Hadoop，升级集群以及监控服务。还可通过API集成与其他的系统管理工具。

Apache Whirr是一套运行于云服务的类库（包括Hadoop），可提供高度的互补性。Whirr现今相对中立，当前支持Amazon EC2和Rackspace服务。

机器学习：Mahout

各类组织需求的不同导致相关的数据形形色色，对这些数据的分析也需要多样化的方法。Mahout提供一些可扩展的机器学习领域经典算法的实现，旨在帮助开发人员更加方便快捷地创建智能应用程序。Mahout包含许多实现，包括集群、分类、推荐过滤、频繁子项挖掘。

使用Hadoop

通常情况下，Hadoop应用于分布式环境。就像之前Linux的状况一样，厂商集成和测试Apache Hadoop生态系统的组件，并添加自己的工具和管理功能。（李智/编译）

原文链接：Forbes.com

Hadoop 简介 - Microsoft大数据战略的核心

By eygle on April 8, 2012 7:08 PM

Hadoop----Microsoft大数据战略的核心（原文 http://cloud.csdn.net/a/20120308/312904.html ）

导读：众所周知，大数据浪潮正在渐渐的席卷全球的各个角落。而Hadoop正是这股风暴的动力之源。Microsoft更是史无前例的与Apache Hadoop社区合作。Microsoft此举就是希望利用自己在软件领域的优势构建一个打上Microsoft烙印的Hadoop生态圈。

如今，Microsoft已经将Hadoop作为自身大数据战略的核心。 Microsoft此举的理由就是看中了Hadoop的潜力，在大数据领域Hadoop已经成为分布式数据处理的标准。通过集成Hadoop技术，Microsoft允许客户访问快速增长的Hadoop生态系统。同时随着越来越多善于在Hadoop平台进行开发的人才涌出，这对Hadoop发展极其有利。

Microsoft的目标不仅仅是将Hadoop集成到Windows系统之中，Microsoft有意向Apache Hadoop社区贡献代码，并希望得到社区的采纳。最终使任何人都可以在Windows上运行纯粹开源的Hadoop。

打上Microsoft烙印的Hadoop

Microsoft的Hadoop版本目前发展到"客户技术预览版"的阶段。这意味着Microsoft在接受客户群体的评价，预计正式版会在2012年中期推出。Microsoft的Hadoop基于Windows Server平台或Microsoft云平台Azure之上。在将要推出的1.0版本之中，产品核心包括MapReduce、HDFS、以及Hadoop组件Pig和Hive。

Microsoft的目标是兼容所有的Hadoop组件。Hadoop生态系统中的Zookeeper、HBase、HCatalog和Mahout等组件也会被附加到Microsoft的Hadoop版本之中。

同时Microsoft推出的Hadoop还会与自身之前的商业智能分析产品做整合。

●Hadoop连接器将使Hadoop与SQL Server和SQL Server并行数据仓库之间的通信变得简单。

●Hive的ODBC驱动，允许任何Windows应用程序访问并对Hive数据仓库进行查询。

●Excel对Hive的访问，使数据直接从Hive移动到Excel和PowerPivot。

在后端，Microsoft对Hadoop进行了其他的改善，Microsoft将整合Active Directory方便访问控制。同时集成System Center用于管理人员管理。

Microsoft官方计划在即将于6月举行的TechED 大会上公布有关WAAD（Windows Azure Active Directory）的更多细节。这与Microsoft在Windows Server系统上的Active Directory的概念如出一辙。未来使用ACS（Access Control Service）与现有的Active Directory部署时可保证良好的互操作性。

利用JavaScript API与C#进行Hadoop开发

对于Microsoft推出的Hadoop版本最具特色的特点之一是附加JavaScript API。Hadoop上的编程工作是乏味的，这就是为什么别的高级语言会出现（如Pig）。

Microsoft选择在Hadoop环境中添加JavaScript层，开发人员可以使用它创建MapRedcue的工作，甚至在浏览器模式下与Pig和Hive进行数据交互。JavaScript层所带来的真正优势是将自身集成到Hadoop商业环境中，这使得开发人员能够轻松创建内网分析环境以便于商业用户访问。

Microsoft通过Node.js将JavaScript引入服务器端的 Windows Server以及Windows Azure平台之上。同时Microsoft计划将自身的JavaScript API贡献给Apache Hadoop开源社区。这对于Hadoop社区也是一个利好的消息。

更重要的是Microsoft使得使用.NET平台开发Hadoop应用成为可能。Microsoft计划直接利用现有Hadoop API使用.NET平台创建MapReduce任务。更高级别的接口或许将出现在未来的版本中。随着时间的推移，未来在Visual Studio中对Hadoop项目开发的支持将不断提高。同时未来运行在Azure之上的Hadoop项目将允许使用.Net Framework框架之上基于Common Language Runtime (CLR)语言（如C#语言）进行编程。

流数据处理系统与NoSQL

对于大数据人谈论最多的无疑是Hadoop，但流数据处理以及NoSQL对于大数据同样重要。对于Microsoft，他们自然会有所准备。Microsoft推出了被称之为StreamInsight的流数据解决方案。NoSQL方面，Microsoft也具备了Windows Azure平台上被称之为Azure Tables的NoSQL数据库。

展望未来，Microsoft对Hadoop兼容性的承诺意味着，流数据解决方案StreamInsight以及Azure Tables会作为Hadoop环境的一部分与Microsoft分布式HBase作为核心产品推出。同时现今的流数据解决方案（如Yahoo S4）将会与Microsoft相兼容。

与现有工具集成

Microsoft正倾向与向大数据工具集成现有的主要组件，这是否意味着Microsoft打算为企业提供一个综合数据科学平台？Microsoft大数据资深产品规划负责人Madhu Reddy给出了肯定的答案。Microsoft Hadoop开发工作的主要宗旨就是让人们使用熟悉的工具，Microsoft专注于与现有工具的互操作性。Microsoft此举涉及各个层面的使用人员，包括开发者、分析师、企业用户等。Excel是一个无处不在的软件，Excel与Hive的互联就是一个很好的例子。不过其他的工具也同样重要，如 MATLAB、SAS或R。

总结

Microsoft大数据战略确保Windows平台能够在大数据时代继续发挥自身的作用。并使得在数据中心业务中使自身的云服务具备更强的竞争力。Microsoft的另一个做法是将大数据与自身庞大和多样化软件无缝集成。可以看出Microsoft的重点是进行大力整合。Microsoft与Apache Hadoop社区的合作确保了新的工具和天才的开发人员向这个平台迁移。（李智/编译）

原文链接：radar.oreilly.com

Hadoop 简介 - 从初出茅庐的小象变身行业巨人

By eygle on April 8, 2012 6:35 PM

Hadoop：从初出茅庐的小象变身行业巨人链接（ http://cloud.csdn.net/a/20120203/311398.html ）

由于具备低成本和前所未有的高扩展性，Hadoop已被公认为是新一代的大数据处理平台。就像30年前SQL（Structured Query Language）出现一样，Hadoop正带来了新一轮的数据革命。如今Hadoop已从初出茅庐的小象变成了行业的巨人，但Hadoop仍需继续完善。

基于Java语言构建的Hadoop框架实际上一种分布式处理大数据平台，其包括软件和众多子项目。在近十年中Hadoop已成为大数据革命的中心。MapReduce作为Hadoop的核心是一种处理大型及超大型数据集（TB级别的数据。包括网络点击产生的流数据、日志文件、社交网络等所带来的数据）并生成相关的执行的编程模型。其主要思想是从函数式编程语言借鉴而来的，同时也包含了从矢量编程语言借鉴的特性。

互联网巨头Yahoo！作为Hadoop框架的先驱研究者，在6年时间已经将Hadoop塑造成了极为成功的技术。但相比于SQL，Hadoop在某些方面仍然显得不够完善。这直接导致现今所有目光都集中在Hadoop供应商的身上。包括Amazon、Cloudera等公司带来众多的创新并提供强大的工具。Cloudera推出的CHD3包含众多的附加软件，可以帮助管理、运行Hadoop上的复杂任务，例如：Apache Mahout、Flume、Sqoop、Pig、Oozie、Hive、HBase、ZooKeeper、Whirr等。同时Cloudera也是目前最大的提供企业Hadoop技术支持和培训的厂商。而Amazon是较早在公共云中运行Hadoop的公司，其提供的基于MapReduce的弹性计算可提供海量的数据计算服务。

但数据处理只是大数据处理的一部分，组织最终想要得到的是经过分析后的有价值的数据。商业智能和数据分析厂商如Datameer、Hadapt以及Karmasphere就显的不可或缺。

Hadoop在2011年证明自身的价值，最明显的迹象就是五大数据库管理软件供应商EMC、IBM、Informatica、Microsoft 以及Oracle都投入了Hadoop的怀抱。EMC与MapR展开合作，而Microsoft和Oracle则分别与Hortonworks和 Cloudera展开了合作。而EMC和Oracle已经推出了Hadoop专有设备。下面就让我们来看一下Hadoop在大数据领域都俘虏了那些公司的心。

Amazon基于MapReduce的服务

Amazon早在2009年就推出了基于Hadoop MapReduce的EC2（Elastic Compute Cloud）服务。因此Amazon在应对用户应用和需求上显得胸有成竹。无论是中小型企业还是超大型的组织，基于MapReduce的EC2服务都经受住了考验。同时AWS（Amazon Web Service）还包括Amazon S3（Simple storage Service）。Amazon S3可提供高伸缩性、靠可靠性、高可用性以及极低的存储成本。利用AWS可高效的处理数据密集型的任务，如Web索引、数据挖掘、日志文件分析、机器学习以及科技和生物信息的学术研究。

Cloudera提供安全的Hadoop平台

Cloudera也是比较早的大规模Hadoop软件和服务提供商。Cloudera一直专注于将开源的Apache Hadoop完善成可靠的平台。Cloudera目前拥有100多家客户，并且在本月还与Oracle展开合作，共同进军大数据领域。

在Cloudera提供了用于管理大数据的管理控制台和负责管理Hadoop部署的工具以及企业级的支持。Cloudera的管理工具提供基于向导式的Hadoop安装和配置菜单。同时提供相应的工具，以帮助系统管理员监控平台的健康状况、诊断问题、优化性能，并进行所需的配置和安全变更。而 Cloudera的企业级支持与服务包括配置检查、升级和与第三方系统集成以及其他技术资源。现今Cloudera管理软件现在的价格是每节点每年 4000美元（不包括硬件）。

Datameer将大数据与商业智能有机结合

Datameer宣称其公司基于Hadoop平台的产品方案DAS（Datameer Analytics Solution）非常适用于商业智能（BI）。Datameer可通过JDBC、Hive、Http连接任何的数据源。同时包括一个向导驱动集成平台，可安排负载并从任何结构化、半结构化和非结构化的大数据集。Datameer的大数据分析解决方案通过表格接口整合Hadoop的数据挖掘能力。并通过 REST API在私有云和公共云中输入和输出数据。

EMC的统一数据分析平台

EMC推出用于支持大数据分析的平台――EMC Greenplum统一分析平台(UAP)。Greenplum UAP是一个唯一的统一数据分析平台，可扩展至其他工具，其独特之处在于，它将对大数据的认知和分享贯穿整个分析过程，实现比以往更高的商业价值。UAP 包括EMC Greenplum 关系数据库、EMC Greenplum HD Hadoop以及EMC Greenplum Chorus。UAP就好比一个数据分析团队，包括了从数据科学家和BI分析师到DBA和在线商业用户和管理者。EMC针对硬件设备DCA（Data Computing Appliance），其足以运行EMC Greenplum 关系数据库和EMC Greenplum HD节点。DCA提供控制管理界面，方便管理人员监视、管理Greenplum数据库和Hadoop系统性能。

Hadapt与Hadoop环境无缝集成

Hive作为运行在Hadoop上的数据仓库组件并不像Hadoop那样受人关注。而Hadapt则提供集众多功能于一身的数据分析环境，旨在处理存在于Hadoop和SQL环境中传统结构化的数据。Hadapt平台可运行在私有云和公共云之上，并提供从一个环境访问数据的能力。包括现有基于SQL 的工具以及MapReduce处理和大数据分析。Hadapt自动分开执行Hadoop和关系数据库之间的查询，处分利用了Hadoop的高扩展性和关系数据库的高速性。

Hortonworks继承Yahoo！ Hadoop衣钵

Yahoo!在去年剥离了Hadoop业务，并与硅谷风投公司Benchmark Capital合资组建一家名为Hortonworks的公司。新公司包含在Yahoo！贡献最大的50名工程师，旨在继续推动Hadoop的发展。 Hortonworks高管断言这支以Yahoo!开发团队为班底的公司将会贡献更多的Hadoop代码，并指引Hadoop平台未来的发展。 Hortonworks已在去年10月与微软成为合作伙伴关系。Hortonworks可帮助Microsoft推出Windows平台之上的 Hadoop。Hortonworks在去年11月也推出了自由的HDP（Hortonworks Data Platform）V1，而结合了最新0.23版Hadoop的HDP V2将在2012年第一季度推出。Hortonworks还提供Hadoop的培训与支持，加强在这方面与Cloudera和MapR的竞争。

IBM的Hadoop之路

IBM在多年以前就开始研究Hadoop。现今IBM提供基于云服务的海量数据分析方面多种方案的选择，但目前IBM的策略似乎主要是围绕 Hadoop在发展。IBM在4月推出了其SmartCloud云计算平台。并承诺改善Hadoop工作负载。IBM提供了基于Hadoop的 InfoSphere BigInsights（IBM InfoSphere BigInsights是用于分析和虚拟化海量数据的软件和服务，这款新产品由 Apache Hadoop 提供技术支持。）基本版和企业版。 InfoSphere BigInsights之前作为IBM测试和开发的云产品，现在被SmartCloud取代。

Informatica 向云更进一步

大多数的数据管理软件供应商（如IBM、Oracle、Syncsort、Talend）都涉及到Hadoop。Informatica在去年10月也推出了Hadoop环境下的数据编译转换解决方案――HParser。

该方案可以运行在几乎所有的Apache Hadoop分布式环境中，与MapReduce架构平行，能高效率地把无结构的复杂数据――诸如网络记录、社交媒体数据、通话详细记录以及其他数据格式 ――转换为Hadoop中结构或半结构格式。当把数据转化为更具结构性的格式后，便可以得到更快速的使用和生效，从而驱动业务发展、提高运营效率。

Karmasphere Hadoop数据分析利器

Karmasphere提供了直接访问Hadoop中结构化和非结构化数据以及进一步分析查询的特性，同时Karmasphere还提供的可视化工作空间。Karmasphere提供的可视化工具提供了SQL或其他特定查询语言分析位于Amazon S3、工作流以及本地文件系统上的结构化和非结构数据的特性。企业还可以使用数据库或相关工具（例如Excel）来提取分析得出的数据。

MapR带来更高性能的Hadoop

MapR在Hadoop的舞台上显得格外耀眼，其提供Hadoop非常独特。MapR基于开源Hadoop，在只需有限硬件的环境中提供更快的 Hadoop。同时Mapr配备了快照，并号称不会出现SPOF单节点故障，且被认为是与现有HDFS的API兼容。因此非常容易替换原有的系统。 MapR最新的0.23版解决许多开源Hadoop的缺陷。而MapR与EMC的合作体现在了EMC Greenplum HD Enterprise Edition上，其就是基于MapR M5构建的。

Microsoft全面拥抱Hadoop

当EMC、IBM、Oracle都在2011年涉及Hadoop时，Microsoft全面拥抱Hadoop的举动就显得不足为奇了。而 Hadoop的Windows Server将在在2012年推出，届时其还会与微软现有的BI工具联合处理任务。去年微软表示推出Windows Azure上的Hadoop预览版，微软还使Hadoop的数据通过部署在基于云的Windows Azure获取。并使其能够与企业的商业智能工具一起分析数据。微软目前正与Hortonworks合作旨在努力简化下载、安装和配置等几个Hadoop 的相关技术。包括HDFS、Hive、Pig。这将有利于企业通过Hadoop拓宽自身的业务。微软将编写新的ODBC驱动程序并扩展自己现有的查询系统到Hive。这样一来用户将能够直接从Excel、PowerView执行Hadoop查询。

Oracle进军云计算

Oracle在2011 Oracle全球大会上宣布推出了Oracle Big Data Appliance。Big Data Appliance是一个集成了Hadoop、NoSQL Database、Oracle数据库Hadoop适配器、Oracle数据库Hadoop装载器及R语言的系统。Oracle还在今年1月与 Cloudera成为合作伙伴关系。Oracle现已将Cloudera Distribution Including Apache Hadoop（CDH）和Cloudera Manager集成到Oracle大数据机之中。Oracle也将利用Cloudera在Hadoop领域的专业知识提供培训及咨询业务。Oracle大数据机中运行了Oracle Linux操作系统，1个机架中包含18个Oracle-Sun服务器，共计216个核心，同时具备864GB的内存和648TB的存储能力，其售价为 45万美元。（李智/编译）

原文链接：informationweek

« IT新闻 | Main Index | Archives | 人物传奇 »

Recently in Oracle摘 Category

Oracle跟踪和诊断的利器: ORADEBUG 手册

Oracle群英录 - 2013上海OOW名人录

Hadoop 简介 - 福布斯:你不得不了解的大数据工具

Hadoop 简介 - Microsoft大数据战略的核心

打上Microsoft烙印的Hadoop

利用JavaScript API与C#进行Hadoop开发

流数据处理系统与NoSQL

与现有工具集成

总结

Hadoop 简介 - 从初出茅庐的小象变身行业巨人

文章分类

Monthly Archives

Pages

搜索本站

About this Archive