« 如何使用ftp从Metalink上下载补丁 | Blog首页 | CSDN英雄会上签名送书 »
Oracle支撑起世界最大人口身份信息数据库
作者:eygle |【转载时请务必以超链接形式标明文章原始出处和作者信息及本声明】链接:http://www.eygle.com/archives/2007/04/all_people_in_onedb.html
今天在论坛里看到这样一则新闻:我国建成世界最大人口身份信息数据库,新闻是2月份的,主要内容说:
记者从公安部全国公民身份号码查询服务中心(以下简称“查询中心”)了解到,经过5年的建设,全国近13亿人口身份数据已于2006年底全部入库,世界最大的人口身份信息数据库“全国公民身份信息系统”正式建成。公安部“全国公民身份信息系统”的建成,是全国各地公安机关治安户政部门广大干警、查询中心以及相关部门共同努力的成果。各地基层干警20多年来对户籍数据的采集、整理、录入,查询中心近5年的系统开发、数据收集、加载,再加上中国移动、中国电信、中国联通、中国网通等单位的大力支持和配合,身份信息核查服务已覆盖到全国9.6亿所有电话和互联网用户,可以帮助有需求的用户利用网络、手机等手段有效、便捷地核查身份信息,识别公民身份信息的真伪。
“查询中心”负责人为陆素冰。
还记得去年的一则新闻我国3.4亿个人信用信息基础数据库正式运行,中国人民银行的这个数据库后来证实是运行在Oracle数据库之上的,查询过的朋友也宣称其信息极为详尽,覆盖到记录用户的所有银行信息、信贷信息已经帐务信息等。如果这个系统可以用于最近国家大为推动的个人报税机制,那么相信很多隐藏的交易已经偷漏税信息都可以被核查出来。但是也许,怎样有效的应用这个数据库始终是个问题。
现在,这个更大型的全国人口信息库来了,而且更为庞大,来势汹汹。
按照之前对信用数据库的粗略估算:
用户表按每个用户记录占用1K Bytes计算,3.4 x 108 x 1 K = 340 G
信贷记录表按每记录2 k Bytes计算,35 x 106 x 2 k = 70 G
现在这个数据库的数据量应该至少在那个数据库的4倍以上,也就是最基础数据量至少再3~4T左右,这也是一个海量数据库了。
而且据说这个数据库架构在 SUN + Oracle RAC 基础之上,而且初始并不稳定。看来Oracle又一次赢得了海量数据的选择。
公安部的这个数据库目前已经通过网站向外提供收费服务,看来大家都开始务实起来,首先把盈利摆在了前面。
其实对于这两个数据库,我最关心的是数据的变更问题,会有人负责即使更新这两个数据库么?
否则信息陈旧下去其价值及及时性必然受到质疑。
有更了解这两个数据库运行机制的朋友么?
-The End-
By eygle on 2007-04-10 19:35 | Comments (22) | Posted to OraNews | Edit |Pageviews:
| 相关文章 | 随机文章 |
|
|
奥运会、抵制 与 anti-cnn 使用orabm进行CPU压力测试... 进京两周年记-Eygle在北京的生活之八 安装cronolog,格式化Apache的日志文件 人生自是有情痴 |
留言 (22)
最大? 不就是因为人口最多吗?
要是那一天找我做恢复? 有点做梦!
Posted by: anysql at April 10, 2007 9:01 PM
要是系统崩溃,这个就是大工程了...
Posted by: sopher at April 10, 2007 9:57 PM
2004~2005 断断续续去做过一个月技术支持, 作为Sales Consultant.
人行那里的开发人员 技术一般,
一切都刚刚起步,党员会议不断,
大家也知道 国营单位共有的惰性.
我只记得那里的伙食真好,社会主义好! 大食堂好.
Posted by: 木匠 at April 11, 2007 2:24 AM
人行个人征信数据库的support工作现在我在做。SUN + Oracle 9i RAC。
记得跟你说过的那个RAC一个节点Import数据报SVR4错误的事儿吗?
That's it.
人行征信数据的更新是从全国各个银行收集来数据,然后定期更新的,只是更新的方法有些落后,已经向他们提交更有效方法的建议了。
Posted by: kamus at April 11, 2007 3:12 AM
Kamus,
难道你不在广州?
我差点调到广州 Oracle Pre-sales,而且月薪加3千,
Oracle R&D的大老板极力阻止,没去成,后来转到了北京 Sales Consultant 部门.
广州 Oracle Pre-sales 的老板现在调到了北京 Pre-Sales.
有意思...
Posted by: 木匠 at April 11, 2007 8:10 AM
这些数据库,估计没什么压力吧?
Posted by: eygle at April 11, 2007 9:19 AM
我接触过12.6亿的人口身份信息库
发现有些人的名字居然大于30个字符,不知道名字真有这么长还是脏数据
Posted by: space6212 at April 11, 2007 9:25 AM
如果免费查的话, 就写个perl去查一下, 给他们增加一些load.
Posted by: anysql at April 11, 2007 10:40 AM
人口信息由各地公安机关定期更新的,在建设过程中,Oracle CDC的Takeshi Watanabe帮助做过性能测试,还请教过Oracle OCS的罗敏。公安部门基本上是比较官僚的地方,比中国移动差远了!恩,我只能说这些,再多就XX了!
Posted by: truezxd at April 11, 2007 11:02 AM
to 木匠
我一直都在北京的,你现在在北京Sales Consultant 部门?在国贸还是在上地?
Posted by: kamus at April 11, 2007 12:49 PM
to truezxd;
谢谢提供这么多有价值的信息,再问一下,现在数据量有多大啊?
:)
Posted by: eygle at April 11, 2007 1:47 PM
to kamus;
木匠早出国过滋润的日子去了。
Posted by: eygle at April 11, 2007 1:48 PM
都是些insert操作?查询并发量也不会太大吧,webserver也是若干节点的集群吗?应该是外包给专门的维护机构了吧
Posted by: jacky at April 11, 2007 2:01 PM
这得搞几个地方做容灾备份吧。
Posted by: hzip at April 11, 2007 3:25 PM
记得5-6年前启动的,一开始用的是Sun F10K + Oracle(ops?rac?)
Posted by: rollingpig at April 11, 2007 3:56 PM
数据库大小倒不大,和电信级DB比差远了!但并发查询是几千吧,在线用户得几十万上下。
Posted by: truezxd at April 11, 2007 5:36 PM
to truezxd:没猜错你吧?哈哈
不大也得10几个T吧
Posted by: victor666666 at April 12, 2007 1:28 PM
短信核查:
·中国移动用户发送“姓名,身份证号码”到“10665110”
·中国联通用户发送“姓名,身份证号码”到“9951”
收费标准:
·核查:5元/人.次
--------------------------
这个短信贵的。
Posted by: 溜达溜达 at April 16, 2007 8:20 PM
公安部好像在武汉有个灾备中心.
也不知道这个数据库在不在保护的行列
Posted by: blue_stone at April 22, 2007 10:42 PM
公安部的数据是各个省用打包程序打包成XML送上去的,然后有一套复杂的校验机制保证入库。这套机制都更新了N个版本了,把下面的人搞的要死。:)
现在是通过定期上报变动数据来更新的,准确性大概达到80%吧。其实即便是省库,准确性能到90%就很不错了。所谓的即时,那是不可能的。据我所知,现在只有湖南能保证地市和省库的同步在20分钟以内。GAB,三个月吧。
Posted by: bluegmy at April 24, 2007 11:52 AM
建设是要一步一步来的,公安能在信息建设方面有今天这样的成就,在人员、资金上都已经付出很多了。
希望象eygle这样的专家多支持公安信息系统的建设。
Posted by: yancong at July 8, 2007 3:15 PM
国家机关能请到的专家太多了,根本轮不到我们啊:)
Posted by: eygle at July 8, 2007 3:45 PM
