(来源
链接)
凡是浏览过网页的人,想必都知道HTML。正是HTML的出现,才会有Internet丰富多彩的今天。
HTML江郎才尽,电子商务呼唤春天
HTML(Hyper Text Markup Language,超文本语言)是W3C公司开发的Web语言。由于HTML简单易用,而且使用成本低,所以很快就受到人们的关注,并成为Internet上的标准Web语言,一直延用至今。
HTML的受重用程度在当时的Internet来说是可以理解的。因为当时的电脑技术较低,浏览器根本不可能解释更为复杂的Web语言,在这种情况下,Html在功能上基本地很好满足当时的需求。国外的许多大型企业, 迅速地建立起自己的网站,展示自己的产品(或服务)、企业管理、企业文化等,然而仅仅是为了展示而已。企业的经理们并没有想到,Internet的发展会如此之快,更没有想到的是出现“电子商务”浪潮,Internet走进了经济时代。
近年来,随着 Web的应用越来越广泛和深入,人们渐渐觉得HTML不够用了,HTML过于简单的语法严重阻碍了用它来表现复杂的形式。尽管HTML推出了一个又一个新版本(最新版本是1999年发布的HTML4.0),但始终满足不了不断增长的需求。
电子商务的出现,企业与企业在Internet上频频碰面,企业间的交流越来越重要,彼此数据交换的需求越来越大,然而,HTML过于简单的语法,有限的标签严重地制约着企业通过Web进行数据交换。虽然人们想通过对HTML进行升级来满足企业的需求,但是由于HTML开发之初“有限标签”的本质没能改变,即使新版本的HTML也没能解决需求问题。人们急需一个行而有效的方案来解决html的缺陷,满足电子商务的发展。
近年来,随着计算机技术的火箭式发展,已经可以实现比html开发之初复杂得多的浏览器,计算机硬件也能处理更为复杂的程序,因此,开发一种新的Web语言既是必要,也是可能的……
W3C公司开发的XML便是在这种需求声中闯进Web世界。XML作为新一代Web语言,将革命性地改变以Web为基础的电子商务应用形态,因为XML为网页编辑上的可携性及平台独立性、系统的兼容性、数据交互性、资源的整合和物流管理等等的电子商务应用,提供了完整的解决方案。
SGML、HTML、XML的亲缘关系
其实,早就有这么一个全世界标准的标记语言,可以用来定义某一类文件格式标志,解决HTML的困惑,那就是SGML(标准通用标记语言)。它是一个国际标准(ISO 8879),用来形容和定义结构化的电子文件,在1980年就制订了。不过,由于SGML过于详细和复杂,所以一直没有被广泛地采用。
国内知道SGML的人恐怕不多,这也并不为奇,因为SGML在我国并未得到广泛的应用,尽管出版界人士对SGML并不陌生。事实上,在国外GAML的应用已经渗透到各个领域,如瑞士的欧洲原子核共同研究所,牛津大学出版社,美国证券委员会,美国国防部等均应用了SGML进行信息数据交换或印刷出版。
SGML是一种处理电子化文档的计算机语言,作为ISO8879号标准,它独立于任何计算机和系统,它所采用的文档的表现形式是为了使其能被多角度地利用和保证文档在异种机之间的交换。
这些年来,SGML在中国渐渐地受到重视,国家图书馆的一批有识之士正致力于促进我国SGML的应用,除出版行业外,SGML成功地应用于数字图书馆的研究中,正受到举世瞩目。
虽然SGML具有将文件以对象(Object)方式进行处理等优点,理论上来说可以弥补html的缺陷。但是由于它的开发早于Web的诞生,在Web环境下的应用产生了诸如○1SGML标准过严、过复杂○2SGML不支持链接标准○3SGML不支持排版方式等根本性问题,使得SGML直接应用于Web的难度非常大。
HTML是一种标记语言,也可以说是一种格式化文件(通过标签来格式化文本),因为,HTML是在SGML标准的基础上开发出来应用于Web的语言。
当我们浏览(浏览器为微软IE)一个网页时,通过子菜单栏的查看\源文件可以查看该Web页的源代码。源代码中我们可以发现HTML是由<HTML>、<TITLE>、<BODY>、<TABLE>等许许多多的标签组成的,浏览器在解释网页时在源代码前部分发现<HTML>标签便会以HTML标准解释文件,将HTML的内容显示于屏幕上。
<HTML>
<HEAD>
<TITLE>这是一个HTML文档</HTML>
</HEAD>
<BODY BGCOLOR=”#FFFFFF”>
<H1>通过标签显示内容</H1>
</BODY>
</HTML>
由以上的代码段可知,Web的内容便是通过HTML标签的属性或标签对间的文字表示出来的,如:<BODY BGCOLOR=”#FFFFFF”>、<TITLE>这是一个HTML文档</TITLE>,浏览器正是通过解释HTML这些有限标签的代码,使Web变得丰富多彩。
HTML简单易用,由于它的语法简单,很容易开发HTML的编辑软件。但它的最大限制也在于它过于简单的语法及有限的标签机制,使得HTML在应用范围内受到限制主要有:
1、可用标签种类有限,不能精确了描述信息;
2、数据格式不能表现其内在意义;
3、不能表现深层的信息结构,因此不适于大量文档的存储;
4、除去电子阅览,将HTML用于其它领域应用时,机能欠佳;
5、HTML的信息表现形式不适于再利用;
6、不齿印刷页的概念;
7、精细的编排指定不可能;
8、全文检索的结果不精确;
9、HTML和Web浏览器的机能强化的结果,造成了Web浏览器间互换机能的部分消失;
由于HTML有限的标签,使得其只能从形态上表示内容,而在意义上表现内容方面显得无能为力。例子HTML代码中的:<P>100</P>只能解释成数字100,但是究竟是指100个人,100吨,100元呢,却不得而知了。但Internet上的电子商务的电子数据是有意义的,¥RMB100与$100在数值上是一样的,但在意义上却有天渊之别,企业间的数据共享及数据交换必须从意义上区分开这些数据。因此,在企业通过Internet频繁交往,数据交换需求不可压制的电子商务时代,由于HTML本身的缺陷,穷其所能也只是能实现“数字的交换”而非“数据的交换”。