XML加ASP实现网页“本地化”

想让你的站点能被来自多个国家的冲浪者看明白吗?无疑,这就需要提供多个语言版本的页面内容,也就是所谓的

“本地化”功能。最容易想到的方法就是分别编写多种语言的页面内容,然后放置到不同的目录下,再在首页上添加导航

到各自语言位置的链接。很明显,这样的处理方式将浪费许多包含公共元素以及设计框架的空间,而且修改、维护也很烦

琐。有什么好方法吗?当然,本文就介绍如何结合使用XML与ASP技术实现这个目的。 

本文将讨论如下几个方面的内容:创建包含语言资源的XML文档、使用ASP创建Web页面模板、使用XPath语法和MSXML3

分析器定位XML文档中的目标内容以及动态地在HTML流中插入语言字符串。 

准备条件 

本文讨论的技术涉及到以下方面:IIS4 或者 PWS(包含ASP功能),MSXML 版本 3。 

功能展示 

本文要讨论的例程是一个简单的HTML表单,用以提交名字和地址信息。下面是在Netscape Navigator中显示西班牙语

言的图示:

采用本文论述的技术,你就可以非常简单地通过更新一个XML文件实现为站点添加多种语言的功能。 

创建包含语言资源的XML文档 

首先,使用喜爱的页面编辑器创建一个叫做xmltrans.asp的Web页面文件。我发现使用静态占位符文字(比如”First 

name “)设计页面最容易。当XML准备好后,就可以使用变量替换这些静态文字。要下载例程文件请点击这里。 

完成基本页面的功能设计后,开始创建一个包含语言字符串的良好格式XML文档。在这里,我使用纯文本编辑器

Notepad编写初始的XML语言集-英语版本。Notepad使我感觉更接近于源代码。XML文件命名为xmltrans.xml。下面列出了

包含English、French和Spanish字符串的XML文件代码内容: 

 

 

 

 

 
Localize ASP with XML 

 

First name
 

 

Last name
 

 

Prefix
 

 

Suffix
 

 

Address
 

 

Address 2
 

 

Address 3
 

 

City
 

 

State/Province
 

 

Postal code
 

 

Area code
 

 

Telephone number
 

 

OK
 

 

en
 

 

Windows-1252
 

 

English
 

 
 

 

 

 
Localize ASP with XML – French 

 

Prénom
 

 

Nom
 

 

Préfixe (M., Mme, Mlle)
 

 

Suffixe/Titre
 

 

Rue
 

 
 

 
 

 

Ville
 

 

Région/Province
 

 

Code postal
 

 

Indicatif régional
 

 

Numéro de téléphone
 

 

OK
 

 

fr
 

 

Windows-1252
 

 

French
 

 
 

 

 

 
Localize ASP with XML – Spanish 

 

Nombre
 

 

Apellido paterno
 

 

Prefijo (Sr., Sra., Srta.)
 

 

Sufijo o título
 

 

Línea 1 de dirección
 

 
 

 
 

 

Ciudad
 

 

Región, estado o provincia
 

 

Código postal
 

 

Código de área
 

 

Número de teléfono 
 

 

OK
 

 

sp
 

 

iso-8859-1
 

 

Spanish
 

 
 

 

xmltrans.xml文件的第一行是XML声明。其中的version属性告诉读者文档符合XML 1.0的标准,encoding属性指示解析

器使用压缩版本的Unicode: 

 

一个XML文档需要一个包含其他元素的根元素。因为这里的例程是包含一些语言,所以就命名根元素为languages: 

 

作为集合类型,languages元素包含了一个或多个language元素: 

 

以上language标记包含4个属性。xml:lang属性是其中最重要的,在ASP程序中将通过这个属性值的2字母语言代码搜索

字符串组。其他的属性,比如charset,可以为将来的功能扩充而用。 

每种语言节点中,我都添加了一个元素作为变量,其中含有显示在HTML页面上的文字。XML允许使用有含义的名字作为

自定义标记,比如,我使用
元素包含HTML页面的标题。同样,<firstname>元素包含字符串”First name”。  <br><title>Localize ASP with XML 

First name
 

最后,良好格式的XML文档包含了一整套对应于HTML页面的字符串。下图显示了XML文件中的标记和English语言字符

串。注意,现在这里只讨论English版本,以后可以添加更多种语言。 

ASP文件代码分析 

现在回来看看ASP文件xmltrans.asp。在其中我们使用XML路径语言(XPath),它可以在微软的XML解析器(MSXML)中

执行。你可以认为XPath是抵达XML文档一部分内容预定位置的工具,这有些类似于在命令行中输入一个路径以执行文件,

比如c:\winnt\notepad.exe,或者在浏览器中敲入了一个URL访问页面。下面研究这个ASP文件看看如何取回English语言字

符串。首先,我们实例化一个叫做MSXML2.DOMDocument的XML解析器工作对象: 

set doc=server._ 

CreateObject _ 

(“MSXML2.DOMDocument”) 

由于ASP程序不能象Win32程序一样处理事件,所以在这里我们关闭了异步操作选项。这样就确保了在转向其他任务

前,脚本程序会一直等待当前事件的完成: 

doc.async = False 

接着使用DOMDocument对象的Load方法装载包含字符串的XML文档。如果转载过程中发生了错误,就发出警告信息并停

止运行: 

if not doc.Load(server._ 

mappath(“xmltrans.xml”)) then 

 msg=”Failed to load ” 

 msg=msg & “the XML file” 

 Response.Write msg 

 Response.End 

end if 

我们可以使用两种方法查询XML文档:XSL和XPath。在这里让解析器使用后者,传递属性名字和正确数值给

setProperty方法: 

doc.setProperty _ 

 “SelectionLanguage”, “XPath” 

然后,创建选择XML文档部分内容的路径。很明显,相关字符串位于languages元素的某个位置内,因此languages成为

路径的最开始部分。同时我们知道字符串是被包含在一个language元素内的,但是是哪一个呢?请别忘记在前面的XML文档

中,我们嵌入了一个叫做xml:lang的属性,并给出了一个唯一数值“en”。这就是我们要选择的,下面是操作它的语法: 

sel=”/languages/language” 

sel=sel & “[@xml:lang=’en’]” 

这有些不好理解,但你可以将这段XPath代码想像为一个SQL语句,类似于取回一个记录集的命令: 

SELECT * FROM languages.language WHERE xml:lang=’en’ 

回到现实的XPath查询,要使用下面的代码返回包含第一个匹配节点的节点对象: 

set selectednode = _ 

 doc.selectSingleNode(sel) 

最后一步是传递元素名字(“title”)给selectSingleNode方法,并要求它取回”title”节点的text属性值。就是说,取

得包含在
的文字。在这里,取回的文字是”Localize ASP with XML”: 

txt=selectednode._ 

selectSingleNode(“title”).text 

与SQL命令对照,就象从ADO记录集内部取回一个字段值,语句是: 

txt=rs(“title”) 

在ASP页面中插入语言字符串 

知道了如何从XML元素中选取文字并赋值给变量,就可以将变量值插入到HTML流中了。为了使代码简洁,创建一个叫做

getstring()的函数,如下: 

function getstring(instring) 

temp=selectednode._ 

selectSingleNode _ 

(instring).text 

getstring= _ 

server.htmlencode(temp) 

end function 

getstring()函数的输入值是元素名,元素值要从XML文档中取回。比如,将”firstname”传递给getstring(),

getstring函数就选择firstname元素并返回它的文本数值。为保险起见,在返回给调用者前,我们使用ASP的

server.htmlencode方法转换文本为合法的HTML代码。在ASP页面中,调用代码类似如下: 

 



 

如果选择了XML文档的English部分,HTML输出结果如下: 

First name:v/td> 

如果选择了French,HTML输出结果如下: 

Prénom: 

下图显示了French语言版本的表单: 

选择可用语言 

XML的一大优势就是它是以清晰的文本格式保存,我们能够在任何时候更新Web服务器上的XML文件。而且,我们还可以

将English版本的xmltrans.xml文件在XML编辑器XML NotHPad中打开,复制一份,然后将其中文字翻译为一种新语言。下图

显示了XML Notepad中的例程文件: 

上图中,在左边可以执行添加、删除以及选择元素和属性的操作,在右边可以编辑相关内容。当站点需要多种语言版

本时,只需要在内容中执行粘贴操作,然后上载最新的XML文档就可以了。 

为了使添加的语言立即生效,要增加一个程序,用它判断文件中不同语言的种类数量,并返回语言代码和语言名称。

如下面的代码段所示,我们可以将数据格式化处理以创建一个HTML列表框。当用户提交表单时,2字母表示的语言种类代码

被存储到ASP会话变量choselang中。 

  for i=0 to selectednodes.length – 1   response.write ” chr(34) & _   selectednodes.item(i)._  selectSingleNode(“lang”).text & chr(34)   if (selectednodes.item(i)._  selectSingleNode(“lang”).text = _  session(“chosenlang”)) then   response.write ” selected>”   else   response.write “>”   end if   response.write selectednodes.item(i)._  selectSingleNode(“langname”).text & _  “” & vbcrlf  next  %> 

添加提示信息以及字符集数据 

上面使用XML提供了HTML表单的可变语言文字显示,接着还要考虑一些更丰富的用途。比如说,要在选择语言时添加一

个提示信息,只需要在文字前后嵌入HTML标记

x-sjis
 
然后,就可以使用ASP将字符集类型插入到HTML流中: 
” /> 
最后的HTML代码包括了Japanese字符集参考: 
 
下图显示了使用Japanese字符集的页面。记住,要看到正确的内容,操作系统以及浏览器必须支持Unicode并安装了相
应字符。否则,就会看到一些奇怪的文字,可能是一些问号,也可能是一些方块符号等等。 

总结 
本文讲述了如何使用XML文件保存Web页面的语言字符串。从中我们学会了使用ASP脚本程序并借助微软XML解析器和W3C
的XPath语言实现查询XML文档的功能。ASP代码将包含字符集类型的可变文字插入到HTML流中,并形成列表框以让用户选择
可用语言。本文涵盖了许多内容,但我想这只是一个起点。虽然可以在支持XML的浏览器中简单地实现这些功能,但我们已
经看到:使用服务器端脚本可以转换XML数据为普通的HTML内容,即使是早期版本的浏览器,同样能够看到这些精彩内
容。