服务热线:400-800-4428 天络 •深圳0755-88290207 天络 •广州020-85533446 天络 •上海133 4283 2937
网站繁体解决方案
网站繁体解决方案

网站繁简转换解决方案


  《信使网络繁简通》可以非常方便地帮助您的中文网站实现简繁体双版本发布。如果您的中文网站本来只有一个简体的版本或只有一个繁体的版本,使用《信使网络繁简通》服务,您就能够同时拥有简体和繁体两个版本。

  《信使网络繁简通》不仅可以实现静态网页的简繁转换,而且可以实现网站动态内容的实时转换。BBS、WebMail、搜索引擎、基于web的聊天系统以及各种各样的后台数据库应用,都可以通过信使网络繁简通实现简繁转换。这意味着无论一个中文网站的内容有多丰富,如果它本来只有一个简体或繁体版本,信使网络繁简通都可以把它的潜在客户群延伸到全球的华人领域。 《信使网络繁简通》是目前中文网站简繁互换的第一品牌,已经被中央各大权威网站和各行业中有代表性的大网站所采纳。使用《信使网络繁简通》服务可以使您100%地免去制作和维护网站繁体版的人力。

需求

  如今已经有超过200万台湾人踏足大陆的土地。他们中的大部分都迫于台湾经济不景气的压力,来到中国大陆这一片充满生机的土地,盼望着一个复苏的机遇。每天有上万人次的香港人来往于中国大陆与香港之间。一个个的商业机会就在这个庞大的人群中不断地涌现,又瞬间消逝。

  短短的10年中,台资与港资的制造业已经悄然在中国大陆制造出鞋业、电子等行业的世界最大生产基地。而您再看看后面,数十万家台资企业在排着队等候着到中国大陆落脚的通行证。这突如其来的变化,伴随着中国踏入世贸组织大门的脚步声,震撼了中国每个互联网业者的心。以至不少人感叹道:“以后,网站如果没有繁体版,就相当于放弃掉另外一半的商业机会。”

  这话并不夸张。来自海外的这个人群,使用着与中国大陆同样的语言,但他们却依然使用着古老的汉字字型——繁体字。只要您进入一个台资的企业,您就会发现老板们要求来自中国大陆的员工学习使用台湾的中文输入法,提交的报表需要用繁体列印。此刻,您面对这群人,总上网人数达到1300万相当于中国大陆现有网民数量的1/2的这群人,人均消费力大约是中国普通城市居民消费能力的4倍的这群人,他们的足迹同样涉足政治、金融股票、旅游、百货消费、文化教育、人才交流、商业经济等等范畴的这群人,是否值得“照顾”他们的习惯去做一个繁体版呢?

繁简文字的差异

  中国大陆采用的是gb2312内码的中文字,台湾、香港及部分海外华人地区采用的是繁体中文big5码的汉字。

  简体字和繁体字的写法是有很大的差异。据信使网络繁简通开发前的市场调查,中国大陆对繁体字的辨认能力会比台湾人或香港人对简体字的辨认能力强一点。这得益于中国大陆20年的对外开放,部分沿海地区的大陆人对繁体字已经没有障碍。但是,对于大多数大陆人来说,阅读繁体字依然存在障碍,特别是一些常用的香港字,根本读不出来,更不用说意思了。

  而台湾人读简体字的障碍会更大一点。长期在港台聊天系统中浸泡的人就会知道,大部分台湾人或香港人对异型简体字几乎不认识,除了部分是完全同型的之外,其他字结合上下文连蒙带猜也只能读对50%左右。这种情况是大陆网站所料不及的。因此,绝大多数的大陆网站实际上完全放弃了海外繁体用户,却连自己都不知道。

繁简转换的难点

  繁简互转,如果需要做到100%精确,实际上是一个非常复杂的工作。根据转换的精确性等级,大概可以分成4个等级:

1.字符码表一对一映射。
2.对于一对多单字,根据词语识别进行转换。
3.对词语表达方式差异的转换。
4.根据上下文的词汇翻译。

转换等级一 内码映射

其转换机制是按照内码字符映射表,在简繁转换时,用big5的内码把GB的内码替换掉,在繁简转换的时候就反过来。例如,GB 2312-80 0xB9FA 代表简体字国, 简繁转换的时候就把它替换成0xB0EA 对应繁体BIG5码的國字。根据我们实践证明,如果按照字符的转错几率来统计,对一般性质的文本,该处理方式可以达到98%的准确率。但其弱点是由于简繁字体并非一对一的关系,因此忽略掉一些其他较不常用的字。

以下是一个一对一字符内码映射表的例子:

 简体源  内码GB (EUC)  繁体目标  BIG5  其他可能性
 出  B3F6  出  A558
 发  B7A2  B56F
 干  B8C9  A47A  乾 干 榦
 暗  B0B5   暗  B774
 里  C0EF  B8CC  里 裏
 征  D5F7  徵  BC78  征
 门  C3C5  AAF9  
 汤  CCC0  B4F6  

转换等级二 一对多关系的字根据词语识别转换

       对于一个单字应该翻译成在当前有可能的异种内码中的哪一个,我们可以根据该字所在的词汇来决定。比如,下表:

简体词语 繁体词语 拼音 英文意义
头发 頭髮 tou2fa0 hair
特征 特徵 te4zheng1 characteristic
出发 出發 chu1fa1 start off
干燥 乾燥 gan1zao4 dry
暗里 暗裡 an4li3 secretly
千里 千里 qian1li3 long distance
秋千 鞦韆 qiu1qian1 a swing

     在上表中,头发与出发的“发”字在简体中是同一字型的,但繁体中却不一样。这样就可以根据“发”字所在的词汇来对该字进行准确的转换。如果是头发就翻译成“頭髮”,如果是出发就翻译成“出發”。

转换等级三 繁简词汇表达方式不同之转换

     有一些词,在繁体与简体用户有不同的表达方式,下表显示了一些词汇表达方式差异的例子:

英文 简体表达方式 汉语拼音 繁体表达方式 汉语拼音
bit wei4 位元 wei4yuan2
byte 字节 zi4jie2 位元組 wei4yuan2zu3
CD-ROM 光盘 guang1pan2 光碟 guang1die2
computer 计算机 ji4suan4ji1 電腦 dian4nao3
database 数据库 shu4ju4ku4 資料庫 zi1liao4ku4
file 文件 wen2jian4 檔案 dang4’an4
information 信息 xin1xi4 資訊 zi1xun4
Internet 因特网 yin1te4wang3 網際網路 wang3ji4-wang3lu4
software 软件 ruan3jian4 軟體 ruan3ti3
week 星期 xing1qi1 禮拜 li3bai4

能够实现以上表达方式转换,就是在本文中所提到的第三级转换功能。

转换等级四 根据上下文对词汇翻译

有一些词,是需要根据上下文才能够准确地决定如何翻译的。比如在中国大陆的语言习惯中,“文件”可以是通常意义上的“文件”,也可以表达计算机磁盘中存取的“文件”(document)。但是,在繁体用户的语言习惯中,这两个东西就是分别用两个词来表达,通常意义上的“文件”和在电脑磁盘中保存的“档案”。
    该层次的翻译需要根据上下文的意思对文章进行断句,分析。因此,是属于繁简互译中最难做的,而且消耗的系统资源也最大。 


成功案例
 

中华人民共和国外交部 http://www.fmprc.gov.cn/
国务院发展研究中心信息网  http://www.drcnet.com/
国务院台湾事务办公室 http://www.gwytb.gov.cn/
中国国家旅游局 http://www.cnta.gov.cn/
深圳政府在线 http://www.sz.gov.cn
国泰君安证券 http://www.gtja.com
国信证券 http://www.guosen.com

更多

Copyright©1997-2016 chinasky.net All Rights Reserved 版权所有备案号:粤ICP备05116658号