中文软体
重定向;重新导向;字符;字元;文件; 档案;快捷方式; 捷径;项目;专案;计划;计划;计划;计算机; 电脑; 电脑;
中文软体指的是专门为了中文资讯处理使用所设计的软体。包含但不局限于中文系统(外挂)、中文输入法、中文字形、中文自然语言处理、中文编程语言,如周蟒(ZhPy)等。
中文系统与中文软体.
中文系统一般为外挂形态,如DOS时代的使用倚天中文系统,或是采用特殊版本的软体,如必须使用中文Win2000。此外更麻烦的是,输入时必须采用特殊的输入法,因此中文系统在运作上必须考虑汉字特性、汉字语码、汉字输入、汉字输出等。
汉字特性.
除了某些系统(如王安系统)外,目前大部份的系统汉字占用2Byte,是英数字的两倍。另外配合汉字显示,英数字可分成全形半形、全形之英数字(包含空白)是以特殊符号方式处理,与半形之英数字与法通用,半形的英数字可以被系统直接快速处理。
汉字语码.
外码(External Code).
亦即输入法之按键次序,输入法不同,按键次序(即外码)随而不同。
内码(Internal Code).
因为电脑厂牌不同,电脑内汉字码可能不同,此即内码。
交换码(Exchange Code).
目前最普遍的交换码即国际码(Unicode)。
汉字输出.
包括字型(font)与字形以及字体。「字形」(glyph)指单个字(字母、汉字、符号等)的形体。
所谓「字体」(typeface)与「字型」(font),都是排印学与书法领域的专有名词。无论港澳台、中国大陆还是欧美等国非专业普通人士都无法区分作为专业名词的「字体」(typeface)与「字型」(font)。
点阵字型(Dot-matrix Fonts).
点阵(dot-matrix)或称位图(Bitmap),意即像素阵列(pixel array)。缺点是缩放时会有锯齿边,因此后来进化成向量字。
向量字型(Vector Fonts).
包括向量字/矢量字体(Vector Fonts/Outline Fonts)、向量图/矢量图形(Vector Graphics)。由于每个字型都透过数学向量式(线性代数)来描述,因此可以自由缩放比例。缺点是需要较多的计算时间,同时字型放大过量也会产生棱角而影响美观。
曲线描边字型(Stroke Fonts/TTF/serif白体字).
又名衬线字。如罗马体字、宋体字。由于使用曲线公式(非线性式)来描绘字框,因此任何缩放比例都一样平滑,与向量字在数学式的主要区别在于曲率(数学符号为Kappa:κ),曲率κ=0即直线,曲率κ≠0即曲线。缺点是计算耗时更久。
无描边字型(sans-serif黑体字).
又名无衬线字,如歌德体字。
中文软体发展历程.
国际汉字主流内码.
Big5大五码(台港澳专用).
)是由台湾财团法人资讯工业策进会为五大中文套装软体所设计的中文共通内码,在1983年12月完成公告,隔年3月,资讯工业策进会与台湾13家厂商签定「16位元个人电脑套装软体合作开发(BIG-5)计划(五大中文套装软体)」,因为此中文内码是为台湾自行制作开发之「五大中文套装软体」所设计的,所以就称为Big5中文内码。五大中文套装软体虽然并没有如预期的取代国外的套装软体,但随著采用Big5码的国乔中文系统及倚天中文系统先后在台湾市场获得成功,使得Big5码深远地影响正体中文电脑内码,直至今日。「五大码」的英文名称「--
」后来被人按英文字序译回中文,以致现在有「五大码」和「大五码」两个中文名称。
GB 18030国标码(中国大陆专用).
GB 18030主要有以下特点:
本规格的初版是由中华人民共和国信息产业部电子工业标准化研究所起草,由国家质量技术监督局于2000年3月17日发布。现行版本为国家质量监督检验总局和中国国家标准化管理委员会于2005年11月8日发布,2006年5月1日实施。
此标准内的单字节编码部分、双字节编码部分,和四字节编码部分收录的中日韩统一表意文字扩展A区汉字,为强制性标准。其他部分则属于规模性标准。在中华人民共和国境内所有软件产品,都需要支持这个同时包含单字节、双字节和四字节编码的规格。
微软视窗代码页为 54936。
Unihan(汉字国际码/汉字总码).
)、韩国汉字(--
)、越南的喃字(#重定向 /--
)与儒字(#重定向 /--
)、方块壮字。
)。后来,此计划加入了越南文的喃字,所以合称中日韩越(CJKV)统一表意文字。
Windows上的中文软体.
中文系统.
在Windows使用中文主要有三种方式:
X视窗的中文软体.
现代的--
视窗系统,中文支援主要是依頼
内建的多语文支援,
或--
的多语文输出功能(即--
的--
机制、或--
或--
等--
的多语文显示的支援等等),和
或--
的多语文输入功能(即--
的--
机制、或--
的软体的--
输入模组机制等等)。
个别软体可能会支援或需要其他特别或较为少用的中文输入机制。
使用者在选择处理中文输入的软件比软有自由度。在类--
的自由作业系统,目前比较普遍的输入软件包括苏哲的--
早期的中文软体.
早期的--
视窗系统并无有系统的中文支援,中文软体只能透过中文化的终端机模拟器,在文字介面运作,而中文输入也须透过终端机模拟器的中文输入功能。情况类似--
的中文系统。
最早的--
视窗中文软体是修改自--
的--
)终端机模拟器。
开始普遍后,--
不久就被改自--
的--
取代,而导致--
被取代的其中一个因素,是--
因并非自由软体,在授权上出现了问题。中文输入法和终端机模拟器分开,也是由--
开始。--
和--
后来合并,合并后的版本改称--
视窗系统开始有普遍性的中文支援是在各种--
的--
采取普遍性的多语文支援时开始;普遍性的多语文支援令中文输入可以透过标准的--
机制,而毋须采取类似--
的外挂中文系统一类的方法。
生成维基百科快照图片,大概需要3-30秒!