cconv (pronunciation: see-conv) is an iconv-based Simplified-Traditional Chinese
conversion tool. It is NOT only a transcoding program, but also a TRANSLATE tool
between Simplified Chinese and Traditional Chinese.
We stand on the shoulders of giants. cconv source code is based on iconv, an
excellent program which converts text from one encoding to another.
Features:
- iconv-like usage.
- language-level Simplified-Traditional Chinese conversion.
- idioms can be translated.
这个模块试图以有效的,灵活的方式,而不需要借助于外部工具和模块来解决发生在繁体
中文和简体中文转换中的常见问题,。
安装完成该模块后,你将有两个额外的编码格式:big5-simp 是 Big5 到 Unicode
的简体中文映射(反之亦然),gbk-trad 是 CP936 (一般成为 GBK)到 Unicode
的繁体中文映射。
该模块默认情况下通过多种 xxx_to_yyy 函数输出变量,xxx 和 yyy 是 big5、
gb(例如 GBK/CP936)、simp(简体中文 unicode)、或者 trad (繁体中文
unicode)中的一个。
繁体中文(BIG-5 编码)zh_TW.Big5 自动本地化。
安装这个 port 后你将得到一个繁体中文的 FreeBSD 系统。
中文(Big5) <-> 英文 dictd 词库。
pydict 库有 177751 词目。
moecomp 库有 67263 词目。
netterm 库有 6477 词目。
cedict 库有 26348 词目。
Author: Pofeng Lee <pofeng@linux.org.tw>
FreeWnn 是一个日文、中文、韩文输入法。
这个 port 仅含有一个中文输入法的类库。这个类库包含了客户端所需要的一个归档文件
(libcwnn.a),头文件和其它一些文件。
注意,如果你使用 Wnn 的客户端,则必须设置环境变量 CSERVER 或 TSERVER。
-- S. Taoka
<taoka@FreeBSD.org>
这个模块从中文文本中提取关键词,这需要 Lingua::ZH::TaBE 支持。
kcfonts 是 X 窗口下的中文 Ming 繁体字体套件。
kcfonts 的字体有 Kau Chauo 信息有限公司贡献给所有的 TANet 用户运行于其个人 PC。
感谢 Chin-Hao Tsai <c-tsai@uiuc.edu>,他转换它为 ETen 的字体风格。现在你可以
使用 kcfonts 和 crxvt 来查看大五码的中文。
-- PA <PA@FreeBSD.ee.ntu.edu.tw>
This module implements China-based Chinese charset encodings.
这是简体中文分词的 perl 版本。
该分词算法在词典中搜索(向左和向右双向搜索)最长的词语,并选择一个频率较高的。
这个程序源于 CPAN 模块 Lingua::ZH::WordSegment (http://search.cpan.org/~chenyr/)
我作了如下修改:1)使得接口面向对象化;2)使内部字符串使用 utf8 编码;
3)使用 sogou 字典(http://www.sogou.com/labs/dl/w.html)作为默认字典。
TaBE 意为 `台湾和大五码编码(Taiwan and Big5 Encoding)'。
libtabe 为处理中文字词、短语、句子以及注音符号提供了统一的界面和类库。
它是打算成为中文文字处理的基础。