井晶灵 发表于 2025-6-1 18:20:12

java 开源中文的繁简体转换 opencc4j-02-一个汉字竟然对应两个 char?

Opencc4j

Opencc4j 支持中文繁简体转换,考虑到词组级别。
开源中文的繁简体转换 opencc4j-01-使用入门概览
开源中文的繁简体转换 opencc4j-02-一个汉字竟然对应两个 char?
开源中文的繁简体转换 opencc4j-03-简体还是繁体,你说了算!
开源中文的繁简体转换 opencc4j-04-香港繁简体的支持
开源中文的繁简体转换 opencc4j-05-日文转换支持
Features 特点


[*]严格区分「一简对多繁」和「一简对多异」。
[*]完全兼容异体字,可以实现动态替换。
[*]严格审校一简对多繁词条,原则为「能分则不合」。
[*]词库和函数库完全分离,可以自由修改、导入、扩展。
[*]兼容 Windows、Linux、Mac 平台。
[*]支持自定义分词
[*]支持判断单个字(词)是否为简体/繁体
[*]支持返回字符串中简体/繁体的列表信息
[*]支持中国台湾、香港地区繁简体转换
[*]支持与日文字的转换
从一个 bug 说起

很久很久以前,收到了一个用户的 issue 部分生僻字转小写之后会得到一个乱码(不可见字符)
内容如下:
例如“嘪球”在转换之后得到“
来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!

狞嗅 发表于 2026-1-22 06:13:24

分享、互助 让互联网精神温暖你我

博咱 发表于 2026-1-24 10:25:02

谢谢楼主提供!

靛尊 发表于 2026-1-24 11:47:51

热心回复!

殳世英 发表于 2026-1-26 15:32:16

分享、互助 让互联网精神温暖你我

伯绮梦 发表于 2026-1-28 09:06:02

感谢分享,下载保存了,貌似很强大

苗嘉惠 发表于 2026-2-1 04:25:04

东西不错很实用谢谢分享

澹台吉星 发表于 2026-2-2 03:37:37

用心讨论,共获提升!

冷晓晴 发表于 2026-2-4 07:27:37

懂技术并乐意极积无私分享的人越来越少。珍惜

慢秤 发表于 2026-2-6 08:23:08

感谢发布原创作品,程序园因你更精彩

俞秋荣 发表于 2026-2-8 01:23:21

新版吗?好像是停更了吧。

邹弘丽 发表于 2026-2-8 13:02:36

东西不错很实用谢谢分享

呼延冰枫 发表于 2026-2-8 17:34:46

感谢发布原创作品,程序园因你更精彩

晦险忿 发表于 2026-2-10 06:35:56

热心回复!

稿辏付 发表于 2026-2-10 07:31:51

谢谢分享,辛苦了

恿榫 发表于 2026-2-11 08:40:16

喜欢鼓捣这些软件,现在用得少,谢谢分享!

秤陷曲 发表于 2026-2-26 11:32:13

很好很强大我过来先占个楼 待编辑

骆贵 发表于 2026-2-28 05:05:37

这个有用。

钦遭聘 发表于 2026-3-3 01:57:09

分享、互助 让互联网精神温暖你我

汲佩杉 发表于 3 天前

这个好,看起来很实用
页: [1]
查看完整版本: java 开源中文的繁简体转换 opencc4j-02-一个汉字竟然对应两个 char?