Java 9 的日期时间格式化趋近 Unicode 区域设置标准

  • Abraham Marín Pérez
  • Rays

2017 年 2 月 19 日

话题:Java语言 & 开发架构

一系列在解析和格式化上的改进已集成到 Java 9 中,这些改进让相关功能更趋近于Unicode 区域设置数据标记语言(LDML,Locale Data Markup Language)。上述改进由 Stephen Colebourne 负责,他是被广为采用的日期时间库 JodaTime 的创建者,还先导了 Java 8 中新 java.time 组件。遵循 Unicode 标准将为 Java 9 提供与其他非 Java 系统间更好的互操作性。

LDML 是Unicode 通用区域设置数据资源库 (CLDR,Common Locale Data Repository)所使用的语言。作为 Unicode 联盟的项目之一,CLDR 用于从世界各地收集并存储区域设置数据,这样应用开发人员可使程序更好地适应不同的文化。特别需要说明的是,LDML 可解决日期、时间和时区上的问题,尤其是日期的格式化与解析。下面列出一些从 Java 9 中抽出的新特性,这些新进入 Java 9 的特性使得 java.time 更趋近 LDML 规范。

  • JDK-8148947,DataTimeFormatter 的模式字母“g”:正如在 LDML 中定义的,字母“g”指代一个“简化儒略日期”,简化儒略日期与正常儒略日期的差别在于:(1)简化儒略日期取决于本地时间,而非 GMT;(2)简化儒略日期中将午夜作为天的划分,而不是中午。

  • JDK-8155823,添加了日期时间模式“v”和“vvvv”:LDML 格式“v”用于表示“通用非位置格式”(Generic Non-Location Format),例如“太平洋时间”。而 LDML 格式“vvvv”表示由特定城市所定义的“通用位置格式”(Generic Location Format),例如“洛杉矶时间”。

  • JDK-8148949,DataTimeFormatter 的模式字母“A”、“n”、“N”:虽然不同于“n”和“N”,“A”是在 LDML 中定义的,但是当前 Java 的行为并未遵循 LDML 规范。规范中使用“A”表示一天中已过去的时间,以毫秒为单位,表示值的宽度可变。但是当前 Java 实现为固定宽度,即模式“AA”将不能解析任何大于 99 毫秒的值。“n”和“N”是 Java 对规范的一个扩展,分别表示一秒中已过去的纳秒值,以及一天中已过去的纳秒值。

  • JDK-8079628,包含“DD”格式的 java.time.format.DateTimeFormatter 对象在处理三位的积日值(Day-of-Year)时发生失败:类似于上面的固定宽度问题,只是用‘D’表示一位积日值。模式“DD”无法将“123”解析成一年中的第 123 天。

如上所述,Java 9 更好地看齐 LDML 将会简化整个系统中的互操作性,这是由于不少技术已在不同程度上采用了 LDML。稍提一些,Microsoft .Net 使用 LDML 进行常规的区域设置数据互换,Node.js 和 Ruby 也具有可用的软件包。

查看英文原文: Date and Time Formatting in Java 9 Will Get Closer to Unicode Locale Standards


感谢薛命灯对本文的审校。

给 InfoQ 中文站投稿或者参与内容翻译工作,请邮件至editors@cn.infoq.com。也欢迎大家通过新浪微博(@InfoQ@丁晓昀),微信(微信号:InfoQChina)关注我们。

Java语言 & 开发架构