写点什么

Under the Hood:NaN of JS

  • 2020-03-08
  • 本文字数:2823 字

    阅读完需:约 9 分钟

Under the Hood:NaN of JS

在查看本文之前,请先思考两个问题。


  1. typeof1/undefined 是多少

  2. [1,2,NaN].indexOf(NaN) 输出什么


如果你还不确定这两题的答案的话,请仔细阅读本文。


这两题的答案不会直接解释,请从文章中寻找答案。

一、NaN 的本质

我们知道 NaN(Not A Number) 会出现在 任何不符合实数领域内计算规则 的场景下。比如 Math.sqrt(-1)就是 NaN,而 1/0 就不是 NaN。前者属于复数的范畴,而后者属于实数的范围。


同时需要注意的是,NaN 只会出现在浮点类型中,而不会出现在 int 类型里(当然 JS 并没有这个概念)


什么意思?用你熟悉的任何支持 int 和 double 两种类型的语言(比如 C)。在保证它不会偷偷做隐式类型转换的情况下,分别用 int 和 double 打印出 sqrt(-1), 你就能发现只有在 double 的类型下才能看到 NaN 出现,而 int 呢?编译器甚至会给你一个 Warning


那么在浮点数下是如何表示一个 NaN 的呢?为了方便,下面用单精度 float 来表示,请看下图。



在 3b 情况中,NaN 得满足:从左到右,以 1 开始,不关心第 1 位的值,第 2 位到第 9 位都是 1,剩下的位不全 为 0。关于 浮点数内部的组成,这里不做具体的介绍,我们只需要了解到浮点数分为 3 个部分就可以:


  1. 符号位

  2. 指数位

  3. 精度位


其中 float 的指数位有 8 位,精度位有 32 - 1 - 8 = 23 位


double 的指数位有 11 位,精度位有 64 - 1 - 11 = 52 位


所以上面 NaN 的满足条件,可以看成:精度位不全为 0,指数位全 1 就可以了。


所以按上面的说法, 0x7f81111,0x7fcccccc 等等这些都符合 NaN 的要求了。我们可以尝试一下,自己写一个函数,用来往 8 个字节的内存的前两个字节写入全 1. 也就是连续 16 个 1,这就符合 NaN 的定义了。看下面这段代码:


double createNaN() { unsigned char *bits = calloc(sizeof(double), 1); // 大部分人的电脑是小端,所以要从 6 和 7 开始,而不是 0 和 1 // 不清楚概念的可以参考阮老师: // [](http://www.ruanyifeng.com/blog/2016/11/byte-order.html) bits[6] = 255; bits[7] = 255; unsigned char *start = bits;
double nan = *(double *)(bits); output(nan); free(bits); return nan;}
复制代码


其中 output 是一个封装,用来输出任意一个 double 的内部二进制表示。详细代码查看 gist。


最后我们得到了:



看来创造一个 NaN 不是很难,对吧?


同样的,为了证明上面的图的正确性,再看看 Infinity 的内部结构是否符合


两种 NaN

如果再细分的话,NaN 还可分为两种:


  1. Quiet NaN

  2. Signaling NaN


从性质上,可以认为第一种 NaN 属于“脾气比较好”,比较“文静”的一种,你甚至可以直接定义它,并使用它。


比如我们在 JS 中可以使用类似于 NaN+1,NaN+'123' 的操作,还不会报错。


而 Signaling NaN 就是一个“爆脾气”。如果你想直接操作它的话,会抛出一个异常(或者称为 Trap)。也就不允许 NaN + 1 这种操作了。像这种不好惹的 NaN,根据 WiKi 中的介绍,它可以被用来:


Filling uninitialized memory with signaling NaNs would produce the invalid operation exception if the data is used before it is initialized

Using an sNaN as a placeholder for a more complicated object , such as:

A representation of a number that has underflowedA representation of a number that has overflowedNumber in a higher precision format

A complex number

二、NaN != NaN

如果换个角度理解,因为 NaN 的表示方式实在太多,仅仅在 float 类型中,就有 2^(32-8) 中情况,所以 NaN 碰到一个和它二进制表示一模一样的概率实在太低了,所以我们可以认为 NaN 不等于 NaN 😏


嗯。看上去似乎问题不大,但是我们都知道计算机在大多数情况下,都是按规矩办事,这种玄学问题肯定不是内部的本质吧?要是真这样,世界上每一个程序员同时输出 NaN===NaN,总有一个人会得到 true,然后他就到 stackoverflow 上发了一个帖:你看 NaN 其实是会等于 NaN 的! 但我们从来没有见过这样的帖子,所以计算机内部肯定不是用这种颇为靠运气的方式在处理这个问题。


考虑换一种方式,假设计算机内部是通过 位运算 来判断的。如果某一个数的内部结构满足 第 2 位到第 9 位全 1,剩下的 22 位不为 0,那它就是 NaN。我们可以这样写


_Bool isnan(double whatever) { long long num = *(long long *)(&whatever); // 浮点数不能进行位运算,所以要改成整数类型,同时保留内部的二进制组成 long long fmask = 0xfffffffffffff; // 不要数了,13 个 f,52 个 1 long long emask = 0x7ff; // 11 个 1 num <<= 1; num >>= 1; // 清除符号位 return ((num & fmask) != 0) && (((num >> 53) & emask) == emask);}
复制代码


你可以试着把这段 C 代码运行一下,配合上面的 createNaN 可以试一下,他是真的可行的!


接着要实现 NaN != NaN 的特性,只需要在每次 == 的时候进行检测:只要有一个操作数是 NaN,那么就返回 false。

三、实际情况下的 NaN != NaN 的实现

那么实际情况到底是怎样的呢?不同的系统会有不同的实现。


在 Apple 实现的 C 库的头文件中,可以看到,nan 在 float 下,仅仅就是一个数,它等于 0x7fc00000,也就是 0b0111 1111 1100 0000 0000 0000 0000 0000,符合上面的 NaN 的定义。


#defineNAN __builtin_nanf("0x7fc00000")而它们的 isnan 的实现也相当简单


#define isnan(x)  \  (sizeof (x) == sizeof(float)  ? __inline_isnanf((float)(x)) \ : sizeof (x) == sizeof(double)  ? __inline_isnand((double)(x)) \ :  __inline_isnan ((long double)(x)))
static __inline__ int __inline_isnanf( float __x ) { return __x != __x;}static __inline__ int __inline_isnand( double __x ) { return __x != __x;}static __inline__ int __inline_isnan( long double __x ) { return __x != __x;}
复制代码


仅仅只是简单的判断自己是否等于自己 🌚。在 C 中具体如何实现 x!==x,有两种可能:


  1. 硬件支持 NaN 异常,所以永远都是 false

  2. 像下文中提到的 V8 的实现方式


而在 V8 中,分为两个阶段:/Compile Time and Runtime/。


在 Compile Time,编译器如果在代码中碰到了 NaN 常量,就会自动将替换成 NaN 对应的那个常量,比如上文提到的 0x7fc00000。因为编译器已经明确知道了谁是 NaN,所以在写出形如 NaN===NaN 这种代码的时候,就能直接得到 false。


而在 Runtime 阶段,不是用户直接定义的 NaN,比如下面代码:


const obj = { a: 1, b: 2 };let { c, d } = obj;c *= 100;d *= 100;console.log(c === d);
复制代码


这种情况下,我们虽然一眼可以看出最后的 c 和 d 都是 undefined,但是编译器刚开始不知道,所以它只能在最后判等的时候,才能得到结果。而具体判断的逻辑如下图所示:我们先检查,操作数是否有 NaN,如果有?那就返回 false 吧



所以 Number.isNaN 的 polyfill 可以怎么实现呢?


Number.isNaN = function(value) { return value !== value;}
复制代码


就是这么简单 😎

参考文献

  • 理解字节序 - 阮一峰的网络日志

  • NaN is not equal to NaN

  • Quiet NaN

  • 深入理解计算机系统(原书第 3 版) (豆瓣)


2020-03-08 19:24600

评论

发布
暂无评论
发现更多内容

Python 爬虫 JS 逆向 X-Bogus,signature 加密算法,AST 理论篇

梦想橡皮擦

Python 爬虫 7月月更

国产统信UOS系统运行小程序的探索

Geek_99967b

小程序

void 0 有什么意义?undefined竟然是可变的?

南极一块修炼千年的大冰块

7月月更

饿了么为啥给你推荐这个?本地生活搜索算法解密

阿里技术

算法 性能提升

还在用Unity开发游戏?那你就out了,试试用Unity做一个答题系统吧

恬静的小魔龙

Unity

想要制作沙盒游戏?那么这一款插件你一定不能错过(Unity3D)

恬静的小魔龙

Unity

数字藏品系统开发——商城盲盒h5平台搭建

开源直播系统源码

数字藏品 数字藏品系统软件开发 NFT数字藏品系统 数字藏品源码出售 数字藏品交易平台开发

还在被电影中吧爆炸的画面震撼?那你一定不要错过这款Unity的爆炸插件

恬静的小魔龙

Unity

Kyligence 出席华为全球智慧金融峰会,加速拓展全球市场

Kyligence

数据湖 数据分析 OLAP

膜拜~ 终于拿到了美团老大哥分享的 Netty 源码剖析与应用 PDF

程序知音

Java 程序员 架构 Netty 后端技术

同构+跨端,懂得小程序+kbone+小程序容器就够了!

Geek_99967b

小程序容器

融云超级群的「新能力」

融云 RongCloud

ios Android;

这次和GrowingIO工程师一起搞事情 | StartDT Hackathon

奇点云

IP地址分类及范围

郑州埃文科技

IP地址 IP地址分类 IP地址范围

浅谈负载

Damon

7月月更

K8S多集群管理很难?试试Karmada | K8S Internals系列第3期

BoCloud博云

容器 容器云 K8s 多集群管理

数字化转型失败的罪魁祸首是什么?

雨果

数字化转型 DaaS数据即服务

hive数据导入:Python脚本

怀瑾握瑜的嘉与嘉

Python hive 7月月更

用Unity做仿真,这款图表插件我不允许你不知道

恬静的小魔龙

Unity

运行时,物体移动旋转缩放插件,“RuntimeTransformGizmos插件”使用教程(Unity3D)

恬静的小魔龙

游戏开发 Unity 插件 虚拟仿真 游戏引擎

2022长三角工业自动化展会将于10月在南京国际展览中心召开

AIOTE智博会

工业自动化展会 工业机器人展会 江苏工博会

终于有人把操作系统、网络系统、线程进程、IO模型全部总结出来了

程序知音

Java 后端 操作系统 网络 TCP/IP

深入理解完美哈希

C++后台开发

hash 后端开发 C++后台开发 哈希函数 C++开发

EMQ映云科技荣登《中国企业家》2022年度“新锐100”榜单

EMQ映云科技

开源 物联网 IoT emq 7月月更

2022年中国第三方支付市场专题分析

易观分析

第三方支付

带你认识8个软件设计中的谬误

华为云开发者联盟

后端 分层架构 开发

2022亚洲国际物联网展会

AIOTE智博会

物联网展览会

Idea 连接 MySQL 数据库

攻城狮杰森

MySQL IDEA database 7月月更

移动研发平台EMAS 3.0全新升级,欢迎登陆阿里云官网搜索EMAS进行体验

移动研发平台EMAS

阿里云 emas 移动测试 移动研发 产品架构

同城订单同城送,爆单依旧得心应手!

CRMEB

Spirng之Annotation注解与AOP使用

echoes

Under the Hood:NaN of JS_文化 & 方法_杨魁_InfoQ精选文章