python2 str 对象的不确定性
'abcd'
如果你是 python3 用户,你会说这是一个包含了”a”, “b”, “c”, 和 “d” 的字符串。
如果你是 python2 用户,你可能会说这是一个包含了”a”, “b”, “c”, 和 “d” 的字符串,也可能会说这是表示 97, 98, 99, 和 100 的 bytes。
这意味着你得足够细心,明确自己的 str 对象到底是文本还是 bytes ,不然就可能会在你的代码里面埋下 bug。
没错,只要你是一个足够细心,真正 “合格” 的程序员,这些问题都有解决方案。但是!这样的假设是不切实际的,程序员是人,是人
就意味着一定会犯错!
推荐学习《python教程》
哲学层面的考量
设计任何一个面向所有人的系统,原子层面的设计都要及其小心细致。
数据类型是一门编程语言最最最基础的构成,从哲学层面来讲,构建一座大厦的原子出现这种不确定性是让人无法接受的!
Python之蝉 里面有一句话:
There should be one— and preferably only one —obvious way to do it.
完成一件事,给开发者太多的选择并不就是好的,因为这可能会带来沟通成本、选择成本的增加,得不偿失。
python核心开发者 Brett Cannon 在他的一篇文章 Why Python 3 exists 中说:
And we made the change when we did because we figured the sooner the better.
the sooner the better ,一定要做的事越早越好。
不过他也说了,python2 到 python3 这样大的 “向后不兼容” 的改变之后应该都不会再发生了,因为这的确对开发者不友好。
总结一下
Python2 str 对象的模糊性,这种原子层面的模糊性是不可接受的。
Python2 unicode 只是可选项,不是必选项,可选意味着有人不选。Python3 开始默认支持 unicode。
the sooner the better ,必做的事尽早做。