我有收藏 CD 的习惯——不过处于模拟与数码的夹层中的 CD,接下来的命运可能连黑胶唱片都不如。看样子要考虑把收藏的对象改成黑胶唱片了?而且黑胶唱片拿在手里的时候,的确会给人一种比 CD 更亲切的感觉。因为 CD 上记载的是需要解码的 0 和 1,但黑胶唱片上刻着的是真正的声波。模拟与数字,两者的「温度」明显不同。
从前,除了文件尺寸,我们很难找到别的客观标准来衡量信息量的大小。生成式 AI 的面世揭示了许多数据真实的信息量。比如,记录一个复杂的数学证明可能只需要几 KB 大小的文本文件,却要动用上 T 参数的模型才能正确生成。歌曲音频一般几个 MB,视频动辄几百 MB(非压缩格式的话尺寸更大),但音画生成模型的尺寸相比好的语言模型反而要小很多。如果比较目前开放权重的视频模型和音频模型,两者的规模其实非常接近,远没有它们各自生成的内容(视频和音频)在文件大小上的差距那么大。
现在许多 AI 编程测评都是「这个新模型做的网页比那个模型更漂亮」。恕我直言,这种测评方式实在是肤浅。且不论「漂亮」的定义随着时代和文化飘忽不定——要不要去关注这个「漂亮」,这本身都变成了一个值得质疑的事情。浮夸华丽的外表,其实暗含了更低的信噪比,干扰了人们对于价值的判断。 在 AI 时代,人们尤其应该学会逆着潮流,努力「去装饰化」,让自己的判断免受华丽载体的干扰:
当年的 Apple 设备,质量上真是过硬。所以 Apple 只能靠软件下阴招,强行淘汰明明好用的设备,以至玩火过头,闹出了之后的 iPhone 电池门事件。
最近这几年我又买了两台 iPad,基本寿命都没过两年。第一台现在还在勉强用着,但电源键按下去就会卡住,要用指甲抠出来。第二台没用多久,充电口突然罢工。这两台拿到 Apple 店里去修,结果工作人员连看都没看,就说 Genius Bar 是完全不管 iPad 的。除非有 Apple Care,否则一律不管不修,连基本的故障排除也不给做。
在英语环境呆过不久,就会发现自己说话变成中英混杂模式。我甚至不知道有些句子怎么准确地翻成中文,比如「这很 make sense」「马上要 due 了,明天就是 deadline」「这个计划老板还没 sign off」「你这说法有点 plausible」不过有些英语感觉一辈子都接受不来,比如我还记得第一次听见美国人问我「Do you want this wife-beater?」时的下巴掉落感……
无法翻译的还有双关语。例如超级马里奥的坏蛋阵营「瓦里奥」和「瓦路易基」,名字就起得特有水平。「瓦里奥」是把 Mario 的首字母上下颠倒一下,这个比较直白。而「瓦路易吉」听起来是个很没创意的名字,就是把「瓦」字按在「路易吉」的前面。但是「瓦路易」(わるい)就是「坏」的意思嘛,怎么能这么巧?果然意大利语和日语是一个祖先吧!