我如果你今天上网了,你可能已经和神经网络进行了互动。它们是一种机器学习算法,被用于从语言翻译到金融建模的方方面面。他们的专长之一是图像识别。包括谷歌、微软、IBM和facebook在内的几家公司都有自己的照片标签算法。但是图像识别算法会犯非常奇怪的错误。
微软Azure的计算机视觉API添加上面的标题和标签。但是上图中并没有羊。一个也没有。我一路放大,检查了每一个微粒。
在这张图片中,它还标记了绵羊。我碰巧知道附近有羊。但实际上没有人在场。
它没有意识到“羊”指的是真正的动物,而不仅仅是一种没有树木的草。
这里还有一个例子。事实上,神经网络每次看到这种类型的景观都会使绵羊产生幻觉。这是怎么回事?
神经网络学习的方式是通过看大量的例子。在这种情况下,它的训练员给了它许多人类手工标记的图像,其中许多图像包含绵羊。在对所看到的图像一无所知的情况下,神经网络必须制定规则,确定哪些图像应该被标记为“绵羊”。看起来它还没有意识到“羊”指的是真正的动物,而不仅仅是一种没有树的草。(类似地,它用“彩虹”标记第二张图片,可能是因为当时天气潮湿多雨,没有意识到颜色带的重要性。)
神经网络只是高度警惕,到处都是羊吗?事实证明,没有。他们只在希望看到羊的地方看到羊。他们可以很容易地在田野和山坡上找到羊,但一旦羊开始出现在奇怪的地方,就很明显算法是多么依赖猜测和概率。
把羊带进屋里,它们就会被贴上猫的标签。抱起一只绵羊(或山羊),它们就会被贴上狗的标签。
把它们涂成橙色,它们就变成了花。
把羊拴上,它们就会被贴上狗的标签。把它们放在车里,它们就是狗或猫。如果它们在水里,它们可能会被贴上鸟类甚至北极熊的标签。
如果山羊爬树,它们就会变成鸟。或者是长颈鹿。(事实证明,微软Azure因为到处都能看到长颈鹿而臭名昭著,因为有传言说原始数据集中的长颈鹿太多了。)
问题是,神经网络匹配模式。他们看到一片片像毛皮一样的纹理,一束绿色,就断定那是羊。如果他们看到猫的皮毛和厨房形状,就会得出猫的结论。
如果生活循规蹈矩,那么图像识别就很管用。但一旦人或羊做了一些意想不到的事情,算法就会显示出它们的弱点。
想在神经网络里偷偷摸摸吗?在一个令人愉快的赛博朋克转折中,超现实主义可能是答案。也许未来的特工会穿着鸡的服装,或者开着有牛斑点的车。
推特上还有很多很多搞笑错误的例子线程我从一个简单的问题开始:
你可以测试微软Azure的图像识别API,你可以看到,即使是一流的算法也依赖于概率和运气。另一种算法,NeuralTalk2,是我在Twitter上经常使用的。
想知道我什么时候发布另一个实验吗?你可以报名在这里.
詹妮尔·谢恩(Janelle Shane)是一名光学科学家。她还训练神经网络(一种机器学习算法)在努力模仿人类数据集时写出无意的幽默。这帖子她的博客AIWeirdness.com是她在加州大学圣地亚哥分校攻读电气工程博士学位时创办的。在推特上关注她@JanelleCShane.
观察:几个世纪以来对“离奇事件”的焦虑。









