我纽约州伊萨卡市康奈尔鸟类实验室的一台虚拟机在夜间嗡嗡作响。这台机器的名字是Bubo,以角猫头鹰的属命名。大约每五分钟,Bubo就会从东北部的气象雷达站抓取一张图像,并通过人工智能算法的管道将其输入。这张雷达图像显示了什么?布波问道。下雨了吗?这些是昆虫吗?可能是花粉吗?布波不在乎那些事;它只想看到飞翔的鸟儿。为了找到它们,Bubo分析了雷达站看到的目标的速度和方向。Bubo知道鸟类的速度不同于风和昆虫,并将它们过滤掉。现在布波只看到鸟。但它们的密度有多大?他们开得有多快?他们在多高的天空飞行?这台机器进行了这些计算,并创造了无数鸟儿在黑暗的掩护下飞行的图像。
俄勒冈州立大学计算机科学教授Thomas Dietterich在康奈尔鸟类学实验室工作,他说:“如果我们能在晚上看到,我们会看到数百万只鸟在头顶上飞行。”黑下巴蜂鸟沿着墨西哥海岸飞向阿拉斯加。黄喉的绿喉鸟在墨西哥湾海岸翱翔,飞向安大略。橄榄色和黄色的捕蝇鸟穿过中美洲,驶向西北地区。“这真是太令人敬畏了,有一件巨大的、秘密的事情正在发生,而我们却没有意识到。”
长期以来,科学家们一直试图揭开鸟类迁徙的秘密。它们照亮了鸟类在地球上寻找出路的非凡途径。这些包括鸟类对地形和大陆的认知地图,以及它们眼睛中探测地球磁极和确定飞行方向的机制。
安德鲁·法恩斯沃思,在鸟类的信息科学系的康奈尔实验室的研究助理,想了解超过了生物学鸟类迁徙。他是大画面后。“如何迁移功能更大的生态系统中?”他问。“这是什么意思时,生态系统的改变?”
在过去的四年里,法恩斯沃斯和他的同事们,一群生态学家、统计学家、计算机科学家和气象学家,一直致力于一个名为BirdCast的项目,该项目导致了Bubo的机器学习,揭示了迁徙的秘密。在过去20年里,美国国家海洋和大气管理局(National Oceanic and Atmospheric Administration)对天气雷达进行了约1亿次扫描,其中一些秘密就包含在这些扫描中。其他的则在eBird网站上每年数千万的鸟类目击报告之内。eBird是一个在线平台,世界各地的鸟类观察者通过该平台记录特定物种的观察结果。还有更多的是由散布在全国各地的声音监测设备记录下来的数千小时夜间鸟鸣声。
对于英国的战争努力工作鸟类学家猜测的对象是鸟类,但很少有人相信它,他们没有想到的鸟类将在夜间飞行。
通过BirdCast,大数据革命与野生动物保护相结合。想象一下,市政当局在接近鸟类之前关灯,以免它们迷失方向,或者是鸟类白天停下来休息和觅食的地方,这些地方受到杀虫剂和风力涡轮机的保护。法恩斯沃思说:“大多数传统的保护都是留出特定的区域;这是静态的。”。“这正成为一个更具活力的保护时代。我们如何才能在事情发生之前改变我们的行为?”这种预测能力可以帮助保护主义者减轻由气候变化造成的蔓延、发展和环境变化对鸟类的威胁。但首先,迪特里奇说,“我们需要有更好的模型来描述鸟类的去向和它们的路径。”
雷达之前,很少有人知道这位夜间迁移。在20世纪30年代,在大西洋两岸的军队竞相开发技术,将给敌机他们提前警告。天气雷达发出的无线电波,称为脉冲,是反弹在大气中的物体的阵阵。雷达基于所述速度和返回回声的功率的物体的形状和距离。雷达原来是能够检测Heinkels和梅塞施密特和天气方面。但其他对象在大气中移动躲避分类。英国军方的雷达操作员被称为神秘物体天使和德国人叫他们Scheinziele,“伪相呼应。”不管他们,他们已经给大家造成严重破坏,送男人的战位和鬼面追逐。对于英国的战争努力工作鸟类学家猜测的对象是鸟类,但很少有人相信它,他们没有想到的鸟类将在夜间飞行。
在第二次世界大战后的几年里,雷达鸟类学领域的先驱之一是新奥尔良的一个孩子。Sidney Gauthreaux的家乡位于北美洲最繁忙的移民走廊之一。从加勒比海、南美洲和中美洲的冬季栖息地返回的物种最直接的路线是越过墨西哥湾,它们只需一次穿越墨西哥湾——400到600英里即可登陆。作为一个孩子,Gauthreaux晚上睡不着,在卧室外的黑暗中听着航班呼叫。Gauthreaux今天说:“我的职业生涯一直致力于了解夜间大气中发生的事情,因为我们看不到它。”。
当Gauthreaux是在20世纪50年代高中,第一个现代气象雷达系统,沿湾,50台被称为WSR-57的全国网络的一部分安装。如果站是不够敏感,以检测雨滴,Gauthreaux认为,不应该他们拿起水分对他在夜里听见鸟儿的尸体?他得到了在雷达图像双手,可以看到白雪皑皑的群众,他知道那是鸟的云。发现燃料Gauthreaux对鸟类迁徙的热情,并在70年代后期,他专为研究鸟类的第一个移动雷达实验室。
1990年,Gauthreaux在克莱姆森大学(Clemson University)建立了雷达鸟类学实验室(Radar Ornithology Laboratory),大约在同一时期,国家天气系统进行了升级。天气系统由159个发射微波能量捕捉目标密度的站点组成,并使用多普勒记录径向速度(目标接近或离开雷达波的速度)和方向。来自这个名为WSR-88D的网络的雷达数据,让鸟类学家不仅可以估计有多少只鸟在飞行,还可以估计它们的飞行速度和方向。
预测迁徙的问题在于,它可能涉及数十亿只鸟类,它们各自决定是否在当晚飞行以及去哪里。
1999年,法恩斯沃斯是戈特罗的一名研究生,他的硕士论文主要研究夜间飞行信号与雷达记录的鸟类密度之间的关系。这项工作需要大量的时间和精力。法恩斯沃斯必须听数小时的飞行呼叫记录,并在区分天气、昆虫、蝙蝠和鸟类之后手动对每个雷达图像进行分类——这是一项需要大量练习的专业技能。在他的论文中,法恩斯沃斯分析了58个夜晚556个小时内鸟类密度和鸣叫声的变化。他花了八个月的时间。
2000年,在环境保护署的资助下,BirdCast的前身在克莱姆森的雷达鸟类学实验室、康奈尔的鸟类学实验室和国家奥杜邦学会的合作下诞生了。目标是根据雷达扫描和天气预报,以及公民科学家收集的目击数据,预测大西洋中部走廊的鸟类迁徙。这个项目需要大量的人力和财力,两年后就结束了。法恩斯沃斯说:“这个想法还没有实现,世界的连接还没有实现。”“那是在大数据出现之前,公民科学的整个理念还没有爆发。”
到2011年,情况发生了变化。如果最初的鸟笼因为人类的限制而无法生长,科学家们决定将人类从循环中剔除。挑战在于,人工智能模型是否能够获得分析雷达图像所需的专业知识,不仅通过区分天气、昆虫和鸟类,而且通过推断不同海拔高度候鸟的速度和方向。如果可能的话,数PB的历史数据将可用于研究,以及在区域和国家范围内快速、高效地近实时跟踪候鸟的可能性。在国家科学基金会的资助下,新生的鸟群,加入了Amherst麻州大学计算机科学助理教授Daniel Sheldon,开始工作,孵化出BBO。
现在,“Bubo”每天晚上都会从17个雷达站下载数据以及天气数据,这些数据将帮助它将鸟类与风和降水区分开来。Bubo的方法源自气象学家通过雷达分析风向和风速的方法,但它有一个处理“混叠”问题的新特性。之所以会出现混叠,是因为WSR-88D的雷达无法计算出超过一定速度的径向速度,这些误差会扭曲扫描结果,显示出高于一定速度的物体从雷达站向外移动,而不是向内移动,反之亦然。混叠并不新奇,但Sheldon和他的BirdCast同事们提出了一种新方法,他们开发了一个概率模型来解释径向速度值的混叠,并编写了一个推理算法来重建一个完整的速度场。2013年,这些创新为该团队赢得了人工智能进步协会(Association for the Advancement of Artificial Intelligence)颁发的最佳论文奖。Bubo的机器学习流水线可以在17秒内分析一张雷达图像,在不到一小时内分析一整晚的图像。
“我们知道鸟类在秋天飞向南方,在春天飞向北方,”特拉华大学野生动物生态学助理教授Jeffrey Buler说,他使用雷达数据来研究鸟类迁徙,尽管他不是BirdCast的成员。“现在我们有了一种直接观察这些事情并提出微妙问题的方法。他们正在做的工作的另一个好处是,他们开始挖掘雷达档案的潜力。”
Bubo自5月份开始运行,直到今年秋天才会在整个迁移期间生成数据。但鸟播小组已经开始分析历史数据,包括2010年和2011年两次秋季迁徙的近40000次来自美国东北部的雷达扫描。这项研究表明,在大西洋上跨大陆迁徙的鸟类离开得更早,使用的路线也不同于晚来的大陆内迁徙者。这些发现有助于生物学家了解气候变化是如何影响迁徙物种的,高特雷奥在克莱姆森大学进行了研究。他的初步发现使他相信,虽然近几十年来,较短距离的移民对季节性变化做出反应,但远距离物种并没有改变它们的时间表。“结果是这些物种可能与食物生产和繁殖地不同步,”Gauthreaux说。“一开始,这可能会导致相当大的种群数量下降。而对于不太健康的物种来说,这可能意味着灭绝:种群数量可能会变得如此之低,以至于它们无法适应,物种也会突然灭绝。”
随着Bubo收集数据,BirdCast正准备扩大另外两个人工智能实验。第一种方法是使用机器学习算法来识别由声学设备记录的候鸟夜间飞行的叫声。到目前为止,纽约州共有10台设备,每台设备都配备了一个检测器,用于检测航班呼叫。这些叫声被上传到一个中央服务器,在那里通过一种算法进行处理,该算法能够以95%的准确率识别六种不同的鸟类。康奈尔鸟类学实验室信息科学主任史蒂夫·凯林说:“这是我们第一次能够训练机器,通过发出的声音自动检测和识别鸟类。”。
其次,BirdCast将开始测试一个统计模型,使用eBird数据在鸟类迁徙前一到两天预测它们。自2002年推出以来,eBird已经成为一个令人印象深刻的公民自创数据来源。许多使用eBird应用程序的业余鸟类观察者每月报告数百万次目击事件。2015年2月,在为期四天的全球鸟类统计中,来自100个国家的超过14万人向eBird提交了目击报告。然而,所有这些数据都带来了挑战。迪特里希解释说,预测迁徙的问题在于,迁徙涉及到潜在的数十亿只鸟类,它们各自决定是否在当晚飞行,以及去哪里。如果计算机必须考虑所有这些变量,那么在计算上就很难处理。谢尔顿的突破是"集体图形模型"集体图形模型没有为鸟类种群的每一个成员包含一个变量,而是避免对个体进行推理,而专注于群体,使用一种算法来推断有多少鸟从一个地方迁移到另一个地方。“这听起来很明显,但我们的突破在于认识到概率模型可以从个体提升到整体,”谢尔登说。
对于BirdCast,大盘正在创建了一个模型,从所有三个集成数据流雷达,声学和eBird。该模型可以测试有关的力量塑造迁移假说,揭示迁移和当前逃避我们的感知大气之间的关系。这些见解,法恩斯沃思说,不能很快到达。“有一些基本的自然历史问题,这是我们不知道答案,”他说。“这是什么意思时,事情开始发生变化?喷射流中的模式?极地涡旋?在大气过的广阔空间尺度的变化?这是事物的种类,我们是正确的理解尖“。
奥康纳先生是一位住在布鲁克林的记者,他的第一本书复活科学:野生动物的保护、灭绝和不稳定的未来将在九月发表。
由理查德·巴茨、保罗·苏德斯和迈克尔·j·班尼特的照片拼贴而成。








