如何使用人工智能与鲸鱼交流 – 拯救地球上的生命
使用人工智能与鲸鱼交流,拯救地球生命
在米歇尔·福内特(Michelle Fournet)二十多岁时的一时冲动下,她搬到了阿拉斯加,但她以前从未见过鲸鱼。她在一艘观鲸船上找到了一份工作,每天在水上注视着那些在水下移动的宏伟形状。她意识到,她一生中的整个时间里,自然界一直都在那里,而她一直都错过了它。“我甚至不知道我是多么地失落,”她回忆道。后来,作为一名海洋生物学研究生,福内特想知道她还错过了什么。她逐渐了解的座头鲸只在她的视线中露出一部分。如果她能听到它们在说什么呢?她将一个水听器放入水中,但通过的唯一声音是机械船只的噪音。在嘈杂声中,座头鲸变得寂静无声。正如福内特发现了大自然一样,她也见证了它的消逝。她决心帮助座头鲸。为了做到这一点,她需要学会如何倾听它们。
福内特现在是新罕布什尔大学的教授,也是一个保护科学家集体的主任,她过去十年致力于建立座头鲸在日常生活中发出的各种吱吱声、尖叫声和呻吟声的目录。座头鲸有着广泛而多样的词汇,但无论是雄性还是雌性,年轻还是年老,它们都会说一样的话。对我们这些可怜的人类耳朵来说,它听起来像是一个被水滴打断的肚子咕咕声:咕噜。
福内特认为,座头鲸的咕噜声是它们互相宣告存在的方式。一种说“我在这里”的方式。去年,作为一系列实验的一部分,以测试她的理论,福内特驾驶小艇驶入阿拉斯加的弗雷德里克湾,那里座头鲸聚集在一起觅食。她播放了一系列的咕噜声,并记录座头鲸的反应。然后,回到海滩上,她戴上耳机听音频。她的呼声传出去了。座头鲸的声音通过水传回来:咕噜,咕噜,咕噜。福内特这样描述:座头鲸听到一个声音说:“我在,我在这里,我是我。”然后它们回答:“我也在,我在这里,我是我。”
生物学家使用这种被称为播放的实验来研究是什么促使动物说话。福内特的播放迄今使用的是真实咕噜声的录音。然而,这种方法是不完美的,因为座头鲸对它们说话的对象非常注意。如果一只座头鲸认出了录音中的座头鲸的声音,那会如何影响它的回应?它会与朋友说话和与陌生人说话的方式有所不同吗?作为一名生物学家,你如何确保你发出的咕噜声是中立的呢?
一个答案是自己创造。福内特已经与地球物种项目分享了她的座头鲸呼叫目录,该项目由一群技术人员和工程师组成,他们借助人工智能的帮助,旨在开发合成咕噜声。而且他们不仅计划模仿座头鲸的声音。这个非营利组织的使命是让人类的耳朵对整个动物王国的闲聊敞开。他们说,在30年内,自然纪录片不再需要安抚人心的阿滕伯勒式解说,因为荧幕上动物的对话将会有字幕。就像今天的工程师不需要懂普通话或土耳其语来开发能说这些语言的聊天机器人一样,很快就会有可能构建一个能说座头鲸语、蜂鸟语、蝙蝠语或蜜蜂语的聊天机器人。
“解码”动物间的沟通的想法是大胆的,也许是难以置信的,但危机时刻需要大胆和难以置信的措施。无论人类身在何处,动物都在消失。根据估计,过去50年里,全球野生动物种群数量平均下降了近70%——而这只是科学家所测量到的危机的一部分。成千上万种物种可能会消失,而人类对它们一无所知。
要减少碳排放,保护生态系统,我们当然不需要与动物交谈。但我们对其他生物的生活了解得越多,我们就越能更好地照顾它们的生活。而人类,作为人类,更关注那些说我们的语言的人。地球物种希望实现的互动,福内特说,“有助于一个与自然脱节的社会重新与之相连。”最好的技术让人类以更全面的方式生活在这个世界上。从这个角度来看,与动物交流可能是它最自然的应用。
人类一直知道如何倾听其他物种的声音,当然也包括与鲸豚合作以互惠互利的渔民们:它们为自己捕到一条鱼,也会为我们捕到一条鱼。在19世纪的澳大利亚,一群虎鲸被人们认为是将须鲸赶到捕鲸点附近的湾口,然后用尾巴拍打海面以提醒人们准备捕杀。作为帮助的回报,虎鲸得到了它们最喜欢的食物——嘴唇和舌头。与此同时,在贝林吉亚的冰冷海域,因纽特人在捕猎前与露脊鲸进行交流。正如环境历史学家巴斯莎巴·德穆斯在她的书《漂浮的海岸》中所写的那样,因纽特人把鲸鱼看作是占据“他们自己国家”的邻居,它们有时会选择将自己的生命献给人类——如果人类配得上。
商业捕鲸者则采取了不同的方法。他们将鲸鱼视为浮动的脂肪和须鲸容器。19世纪中叶的美国捕鲸业和随后的全球捕鲸业几乎使几个物种灭绝,这是人类造成的有史以来最大规模的野生动物灭绝事件之一。在20世纪60年代,有700,000头鲸被杀害,标志着鲸类死亡的高峰。然后,一件非凡的事情发生了:我们听到了鲸鱼的歌声。在一次去百慕大的旅行中,生物学家罗杰和凯蒂·佩恩遇到了一位名叫弗兰克·沃特林顿的美国海军工程师,他给了他们他在水下录制的奇怪旋律的录音。几个世纪以来,水手们一直在讲述从他们船体的木壳中传出的怪异歌声的故事,无论是来自怪物还是塞壬,他们并不知道。沃特林顿认为这些声音来自座头鲸。他告诉佩恩夫妇,去救它们。他们通过发行一张名为《座头鲸之歌》的专辑使这些能歌善舞的鲸鱼走红。随后,拯救鲸鱼运动迅速兴起。 1972年,美国通过了《海洋哺乳动物保护法》; 1986年,国际捕鲸委员会禁止商业捕鲸。在短短的二十年间,鲸鱼在公众眼中变成了认知复杂、海洋巨人的形象。
今年早些时候去世的罗杰·佩恩经常谈论他的信念,即公众越了解关于鲸鱼的“奇特和迷人的事物”,人们对它们的关注就会越多。在他看来,单靠科学无法改变世界,因为人类不会对数据做出反应;他们对情感做出反应——对那些让他们为之惊叹或愉悦得颤抖的事物。他赞成野生动物旅游、动物园和囚禁海豚的表演。他相信,尽管在这些地方,个体动物的待遇可能存在问题,但物种灭绝要比这糟糕得多。自那以后,保育人士一直坚持着与动物接触可以拯救它们的观点。
基于这一前提,Earth Species跨出了创造性的一步,认为人工智能可以帮助我们与动物进行首次接触。该组织的创始人阿扎·拉斯金和布里特·塞尔维特尔都是我们数字时代的建筑师。拉斯金在硅谷长大,他的父亲在20世纪70年代开始了苹果公司的麦金塔计划。在他的职业生涯早期,拉斯金曾帮助建立Firefox浏览器,2006年他创建了无限滚动,可以说这是他最伟大和最可疑的遗产。后来,他悔过自新,计算了他的发明浪费了多少人类时间,结果超过每周10万个生命。
拉斯金有时会在一家叫做Twitter的初创公司里闲逛,他在那里认识了塞尔维特尔,后者是该公司的创始员工。他们保持联系。2013年,拉斯金在收音机上听到了一则有关埃塞俄比亚的格拉达猴的新闻报道,这些猴子的语言节奏与人类的语言相似。事实上,它们如此相似,以至于主要科学家有时会听到一个声音对他说话,转过身来,惊讶地发现一只猴子在那里。采访者问是否有办法知道它们试图传达什么。当时还没有,但拉斯金想知道是否有可能通过机器学习找到答案。他向塞尔维特尔提出了这个想法,后者对动物福利有兴趣。
有一段时间,这个想法只是一个想法。然后,在2017年,新的研究表明,机器可以在没有先接受双语文本训练的情况下在两种语言之间进行翻译。谷歌翻译一直是模仿人类使用字典的方式,只是速度更快、规模更大。但是这些新的机器学习方法完全绕过了语义。它们将语言视为几何形状,并找到形状重叠的地方。如果一台机器能够将任何语言翻译成英语,而无需先理解它,拉斯金认为,它是否能够用同样的方法翻译格拉达猴的摇晃、大象的次声和蜜蜂的摇摆舞呢?一年后,拉斯金和塞尔维特尔共同创办了Earth Species。
Raskin认为,能够窃听动物会引发一场不亚于哥白尼革命的历史性的范式转变。他喜欢说“AI是现代光学的发明”。他的意思是,正如望远镜的改进使17世纪的天文学家能够发现新的星体,并最终将地球从宇宙中心移除一样,AI将帮助科学家们听到他们单凭耳朵无法听到的东西:动物有意义地交流,而且方式比我们想象的要多。它们的能力和生活并不比我们差。“这一次我们将向宇宙展望,发现人类并不是中心,”Raskin说。
Raskin和Selvitelle的头几年时间里,他们会见了许多生物学家,并跟随他们进行田野工作。很快他们意识到,他们面前最明显和最紧迫的需求不是引发革命,而是整理数据。20年前,灵长类研究者会站在树下,手持麦克风直到手臂酸痛。现在,研究者们可以将便携式生物记录器固定在树上,连续一年收集音频。结果产生的数以太字节的数据,是任何一支研究生队伍都无法处理的。但是将所有这些材料交给经过训练的机器学习算法,计算机可以扫描数据并标记动物的叫声。它可以区分咝咝声和哨声。它可以分辨一只长臂猿的声音和她兄弟的声音。至少,这是希望。这些工具需要更多的数据、研究和资金支持。Earth Species拥有15名员工和数百万美元的预算。他们与数十名生物学家合作,开始在这些实际任务上取得进展。
一个早期项目解决了动物交流研究中最重要的挑战之一,即所谓的“鸡尾酒会问题”:当一群动物彼此交谈时,你如何判断谁在说什么?在公海上,成千上万只海豚同时交谈;记录它们的科学家所得到的音频充斥着咕噜声和点击声,就像体育场充斥着欢呼声一样。即使只有两三只动物的音频通常也无法使用,因为你无法判断一只海豚停止说话,另一只海豚开始说话的位置。(视频对此没有帮助,因为海豚在说话时不张嘴。)Earth Species利用Sayigh广泛的特征口哨数据库(被喻为名字)开发了一个神经网络模型,可以分离重叠的动物声音。该模型只在实验室条件下有用,但研究是需要建立在这之上的。几个月后,Google AI发布了一个能够解析野生鸟鸣的模型。
Sayigh提出了一个可以作为海豚大规模搁浅的紧急警报的工具,这种情况在全球某些地方经常发生。她住在麻省的科德角,这是一个这样的热点地区,每年有十几次海豚群体迷失方向,不慎游到岸边并丧生。幸运的是,在此之前可能有一种预测的方法,Sayigh说。她假设当海豚感到压力时,它们会比平常发出更多的特征口哨,就像一个迷失在暴风雪中的人可能会惊慌呼喊一样。计算机经过训练可以监听这些口哨,并发送警报,促使救援人员在海豚游到海滩之前改变它们的方向。在萨利什海域,2018年,一只母虎鲸拖着饿死的幼崽的尸体引起了全球的同情,那里有一个由Google AI建立的警报系统,监听定居虎鲸并使船只避开它们的路径。
对于研究人员和保护人士来说,机器学习的潜在应用几乎是无限的。Earth Species并不是唯一一个致力于解码动物交流的团体。Payne在生命的最后几个月为Project CETI提供咨询,这是一个非营利组织,今年在多米尼加建立了一个基地,用于研究抹香鲸的交流。“想象一下,如果我们能够理解动物彼此之间在说什么,他们的思想是什么,他们喜欢什么、害怕什么、渴望什么、回避什么、厌恶什么、感兴趣什么、珍视什么,那将会有多么令人兴奋,”他在六月份的《时代》杂志中写道。
到目前为止,Earth Species开发的许多工具在基础工作方面提供了更多的帮助,而不是直接的实用性。尽管如此,这个新兴领域中有很多乐观情绪。几位生物学家告诉我,只要有足够的资源,解码是可以科学实现的。这只是一个开始。真正的希望是弥合我们与动物体验之间的理解鸿沟,无论这个鸿沟有多么巨大或狭窄。
Ari Friedlaender拥有Earth Species所需的大量数据。Friedlaender在加利福尼亚大学圣塔克鲁兹分校研究鲸类行为。他最初从事标记工作:站在船边,追逐一只鲸鱼,伸出一根长杆,杆子的末端固定着一个带有吸盘的生物记录标签,当鲸鱼浮出水面时,将标签拍在鲸鱼的背上。这比看起来更困难。Friedlaender证明自己很有能力,“我在大学里参加了体育运动,”他解释道,并很快就开始参加海上标记考察。
Friedlaender使用的标签捕捉了大量的数据。每个标签不仅记录了GPS位置、温度、压力和声音,还记录了高清视频和三轴加速度计数据,这与Fitbit使用的技术相同,Fitbit用于计算步数或测量睡眠深度。综合起来,这些数据以电影般的细节展示了鲸鱼的一天生活:每一次呼吸和下潜,穿越海蜇和水母群的行程,与旋转的海狮的相遇。
Friedlaender向我展示了一个由一个标签的数据制作的动画。在动画中,一只鲸鱼下潜并在水中盘旋,像在海底的马里奥卡丁车赛道上行驶的多彩三维路径。另一个动画描绘了几只鲸鱼吹气泡网的场景,这是它们围绕鱼群绕圈子的一种捕食策略,用气泡墙把鱼群困在中心,然后张开嘴冲过去。观察鲸鱼的动作,我注意到大部分鲸鱼都追踪了一个整齐的螺旋线,而其中一只鲸鱼却产生了一堆笨拙的曲折线。“可能是一只年轻的动物,”Friedlaender说。“那只还没有弄清楚。”
Friedlaender的多方面数据对于地球物种尤其有用,因为正如任何生物学家所说的,动物的交流不仅仅是口头的。它还涉及手势和动作,就像声音一样频繁。多样化的数据集使地球物种更接近于开发可在整个动物王国范围内工作的算法。该组织最近的工作集中在基础模型上,这种计算与ChatGPT等生成式人工智能使用的计算相同。今年早些时候,地球物种发布了第一个用于动物交流的基础模型。该模型已经能够准确地分类白鲸的叫声,地球物种计划将其应用于异类物种,如猩猩(发出低吼声)、大象(通过地面发出地震性的隆隆声)和跳蛛(通过腿振动)。地球物种的首席执行官Katie Zacarian这样描述该模型:“所有事物都是钉子,而它是一把锤子。”
地球物种的另一个应用是生成动物的叫声,就像GPT的音频版本一样。Raskin已经制作了几秒钟的一只姬长尾鸟的叫声。如果听起来好像已经超前解码了,那确实是这样——事实证明,人工智能在说话方面比理解更擅长。地球物种发现,他们正在开发的工具很可能在他们能解码之前就能与动物交流。例如,很快就可能用“whup”提示一个人工智能,并让它用座头鲸的语言继续对话,而无论是机器还是鲸鱼,人类观察者都不知道它们在说什么。
没有人期望这样的场景真的发生;那是不负责任的科学行为。与地球物种合作的生物学家们的动机是知识,而不是为了对话而对话。地球物种的高级人工智能研究顾问Felix Effenberger告诉我:“我不相信我们会有英语-海豚翻译器,好吗?你在智能手机上输入英语,然后它发出海豚的声音,海豚就会去找一些海胆给你。目标是首先发现基本的交流模式。”
那么与动物交流会是什么样子——听起来会是什么样子?它不必是自由形式的对话才能令人惊叹。以受控的方式与动物交流,就像Fournet的回放“whup”一样,对科学家来说可能是理解它们的关键。毕竟,你不会试图通过去柏林参加一个派对然后默默坐在角落里来学习德语。
鸟类爱好者已经使用应用程序从空气中捕捉旋律并识别正在唱歌的鸟类物种。有了人工智能作为动物解释员,你可以想象你可以学到更多。你提示它发出两只座头鲸相遇的声音,它就会发出一个“whup”。你提示它发出一只幼崽与母亲交流的声音,它就会发出一个耳语。你提示它发出一只痴情雄性的声音,它就会发出一首歌。
没有任何一种鲸类被人类灭绝过。这不算是胜利。多样性只是生物多样性的一种度量标准。动物的生活丰富多彩,他们通过文化传达信息和行为。虽然座头鲸种群自半个世纪前的最低点以来有所恢复,但它们在此期间失去了哪些歌曲和实践呢?蓝鲸的数量被猎杀至人口的仅剩1%,它们可能失去了几乎一切。
圣安德鲁斯大学的生物学家克里斯蒂安·鲁茨认为,保护自然的一个重要任务是保留非人类的生存方式。“你不是在问,‘你在那里还是不在那里?’”他说。“你在问的是,‘你在那里是否快乐,是否不快乐?’”
鲁茨正在研究夏威夷乌鸦的沟通方式自2002年以来的变化,当时它们在野外灭绝了。目前,有大约100只这些非凡的鸟类(是少数知道使用工具的物种之一)被保护性地圈养着,保护人员希望最终能够将它们重新引入野外。但这些乌鸦可能尚未准备好。有证据表明,圈养的乌鸦已经忘记了有用的词汇,包括保卫领地和警告捕食者的呼叫。鲁茨正在与地球物种合作,建立一个算法来筛选已灭绝的野生乌鸦的历史录音,提取出所有乌鸦的呼叫并进行标记。如果他们发现确实丢失了呼叫,保护人员可能会生成这些呼叫,以教给圈养的乌鸦。
鲁茨小心地表示,生成呼叫将是一个经过深思熟虑的决定,需要在必要的时候做出。他在七月份发表在《科学》杂志上的一篇论文中赞扬了机器学习的非凡用途。但他警告说,人类在干预动物生活之前应该深思熟虑。就像人工智能的潜力仍然未知一样,它可能带来的风险可能超出我们的想象。鲁茨以座头鲸每年创作的新歌曲在世界范围内传播的现象作为例子。如果这些鲸鱼接受了人工智能生成的短语并将其纳入日常生活,人类将会改变一个有百万年历史的文化。他告诉我:“我认为这是一个现在至少不应该触碰的系统。”“谁有权与座头鲸聊天?”
可以想象,与动物交流的人工智能可能会被滥用。20世纪捕鲸者也使用了当时的新技术,通过发射声纳使鲸鱼惊慌地浮出水面。但人工智能工具的好坏取决于人类如何使用它们。保护纪录片制片人兼《如何与鲸鱼交流》的作者汤姆·马斯蒂尔建议,应该给予动物解码研究与最受推崇的科学事业(如大型强子对撞机、人类基因组计划和詹姆斯·韦伯太空望远镜)相同的资源。他告诉我:“对于很多技术来说,开发者可以为所欲为,直到其他人赶上。这个问题太重要了,不能让这种情况发生。”
数十亿美元正流入人工智能公司,其中很大一部分是为了追求企业利润:更快地写邮件,更高效地创建库存照片,更有效地投放广告。与此同时,自然界的奥秘仍然存在。科学家们唯一确切知道的事情之一是他们对自然了解得很少。当我问弗里德兰德是否通过追逐鲸鱼花费了很多时间来了解它们时,他告诉我,有时他会给自己设定一个简单的测试:当一只鲸鱼潜入水下后,他尝试预测它会在哪里浮出水面。“我闭上眼睛说,‘好吧,我在我生命中放了1,000个标签,我看到了所有的数据。这只鲸鱼会出现在这里。’结果鲸鱼总是出现在那里,”他说。“我不知道这些动物在做什么。”
如果你能与一只鲸鱼交谈,你会说什么?你会问白·格拉迪斯吗?这只杀人鲸鱼因在伊比利亚海岸沉船而在今年夏天成为网络迷因,你会问她什么驱使她发动袭击——是娱乐、错觉还是复仇?你会告诉塔勒夸,这只母虎鲸正在哀悼她的幼崽之死,你也失去了一个孩子?佩恩曾经说过,如果有机会与鲸鱼交谈,他想听到它们的日常闲聊:爱情、争吵、不忠。此外:“抱歉”是一个好词。
然后,还有那个棘手的哲学问题。自我世界的问题,以及作为一只蝙蝠、一只鲸鱼或者你的感知是什么样的。即使我们能与鲸鱼交谈,我们能理解它说的话吗?或者它对世界的感知、整个意识的秩序会是如此陌生以至于无法理解?如果机器将人类语言渲染成重叠的形状,也许英语是一个甜甜圈,而鲸语则是甜甜圈的空洞。
也许,在你能与鲸鱼交谈之前,你必须知道拥有鲸鱼的身体是什么感觉。这是一种比我们的身体古老五千万年的身体。一种适应海洋的身体,可以毫不费力地在沉重的深海中移动,用纯粹的体量抵御寒冷。作为一只鲸鱼,你可以选择什么时候呼吸,或者不呼吸。大部分时间你都在屏住呼吸。因此,你不能闻到或尝到味道。你没有手可以伸出去触摸事物。你的眼睛是正常的,但阳光很难穿透水。通常你甚至无法透过雾看到自己的尾巴。
如果没有你的耳朵,你将生活在绝望的无名之中。声音在水中传播比在空气中更远且更快,而你的世界就是被声音照亮的。对你来说,海洋的每个黑暗角落都充满了声音。你听到水面上的雨滴声,小虾的嗖嗖声,石油钻井的爆炸声。如果你是抹香鲸,你有一半的生命都在黑暗的深海中度过,通过听觉捕食乌贼。你也像人类一样利用声音交流。但与人类的声音在稀薄的空气中瞬间消散不同,你的声音能够持久。一些鲸鱼的叫声比喷气发动机还要响亮,它们的呼叫能够在海底传播1万英里。
但是作为一只鲸鱼,你是什么感觉呢?你在想什么,你有什么感受?科学家很难知道这些。一些关于你与同类交流的线索来自于观察。如果你出生在一群紧密团结且排外的虎鲸中,你的母亲和祖母会首先教你你的家族名字。归属感一定是至关重要的。 (还记得在电影《救救小威利》中扮演主角的虎鲸凯科吗:当他晚年被释放回到自己的家乡水域时,他没有与野生鲸鱼为伍,而是回到人类中去死。)如果你是一只雌性抹香鲸,你会通过点击声与你的族群成员协调谁在看着谁的宝宝;与此同时,宝宝们也会咿咿呀呀地回应。你不断地游动到新的水域,养成了一种紧张而警惕的性格。如果你是一只公座头鲸,你会在寒冷的极地水域中孤独地唱歌,远离最近的伴侣。然而,认为它们孤独是人类的错误。对于一个声音能够穿越海洋的鲸鱼来说,也许距离并不意味着孤独。也许,当你唱歌时,你一直在交谈。
米歇尔·福尔内特(Michelle Fournet)问道:我们怎么知道鲸鱼真的想与我们交谈呢?她最喜欢座头鲸的是它们的冷漠。“这种动物有40英尺长,重达75,000磅,它对你一点都不在乎,”她告诉我。“它每次呼吸都比我整个存在更加壮丽。”罗杰·佩恩(Roger Payne)也注意到了类似的事情。他认为鲸鱼是唯一能让人感到渺小的动物。
一个清晨,我登上了在加利福尼亚州蒙特雷的一艘观鲸船。水面呈石板灰色,有白色的浪峰。一群小鸟在水面上飞舞。三只座头鲸出现了,它们的背部整齐地凸起出水面。它们露出了一些尾巴,对于摄影师来说很好。尾鳍的崎岖脊线可以像指纹一样用来区分不同的鲸鱼。
后来,我将其中一只鲸鱼的照片上传到Happywhale网站。该网站使用修改过的面部识别算法来识别鲸鱼的尾鳍。我提交的那只座头鲸,尾巴上长满了藤壶,被识别为CRC-19494。17年前,这只鲸鱼曾在墨西哥西海岸被发现。从那时起,它一直在巴哈和蒙特雷湾之间往返于太平洋。一时间,我对这个网站能够如此轻松地从海洋中捞出一只动物并给我一个名字感到印象深刻。但另一方面,我又对这只鲸鱼了解多少呢?它是母亲还是父亲?这只在Happywhale上的鲸鱼真的快乐吗?AI没有答案。我搜索了这只鲸鱼的资料,找到了一系列不同角度的藤壶尾鳍照片。目前,这就是我所能了解的。
本文刊登于2023年10月号。立即订阅。
请告诉我们您对这篇文章的想法。请在mail@ENBLE.com给编辑写一封信。