发布日期:2025-07-17 22:31 点击次数:200
>>专家简介股票平台哪个好
郭松涛,西北大学生命科学学院教授,博士生导师。研究工作共得到20余项科研项目的资助,其中主持国家自然科学基金面上项目4项、教育部霍英东青年教师基金1项、王宽诚基金资助1项、美国灵长类保护基金1项、教育部博士点新教师基金项目1项、陕西省自然科学基金项目和陕西省高校自然科学基金各1项。还作为研究团队骨干,参与了国家基金重点项目、国家级和省部级项目十余项。2010年获陕西省科学技术奖一等奖一项(第二完成人);2018年获陕西省杰出青年基金项目资助;2013年获陕西省青年科技奖一等奖和陕西省自然科学优秀论文奖一等奖;获2010全国百篇优秀博士论文提名奖;2009年度全国优秀青年生态工作者称号。联合指导1名新西兰梅西大学硕士和1名博士,独立指导美国密西根大学富布莱特项目本科生。迄今指导动物学和生态学的10余名硕士,独立和联合指导博士5人,毕业3人。
在动物学领域,个体识别是开展动物行为和动物生态研究的基础,但是,如何高效、精准地识别动物个体却是一个困扰了科学家们近百年的难题。
从“人盯猴”的数据采集方式,到利用红外相机拍摄的图像(或视频)来识别动物个体,研究和保护动物的方式一直在进步。更让人欣喜的是,西北大学郭松涛团队发布开源AI框架,实现动物行为智能识别和自动量化,当前,AI猴脸识别技术得到广泛关注。
展开剩余88%近日,华商报大风新闻记者专访了西北大学生命科学学院教授,博士生导师,陕西省动物学会副理事长,国际灵长类学会会员,中国动物学会灵长类学会常务理事兼秘书长郭松涛,为大家详解这项最新技术。
已开发了猴脸识别小程序
华商报:请您介绍一下AI猴脸识别技术是如何使用的?
郭松涛:AI技术其实也有很多种,猴脸识别属于计算机视觉范畴,是生物特征识别技术的延伸,核心技术是利用AI算法(如卷积神经网络)学习并提取猴子面部独特的、稳定不变的特征信息(如纹理、斑点、轮廓、骨骼结构),建立可区分不同个体的“面部指纹”。通过图像采集设备,多角度、多场景采集大量不同个体的面部图像、视频等,用于训练,让AI学会自动提取特征并匹配或识别个体。算法本身需要算力支持,因此是部署在高性能服务器上,终端设备更多是承担收发数据作用。我们已经开发了猴脸识别小程序,只要在微信小程序中搜索“猴脸识别”,使用微信一键登录即可体验。
数据采集需克服多重困难
华商报:猴脸识别比人脸识别更难还是更简单?猴子“反侦察”怎么办?有没有“不配合选手”拖后腿?
郭松涛:猴脸识别难度更高。首先是数据采集,如何找到猴子?野生动物踪迹比较难发现,找到方便观察的稳定的猴群后,如何辨认个体?猴子无法说话,也无法交流,只能靠研究人员利用经验和某种可观察特征逐一记忆辨认,这一步很困难,很多时候,其他的物种完成物种识别深入到个体识别时,就卡在了这一步。个体也辨认清楚了,如何获得能区分个体的高质量数据?到了这一步基本意味着,研究人员能靠近猴子本身,这样才能采集有足够细节和清晰度的面部影像数据,但是靠近动物这件事本身,又是一个巨大的挑战,需要经过长期的习惯化适应。最后是前面的过程都克服了,解决了,猴脸区域有很多的毛发,干扰较大,且猴子个体也十分相似,简单的套用人脸识别算法根本行不通,需要设计专门的算法。不配合是常事,配合才比较罕见,因此多个体、多角度、多场景的数据十分重要,让AI在大量的数据中找“规律”,磨炼它的特征提取能力,后续通过迁移学习等技术,可以快速适应新个体的识别应用。
AI识猴脸比人类肉眼更厉害
华商报:AI能“看”到猴子脸上的哪些细节?比人类肉眼更厉害吗?
郭松涛:AI能逐像素查看图片细节,比人类肉眼要厉害。首先我们明确一个概念,任何经过图像设备采集形成的照片、视频,其本质都是一个巨大的数据矩阵,视频也是由一帧帧的图片组成,比如电影常用的帧率是24,就是一秒钟连续播放24幅图画。这其中每一幅图画,是有三个不同的颜色矩阵叠加而成,常见的是红绿蓝,常称为RGB色彩。假设一张常见的1080分辨率的图片,长宽比一般是1920:1080,这意味着有三个这样的颜色矩阵叠加在一起,这个叠加矩阵上的1个点就是1个像素,每个像素都有3个值,每值的取值范围在RGB色彩下都是0-255。AI就是通过逐像素计算这些数据,找出每个个体的面部区域轮廓、皮肤纹理,局部斑块形状等独特身份特征,这比人类的眼睛要厉害得多。双胞胎猴子也是有差异的,按照上述方法,分清个体没有困难。
未来能精准“认出”动物园每只猴子
华商报:除了科研,这项技术能帮普通人和猴子“对上号”吗?比如去动物园能扫码查猴哥“身份证”?
郭松涛:这完全可以实现。我们的技术在识别猴子身份这件事上已经没有问题,但具体用在什么物种,什么场景上,还需要看具体的情况。如果是动物园,可以提前准备好猴子或者是其他物种的个体数据,经过训练得到专属的动物园AI模型,游客就可以使用我们的小程序提供的接口直接使用拍照使用,精准认出每一只猴子的名字,以及与这个名字相关联的信息,如身高、体重、父母亲、配偶等,了解其生平史、家族史、族群史,极大地提高游客游览体验和代入感。我认为这在以后一定会成为动物园游览的主流模式,由AI提供技术支持,由游客自主定位和发掘动物信息的全新游览模式。
金丝猴面部动作也在表达情绪
华商报:AI是否有“读心术”?能在一定程度上读懂动物的情绪?
郭松涛:灵长类有近50%的面部动作与人类相似,这源于我们作为哺乳动物的表情肌肉和脑神经发育的同源性。从金丝猴本身来看,雄性金丝猴常用“张大嘴”的表情,虽然在人类看来是恐吓,但我们发现它也有安慰的功能;当其他个体死亡后,周围的金丝猴会在旁边像人类默哀一样,表现出低眉顺眼很悲伤的样子;有时候它们也会避免直视,这并不是“害羞”,可能是示弱。要同周围环境结合起来定义表情的功能,是非常复杂的。
首先,我们利用深度学习技术对动物面部识别模型进行训练,利用AI通过扫描动物面部来实现个体的身份识别,有点像我们人脸识别,然后我们在对不同物种识别的基础上,还进一步发展了对个体的识别。
第二种是通过动物骨架识别,但并不是它真正的骨骼,而是一种骨架模型的算法。
第三种是光流影像识别,就是通过影像每一帧的变化来进行识别,这是通过动物独特的个体形态和动作特征来实现个体识别的。
这些技术的实现和初步应用,部分打通了智能化监测的技术路线,同时也为动物监测智能化保护时代的到来奠定了一定的技术基础。
未来可能会有“猴语词典”
华商报:AI能翻译猴子“骂人”吗?未来会不会有“猴语词典”?如果有,这项技术可以用到其他动物领域吗?
郭松涛:这在技术上是完全可行的。就像AI识别猴子前,人要能认识猴子一样,翻译猴子语言也需要人先读懂猴子语言。金丝猴的“语言”本身比较简单,比如天空出现威胁和地面出现威胁,看见了的猴子会发出不一样的有规律的声音。其他物种如长臂猿,则“语言”更加丰富多样,目前已经有研究团队利用它们的声音实现了个体身份的识别,再进一步就是声音的识别。这项技术在人类当中就是语音识别,已经相当成熟和普及。AI翻译猴子的“语言”,难点同样是在辨别声音内容和收集声音数据上,这需要研究人员还有动物爱好者们一起努力,将其逐渐破译出来。我觉得未来不仅是“猴语词典”,而是“动物词典”,不仅通过声音,还可以通过行为来分辨动物的身份和意图,让人类能读懂大部分动物的“语言”。其中行为识别技术已经发布,其余内容我们团队也有技术储备,在合适的时候,会向大家公布我们最新的研究成果。
下一步这项技术将用于更多动物
华商报:如果换成其他动物,比如大熊猫、藏羚羊等,这项技术能“跨界”使用吗?
郭松涛:可以跨界使用。只要像采集猴子的数据一样,把目标物种的个体数据采集好,针对其特殊的群体形态或者结构特征进行AI模型微调,即可实现。比如大熊猫主要是黑白色,且全身、包括面部都有毛发覆盖,那我们就要提高模型对于非彩色轮廓、纹理细节的提取能力。如果是藏羚羊的话,我们可能要考虑角的形状纹理对识别正确率的影响,同时,有蹄类动物的头面狭长,五官分布于两侧,我们可能要加强头面两侧特征对比,确保能将同一个体的特征对齐。这些都有可行的技术方案,调整起来的难度是可预期和可解决的。
灵长类动物的行为最为复杂,如果能够解决灵长类相关的识别和监测问题,相对其他动物来说就简单多了。我们目前的研究涉及了实验猕猴、实验鼠,以及经济动物猪、牛、羊、鹿,还有其它一些重点保护动物,比如虎、豹、熊、羚牛、斑马等40多种野生动物。技术主要应用在保护区、动物园、学术研究的实验室以及科普基地,可以对野生动物进行个体识别和个体监测等,毕竟这比人工进行个体识别要方便和准确得多。
我们下一步的计划就是要打通这些技术链路,打造先进的动物身份识别、行为识别和定量以及整合生理自动监测技术,实现对动物的智能化监测和管理,这也能有效提高我们对动物本身生理活动的认知能力。未来,我们期望能够将这些技术应用于养殖行业,更大地赋能这些行业的发展,极大地节约成本,提高生产效率。
该技术在一定程度上可避免被滥用
华商报:如果AI能精准认猴,会不会被“坏人”利用?比如追踪野生动物做非法交易?
郭松涛:精准认猴的前提也是需要大量的数据训练,即使是新的个体,也需要一定量的图片作为模板。这意味着猴脸识别技术即使可以通用于不同物种不同个体,但其训练数据层面还是存在着区域和物种特异性,这些是需要研究人员去调整的,这本身就可以在一定程度上避免技术被滥用。当然,任何事情的解决,仅靠单方面的力量都很难甚至是无法完成。同样的,要想杜绝野生动物非法交易,需要我们每一个人都参与其中,积极主动了解、宣传和执行相应的动物保护法律法规,不要仅把它们看成是可以予取予求的资源,而是要正确的认识野生动物对于我们人类的价值和意义。任何技术都有其两面性,我们要做的就是正确地将它用在积极且正向的一方面,并且确保积极且正向的力量一直强大,才能最大化技术带给动物的正反馈,帮助它们生存繁衍。
需要学懂这两个领域的知识
华商报:如果年轻人想从事上述工作,需要哪些“超能力”?需要学好哪些学科?
郭松涛:“坐得住板凳,受得起压力,破得开阻力”。对于生命科学领域的研究者,他可能不熟悉计算机科学的知识,反之,计算机科学方面的人才可能不了解生命科学领域的知识。这对研究者提出了更加严格的要求,需要对这两个领域的知识都有涉猎甚至精通。我们团队的博士生刘佳就是一个很好的例子,他本身是生态学专业,之前从事野生动物监测工作时就遇到过数据量大、物种识别繁琐、统计繁琐低效的困难,当时他就迫切的想要寻找到一种新技术、新方法能解决这些问题。最终他接触到了AI识别这种高效精准的技术,并选择加入到了我的团队,几乎是从零开始学习AI相关理论、技术和编程实践,在长达2年时间里,能做到坚持每天推进学习进度,深度参与猴脸识别后续技术的优化与升级,这其中的困难和阻力是肉眼可见的。但他在团队提供的资源和平台的帮助下,已经成长为跨学科专业人才,我们5月份发布的行为识别技术,整个项目的实验方案设计、数据采集、代码编写、后期优化等股票平台哪个好,他都是绝对的主力。在我们团队系统的培养体系下,除了他,团队的AI方向还有其他的博士、硕士,并且各自取得了相当的进展,未来会有更多的跨学科人才成长起来,投入到野生动物保护领域。 华商报大风新闻记者 任婷
发布于:陕西省