“猪叫识别”,让你足不出户在家轻松养猪

“猪叫识别”,让你足不出户在家轻松养猪

全文共3072字,预计学习时长8分钟

图片来源:Unsplash官网(by Pascal Debrunner)


也许在某些人看来,人工智能落地听上去就像是个笑话。

“人工智能”的概念自1956年达特茅斯会议上第一次被提出以来,似乎就一直停留在概念层面,只有少数研究它的人一听到它就像被打了鸡血一样兴奋,普通老百姓可能唯一能想到的就只有打败世界围棋冠军李世石的那只“α狗”。

人工智能不知怎么的好像变成了少数人的知识特权,对大多数人来说却像是阳春白雪般遥不可及,不能雅俗共赏。

但当养猪用上AI,这似乎足够接地气了。


Oops,21世纪养猪都开始用AI了


昨天,毕业后许久不发动态的直系师兄突然转发了一条题为《京东数科签下中国智能养殖第一大单 助力元宝枫养殖千万头AI猪》的推送链接。

点开一看,映入眼帘的就是“京东数科旗下京东农牧与成都元宝枫农业开发集团有限公司签署了智能养殖和数字农业项目合作合同,合同总金额达2.06亿元,这是迄今为止中国智能农牧领域的第一大单”。


图片来源:新华网客户端


前不久才在第二届数字中国建设峰会成果展览会上亮相的“猪叫识别”技术,这么快就商业变现了,这波输出操作简直太过迅猛。

古有神农炎帝尝百草,今有AI神农医百兽。当中国传统神话与普通人眼里的“AI神话”在21世纪碰撞结合,可能就一不小心催生出一些富有时代特色的文明新产物。

京东数科通过与中国工程院李德发院士合作,建立起京东农牧院士研究院,开发了一套包含“神农大脑”(AI)、“神农物联网设备”(IoT)、“神农系统”(SaaS)的智能养殖解决方案。据称,“神农大脑”中存储着全世界现有的全部养猪方案,这就不得不承认它确实是名副其实的“养猪专业户”。


图片来源:京东农牧官网


在普通农户还在纠结猪哼来哼去是不是没吃饱的时候,“神农大脑”可能已经精准判定好了猪饲料的分量和配比,甚至可能还知道它“哼哼”只是因为尾巴上有只跳蚤在痒痒挠。

除此之外,这颗“神农大脑”还连接着巡检机器人和饲喂机器人,可以说它不仅是个合格的兽医和养猪专业户,还是个全天24小时全程服务的贴心保姆。猪圈里冷了,加温。猪饲料少了,加餐。

京东数科首席经济学家沈建光先生就曾表示,到2035年,人工智能将带来真正意义上的无人养殖场、无人种植基地。这似乎预言得并不怎么过分。


AI养猪背后的“声纹识别”技术


京东数科的此次成果展上,最引人注目的莫过于“神农”方案背后的“声纹识别”技术。

“猪的叫声其实分很多种,平时是‘哼哼’,寻觅伴侣时‘呼噜呼噜’,身心舒畅的时候也会发出满足享受型的‘哼唧’,京东数字科技在做的事情,就是从叫声来探测猪的身心健康状况。”

AI神农摇身一变成了AI神医,通过机器判断猪咳嗽的频率和声音状态,这可不就是名医才能做到的“闻”声诊病么?


图片来源:SOOGIF网站


此等神奇的“声纹识别”诊断术背后到底运用了怎样的技术原理呢?

声纹识别是一种生物识别技术,计算机通过采集声音信号提取语音特征,由于声音和指纹一样,每个人各不相同,所以通常被用于验证说话人身份。当然也可以像京东数科这样另辟蹊径,通过将小猪的咳嗽声与数据库中海量的猪咳嗽声进行比对,从而诊断小猪的健康是否存在异常。


计算机处理的离散声学信号


大多数生物识别系统中广泛存在的两个通用概念为1:1和1:N。在声纹识别技术中,1:1主要指的是说话人确认(Speaker Verification),它需要事先录入声音信息并将其存储为声音模板。当需要识别时,系统会将输入的声音特征与存储的声音模板特征进行比对,从而判断两者是否是同一个人。

1:N主要指的是说话人辨认(Speaker Identification),系统中提前存储了丰富的声音信息,当有声音输入时,它通过将其与声音库中的声音数据进行比对,从而判断说话者是谁。


说话人验证和说话人识别


京东数科将“声纹识别”技术应用于智能养殖不可不谓是一项创举,从而也让我们看到了“另辟蹊径”的无限可能性。


声纹识别系统的工作过程


具体到技术细节,主要包括特征层面和机器学习模型层面。特征层面常用的经典输入参数主要有梅尔倒谱系数MFCC、感知线性预测系数PLP、深度特征Deep Feature以及能量规整谱系数PNCC等,当然也可以将其进行组合在特征或模型中使用。

就机器学习模型而言,N.Dehak在2009年提出的iVector(身份认证矢量,identity vector)框架仍然占据主导地位,在深度学习神经网络权势熏天的当下,声纹识别也不免受其影响。iVector通过将语音映射到一个固定且低维的向量上,可以将机器学习的各种算法充分吸收到声纹识别技术当中。

基于此,传统的UBM-iVector框架消化吸收了神经网络的优势,前端使用DNN(或者BN)替换MFCC来提取特征,或者也可以将其作为MFCC的补充,后端学习框架则继续沿用iVector。


声纹识别算法的完整训练及识别框架


在一个完整的声纹识别系统中,最重要的环节包括iVector模型的训练以及随后的信道补偿模型训练。由于iVector模型中既包含声音信息也包含信道信息,而我们只关注声音信息,因此就需要做信道补偿,信道补偿中目前最好用的是PLDA算法。


在特征提取阶段,可以使用DNN模型提取BottleNeck等特征来代替或者补充经典的MFCC特征,并将提取到的特征输入到iVector框架中进一步对模型加以训练。


使用BottleNeck功能训练iVector模型


从整个系统层面来说,如何将特征和模型完美结合并从多维度去刻画声音信息,将需要各个子系统的协同配合,这其中的每一环都将是研究人员可思考的技术优化方向。

值得一提的是,声纹识别需要建立足够庞大的声音数据库,因此它实际上还是一种基于数据驱动的模型,在人工智能和大数据的大环境下,这既是挑战也是机遇。

对于像京东数科这类大公司来说,足够大的平台可以获得足够多的数据,如果再有足够强的算法和足够高明的远见一并加持,那么在行业里遥遥领先甚至一家独大都不无可能。


新时代AI青年的使命与情怀


遥想曾几何时听说师兄在看“猪咳嗽”的相关论文,大家还调侃说怎么东哥不卖电子产品,开始搞畜牧业了。结果一波操作猛如虎,这行动力简直让人不得不佩服。

调侃归调侃,实验室小群里也曾看师兄晒过周末去养猪牧场实地考察时和小猪仔的亲密合照。明明去做算法工程师的师兄,却经常需要“下乡”去采集数据。明明是人人眼红的高薪算法岗,却不曾想也会如此近民生、接地气。


图片来源:Unsplash官网( by Franki Chamaki )


互联网时代巨大的人口红利让一众ToC企业盆满钵盈,好像随时随地只要“操控”流量就能日进斗金,这让很多年轻人拼了命地往互联网行业里挤,畅想着整天坐在办公室,喝着星巴克。

然而,在人口红利逐渐减退的当下,或许去ToB企业踏踏实实做技术的深耕者和领域的拓荒者才是年轻人该有的选择。而人工智能的落地,无疑是ToB企业未来绝对的开垦方向。

百度CEO李彦宏先生说,未来没有一家企业可以声称自己跟人工智能无关。

不论是今年数字中国成果展上亮相的京东数科“智能养殖系统”和“城市操作系统”,还是去年百度世界大会上亮相的L4级别无人驾驶乘用车、“农业遥感智能检测系统”以及打造“ACE王牌”的智慧城市计划,都在向这个时代证明,AI不再只是一个前沿理念,它已充分向我们展示了它的社会价值和可怕的发展潜力。


图片来源:Unsplash官网(by Hitesh Choudhary)


在陌生的领域开疆扩土可能并不容易,也可能不会像ToC企业那样在人口红利的温室中坐享其成,但就像京东数科CEO陈生强先生曾说,做行业里最脏、最苦、最累、最难的活,一定是最有价值的事情。

我们这代的年轻人,既不畏惧“到西部去、到基层去、到祖国最需要的地方去”,也勇于扎根到最需要落地的技术领域中去,不怕吃苦、敢为人先。

我想,走在科技前线的AI青年,这样的情怀一定都有。



留言 点赞 关注

我们一起分享AI学习与发展的干货

欢迎关注全平台AI垂类自媒体 “读芯术”