世界经济论坛发布的《2023年未来就业报告》显示,新技术将引发未来就业产生的重大变化。从岗位看,人工智能和机器学习专家将成为增长最快的职业。国内招聘平台的一份报告也给予了佐证:人工智能行业为大学毕业生提供的工作岗位数量激增。
涉及算法、深度学习和自然语言处理的工作,是大型语言模型领域最受欢迎的职位之一。2020年2月,“人工智能训练师”作为新职业被纳入国家职业分类目录。
搭建知识库框架
“2022年双十一当天,京小智帮助店铺节省人力数达128人。”在京小智6 1 8大促服务及营销训练营上,京东商家九阳官方旗舰店客服负责人韩秋霞分享了京小智为店铺创造的价值数据。这并不是孤例,双十一期间,兰蔻通过京小智机器优先模式接待人次达6万,为商家节省成本占比46.47%,相当于节省287人/日,机器参与转化成单率达45.02%……
京小智是面向京东平台商家的智能服务产品,它能模拟真人客服和导购,独立或辅助人工进行服务接待和营销导购,对活动、物流、价保、服务单、尺码等8大高频咨询场景自动化、智能化回复。据了解,京小智的服务已覆盖零售行业超80%的品类,可以为平台商家节省超30%的人力成本。而京小智能完成零售场景的“智”变,离不开人工智能训练师对这一模型的训练与培养。
兰蔻AI训练师认为:“想让智能客服更好地发挥价值,品牌需要深度理解消费者的服务需求,并在此基础上厘清智能服务的链路和重点。”兰蔻智能客服通过订阅京小智的行业知识库,能够有效覆盖护肤、美妆领域的常见问题。当用户从商品页进入咨询页,京小智可以根据商品SKU所属行业,在对应的行业知识包自动检索回复。
自动化、智能化回复客户问题是智能客服产品的基础功能,为了实现这一功能,人工智能训练师首先要对各行业知识库体系进行梳理,并搭建出知识库框架。“针对不同品类的商品,客户的问题有共通之处,也有差异之处。”京东科技AI训练师吴瞳用苹果和格力两个品牌举例,“这两个品类有共通的问题,例如产品上市时间、物流、价保等,也有差异比较大的问题,例如手机的触屏功能和空调的耗电量等。”人工智能训练师通过不断收集和梳理数据,让人工智能模型逐渐掌握用户的高频问题及标准问法,并对其进行准确回复。“这一过程中,还需要与商家沟通,反复核对内容,查漏补缺。”吴瞳说。
数据标注与算法训练
人工智能训练师通过对文字、语音、图像、视频等数据进行标注,实现数据分类。
过去,互联网平台上的内容审核主要靠人工完成。随着内容更新速度越来越快,数量越来越大,人工审核的难度大大增加。这时,就需要人工智能的系列算法来解决这一问题。
“现在最流行的是深度神经网络算法。”冯金在京东负责利用人工智能进行内容审核工作。据他介绍,深度神经网络算法分为训练和推理两个流程。
以图片的内容审核为例,在训练环节,冯金会预先收集大量图片,通过人工标注,对图片进行违规或合规的分类,再将标注好的结果交给深度神经网络进行学习训练。
理论上说,训练好的数据集越大,深度神经网络就会越“聪明”。
但出于成本考虑,人工智能训练师会根据任务的难易程度来决定初期标注的体量。“在违禁品中,枪类是一种高辨识度的品类,可以通过枪口、弹夹等结构进行判断。但线条相对简单的刀类就比较难辨别,深度神经网络会将同样是长方形的木片、金属条等辨别为刀类。”针对测试过程中出现的刀类召回率高但精准率低的情况,人工智能训练师通常会在数据集中加入更多样本,以提高精确率。“比如,我们会将非刀类标注为‘不是刀’,对系统进行完善。”
标准训练是一个迭代的过程,标注完成后,模型就会对新的图片自动判断,这一过程就是深度神经网络的推理过程。
对于人工智能训练师来说,不同的算法在应用时的难点也不同。有些任务的难点在于数据收集。“还是以图片的内容审核为例,违规图片本身出现的概率较低,因此它的收集难度就会增大。”有些任务的难点在于算法训练,“比如一些较难分辨的品类,我们需要调整神经网络的网络结构,以及损失函数训练目标相关参数。”对于一些对人工智能模型精准度要求很高的实际应用项目而言,人工智能训练师的工作难度体现在各个环节。“需要通过多轮迭代,不断完善数据集,不断测试,来提高精确度。”冯金说。
性能与执行代价的平衡
作为数字职业之一的人工智能训练师团体的兴起,反映出人工智能从研发走向行业应用以及传统产业智能化、数字化转型的过程。
目前,我国人工智能已广泛应用于城市管理、金融、零售等诸多领域。“人工智能缘起于学术界,在学术领域,研究者不断追求极致的人工智能模型准确度。但在工业领域,性价比是大家普遍关注的问题,如何找到人工智能模型性能与执行代价的平衡,是当前面临的首要课题。”
更高质量的数据获取及人工智能模型的自动迭代,也是目前在技术层面亟待解决的问题。“此外,侵犯个人隐私、数据信息伪造、算法歧视等与人工智能发展相伴相生的社会问题,更需要整个社会的约束。”
随着人工智能在各行业应用领域的不断拓展,人工智能训练师这一工种仍存在较大人才缺口。据测算,我国人工智能领域人才缺口已达500万人。“做这个行业,首先要打好基础,人工智能本质上还是要运用数学和计算机领域的基础知识;其次,是要多动手进行实验。”
冯金说,想要跨专业从事人工智能的新人,要将自己的专业和人工智能有效结合起来。
人工服务思维与机器服务思维往往存在一定的思维偏差,想要应用智能化系统解决业务问题,需要站在业务运营角度,通过参数调整、模型训练、话术调优等一系列优化动作,让机器人能够变得越来越聪明、人性化,最终提升客户对服务的满意度。
优秀的AI训练师可以让智能模型产品与业务实现良好的耦合,让智能模型发挥更大的价值。要想实现这个目标,AI训练师要具备AI技术理解能力、数据以及问题分析能力、解决方案制定能力等全面综合的能力。这些,正是AI训练师这一职业的发展方向。