985硕士进厂做数据标注,自嘲像个“包领班”

作者: [db:作者] 分类: 随心杂谈 发布时间: 2025-02-28 09:08
作者: 黄依婷编纂: 卢枕2020年11月,黄土高原以南、关中平原以北,宜君县进入暮秋,年夜地的黄色与枯木的灰色交叠,阿娟开端了她的新任务。这份单调的任务有着一个听起来很洪亮的称号——“人工智能练习师”,是2020年2月才被正式归入国度职业分类目次的新职业。但谈起数据标注这份任务,在之前的两三年间,平日跟“低门槛”“欠兴旺地域”“休息麋集型”等名词绑定在一同,从业者们对主动驾驶、人工智能多少乎不懂得,只是机器所在击鼠标,实现义务。(图/unsplash)2023年后,以ChatGPT为代表的天生式AI爆火,人工智能开展进入新阶段,数据标注的职业也有了一些新变更。这一年,“985硕士”刘到闲转行去做数据标注,互联网年夜厂正编,月薪1.5万元以上。不像县城的标注员坐在工位上一终日,刘到闲九点半下班后,要对接产物、算法团队的数据练习需要,解答数据标注团队提出的疑难,年夜局部时光花在年夜巨细小的相同与探讨上。实质上,刘到闲跟阿娟的任务不差别,她们都是AI的人类教师。跟着行业变更,越来越多像刘到闲一样的高学积年轻人抉择成为AI练习师,但阿娟们的担 忧是,数据标注任务的请求越来越高,她们会不会得到本人的任务。AI的“985教师”刘到闲的任务目的,是把AI教成一个专家。这就像培育一个小孩。一开端,是阿娟们教给AI最基本的常识,什么是鸟,什么是花,什么是车,让AI能懂得最常用的话语。到了通用年夜模子,则像是AI去年夜学里接收通识教导,控制人类天下那些通行的、片面的常识。但假如想让AI实现人类的任务,就须要教给它更专业的常识跟技巧。培育一位专家并不轻易。一方面,刘到闲须要对接“用人单元”,在公司里则是产物团队,晓得他们想要什么样的人才,到达什么样的请求,刘到闲再依据对方的需要去制订培育打算,拔取适合的课本,还要编写考察的试卷,并对AI的答卷打分。 开展全文 教AI进修的进程是漫长的,任务量宏大,也不克不及只靠刘到闲一人,她还须要把制订标注的规矩,把专业的常识“翻译”成明白话,让不实践常识的一线标注员也能轻松懂得。某种水平上,标注规矩的可操纵性,是考核一位专家型AI练习师的中心尺度。(图/unsplash)如许的用意断定进程濒临于人跟人之间的交换,有很强的客观性,假如直接交给一线标注员,可能懂得各别,假如招致模子练习偏向,纠错本钱十分高。而一份高可操纵性的标注规矩能极年夜水平地增加偏差,进步数据品质。为了满意需要,刘到闲起首要厘清用户用意的种别,并尽可能细致地罗列出来,而后给每个种别付与清楚的界说,明白差别分类之间的界限在那里。比方,用户说“我很悲伤”,她在标注规矩中写上,这是在追求感情支撑;用户描写了一件生涯中产生的高兴事,她会将这界说为分享团体生涯。懂得天然言语交互中字与字之间的奥妙差别,是刘到闲善于的事。往年28岁的她是985高校结业的言语学硕士,曾在科技媒体任务过一年,由于对媒体任务24小时待命的厌倦,她开端寻觅让创作与科技联合的另一种可能性,比方“豢养AI”。

如果觉得我的文章对您有用,请随意打赏。您的支持将鼓励我继续创作!