位置:碼王論壇 > 科普 > 正文 >

未來可期?數據標注從業者:我在為人工智能添磚加瓦

2019年09月15日 11:51來源:未知手機版

遙控飛機什么牌子好,秀才遇到兵粵語,周玉蔻大罵康熙來了

人工智能時代,數據標注已經成為一個新興產業,其上下游相關業務涉及機器學習、虹膜識別、人臉識別、無人駕駛等技術。然而數據標注真正的核心是大量人力投入的標框工作。

战神出品四肖八码目前關于數據標注行業的研究還較為缺乏,更多的是媒體調查報告對該行業的描述。比如,諸多媒體都將該產業定義為勞動密集型,也通常將它與富士康進行類比,稱其為“人工智能領域的富士康”。

战神出品四肖八码作為長期觀察中國互聯網產業發展的一員,我對這個“人工智能領域的富士康”中的從業者群體產生了極大的興趣:他們究竟是誰?他們真的是人工智能時代的流水線工人嗎?

战神出品四肖八码圖1: 正在標注中的“產教融合”實習生們。文中圖片均由作者提供

在對貴州的“未來”數據標注公司進行為期一周的前期田野調查過程中,我發現,未來公司的從業群體畫像與已有媒體報道有所不同:未來公司的高級管理層以未來職業學院的老師為主;中級管理層以該校畢業的學生為主,其中少部分是來自貴州其他院校的本科畢業生;公司里的標注員基本上是來自貴州二十幾個院校“產教融合”的實習生以及部分社招人員,其中以未來學院“產教融合”的實習生為主。

標注員一般分為四類:全職的中層管理者,頂崗的實習生,跟崗的實習生和半工半讀的學生。頂崗實習生大多是因應教育部的產教融合模式而產生的為期一年的大三實習生。跟崗的多為僅三個月實習的大二學生。半工半讀的實習生多為未來學院的少數民族貧困生。

據未來公司的一個項目組長小劉介紹,一條數據標注一般由數據標注員、初審員、終審員三個人共同完成。系統會隨機派發詞條給數據標注員,標注員完成標框以后,會由對應的初審員審核,再交由終審員審核,最后提交系統。這三者的比例是5:1:1或6:1:1。

也就是說,一個終審員對應一個初審員和五到六個數據標注員。三者之間存在連帶關系:初審員和終審員的薪資按照他們手下標注員平均工資來計算;如果其中一個詞條連續三次出現錯誤的話,系統會自動回收詞條,負責的組長也會找小團隊談話。

战神出品四肖八码數據標注實習生的身份認同:90后?少數民族?

战神出品四肖八码在去往貴州的路上,我不可避免地充滿了許多關于少數民族的想象,甚至一度將它作為田野觀察中的一個重要標簽。有趣的是,盡管未來公司過半的實習生是少數民族學生,在為期一周的前期觀察中,我居然有一種未能抽離日常教學工作的觀感:似乎我面對的仍是上海的大學課堂上的那班95后學生。不管是對于工作的認知與自我定位,還是對于未來的想象,這些少數民族的95后學生自始至終將“90后”的身份認同優先于民族身份認同。

战神出品四肖八码圖2:數據標注員們正在就餐午休。

未來公司的另一個項目組長小回告訴我,“現在80后是社會頂梁柱,90后賺錢資歷不夠,有點心高氣傲的,就業和擇業選擇性比較強,所以比較尷尬……其實我們現在90后除了錢還是錢……情懷是什么東西就不知道了。你看以現在的物價,結婚就是二三十萬,我要工作多久才能賺到20萬?……不管你是哪個民族,目前我們最重要的目標就是賺錢。”

“為自己干”是我在訪談過程中聽過最多的未來公司的文化。比如公司的標注員小布就不斷強調公司并不要求實習生加班,大家都是“自愿”加班:有些女孩子為了拿到一個月一萬多的計件工資,甚至會選擇每周工作七天,每天工作11個小時。

批判學研究往往會將這類敘事方式看作典型的“自我剝削”(self-exploitation)的一種外在形式——公司或管理者通過授予文化工作者一定程度的創作自由和空間,諸如掌握自己的工作時間、地點和形式等,并對員工進行“自我管理”的培訓,用以控制他們。公司和管理者往往通過這種方式將風險和責任下放到個人身上。

本文地址:http://chengrj.cn/kepu/192723.html 轉載請注明出處!

今日熱點資訊