给人工智能当老师:拉框、拍摄、识万物

  • 日期:09-11
  • 点击:(1447)


阿特拉斯

流水线上的工人已成为第一批教授“人工智能”的老师,了解苹果,桌椅。

8月7日下午,刘燕娜正在为不同类型的汽车拉框架。

河南蓟县千极数据办公室就像一个大型的网吧。

肖像集合场景。记者周小琪

在芒果种后,在河南省蓟县东郊,农民们弯下腰切割小麦。离机械厂,汽车修理厂不远,机器的声音接连不断。但西部的建材广场来来往往。这些天,在广场的三楼,有500人带着眼袋。

在这500人中,有些农民刚从玉米田里冲过来,甚至连草帽都没有时间去接他们。有办公楼的公务员,服装店也有假的购物指南。年轻女孩聚在一起谈论皮肤护理和美容。在角落里,那个肚子大的中年叔叔抽了一支烟,低下头去玩他的手机。

他们依次进入临时工作室 - 一间昏暗的灯光小房间,不到30平方米,墙壁刚刚用椅子,三脚架和照明设备粉刷。

有人指示他们坐在椅子上,面对固定在黑色三脚架上的手机。手机和眼袋之间的距离是25厘米,不多也不少。在每次拍摄之前,一个肤色黝黑,略显胖子,诚实,诚实的员工会拿出录像带并仔细地重新测量它。

方脸员工叫张凯。在测量距离后,他需要在五个不同的手机上用眼袋拍摄这些人。

在不同的光线下,如白光,黄光和暗光,张凯进行了四轮,共增加了100件。一般情况下,他可以在3分钟内拍摄,不超过5分钟。

这项工作被称为“数据收集”,眼袋可以获得价值20美元的塑料桶。收集的照片,声音和其他数据将提供给人工智能公司进行机器培训和学习。

在完成任务后,领导告诉张凯,这次拍摄的500双眼袋将用于测试手机软件,以优化软件的美容功能。但如何测试和如何优化,领导没有说,张凯没有问。

拉一个盒子可以赚4美分

去年夏天,张凯生了个孩子。他放弃了在Shizi工厂维护设备的工作,回家照顾他的妻子和孩子。一两个月后,张凯德重新努力支持他的家人。一家名为“成千上万的机器数据”的公司正在招募人才。 “容易,离家近,薪水高。”

该公司位于县城东侧建筑材料广场的三楼。距离张凯的老父母桥镇仅20分钟路程。他推开公司门的那一刻,空调的冷空气涌进了身体,他面前的场景使他有点震惊:数百名员工坐在棕色沙发上,埋在电脑屏幕前,不断拖动鼠标,敲击键盘,“像一个大的网吧。”

人力资源总监告诉他,公司主要做数据标签。简单来说,只要可以用计算机完成,就可以在图片上构建对象。工资保证在2000,这是更多的工作和更多。

张凯从来没有听说过“数据注释”,也不明白为什么要拉盒子。但公司的环境很好,不像以前那么热,并立即决定留下来。

他被安置在带电脑的工作站上。领导人发送了数百张厨房和餐厅的照片。张凯需要做的是在图片上框架餐具,餐具,杯子,筷子和其他餐具,然后选择属性并对其进行分类。拉一个盒子可以赚4美分。

张凯感觉非常新颖 - 你可以画出这些锅碗瓢盆吗?但是当他第一次到达时,他并没有费心去了解更多信息。

在工作的第一天,张凯拿了几百箱。他不熟悉这些规则。例如,如果三个碗堆叠在一起,他们应该一起拉箱子还是分开拉三个箱子?

一周后,他足够熟练,每天可以抽出数千箱,赚100多元。很长一段时间后,张凯用一个盒子看着所有东西,看到家里厨房里的锅碗瓢盆。他的第一反应是:框架应从哪个角度拉出?拉更多更合适吗?

仅仅三个月后,张凯开始挑战更加困难的3D全景。这些照片都是三维的,有多架飞机,各种车辆,卡车,汽车,公共汽车等。张凯希望将车辆框架并分成几类。

这项工作需要有很好的空间感才能完成。玩“穿越火线”(射击游戏)的经验帮助了张凯,游戏场景也是立体的,经常需要切换视角来观察敌人。张凯并没有太多的努力开始。

工作半年后,张凯已经是公司最好的员工之一,但他仍然没有问过。这些盒子是什么用的? “我的原则是,我可以赚到钱,而且我不必担心其余的事情。”

用眼袋拍摄人物

“数据注释”的工作已经工作了一年,张凯开始接手新的“数据收集”任务。

收集的数据将被打包并上传到人工智能企业。然后,企业将数据分发给其他公司进行“数据注释”,最后将其传回成为计算机学习资料。这些材料可以教计算机区分不同的物体,如车辆和厨房用具,让他们像人一样了解世界。

张凯的第一个收集任务是用眼袋拍摄人物。该公司的要求,卧蚕和黑眼圈都不好,年龄必须在18至40岁之间。

找个人在公司里工作。500多名员工,只要领导在公司尖叫,符合条件,就自觉排队过去。

员工拍摄完毕后,便发动自己的朋友和带眼袋的朋友一起拍摄。此外,公司还联系了各村有声望、有好感的人,并给他们一笔中介费帮助他们寻找。

一开始,张凯分不清眼袋、蚕和黑眼圈。在他看来,所有的皮肤组织都堆积在下眼睑,只有那些喜欢熬夜或变老的人。

为了这次拍摄任务,张凯仔细研究了很多照片,终于搞清楚了三者的区别:眼袋是倒三角形,水肿松弛;蚕是椭圆形的,比眼袋小得多,只有笑黑眼圈是黑色的,是扁平的,而且会像眼袋和蚕一样突出。

但带眼袋的人太少了,一次只能拍十几张。公司决定放宽条件,并让有卧蚕的人也可以参与拍摄,这样每天可以拍摄100多人。

拍摄前,张凯无法回答摄影师的提问。有人问:“照片里有我们正面的面孔。你会用它们做违法的事吗?如果你用它们来换脸呢?”

张凯解释说:“街上的摄像机太多了。如果你能拍几张照片来养颜,在路上走路不安全吗?”

“我们公司是正规公司。蓟县已经开放两年了。对于数百人来说,我们都是大公司。您可以放心。”

参与拍摄的人将成为公司的网络。去年夏天,该公司接手了一个大型项目,一次收集了2万多人的照片。

张凯的同事苏乐丹参加了这个“两万多人的大工程”。这项工程是在一个废弃的二楼工厂进行的。三五十人一组排队,依次戴着墨镜、口罩或帽子,在一楼、二楼或室外转几圈。您将收到印有“千机数据”的火锅。

摄像机固定在工厂的不同角落。苏尔丹的任务是拿一个大喇叭来维持圆圈的秩序,让它们控制适当的间距。

这个项目可以有年迈的孩子参加。苏乐丹叫婆婆来,婆婆不明白她为什么要绕圈。苏乐丹解释说,这是相机的一种焦距测试,用来检测相机能否在不同场景、不同服装中识别出同一个人。

但婆婆不明白。苏乐丹带着婆婆来到村口,指着监控说:“我可以测试一下这能否准确抓获罪犯”,婆婆很高兴。

让人工智能了解苹果

在千机数据成立之前,公司CEO刘阳峰很少听到“人工智能”这个词,他是公司最高的学者之一,今年32岁。当他还是个孩子的时候,电脑还是很少见的。他看了郑少秋的《大时代》,并没有被纵向和横向的证券市场所吸引。他只觉得坐在电脑前敲键盘很酷。中学时,他开始学电脑,第二次专业考试是第一次。

但进入社会后,刘阳峰的作品几乎从未触及过电脑的侧面。他曾在重庆、云南和广东,开挖掘机,卖饮料和化肥。他去过南美洲最远的地方就是卖智利深圳华强北的家用电话。

但他说,做电脑工作的梦想从未破灭。有时候,晚上做梦也会梦见电脑。

从智利回来后,刘养峰和两个发型联手准备商务。去年,这是一次偶然的机会,他们在互联网上看到了一份转移的“数据注释”清单。这是刘阳峰第一次听到“数据注释”这个词。

刘阳峰首先尝试了这个软件并在路上诬陷了一名行人。操作非常简单。但他不明白“数据注释”是什么。互联网上的信息不多。他们大多数人都无法理解,直到你在网页上看到它:

“要理解数据注释,我们必须先了解AI实际上是人类认知功能的部分替代。我们学会了解Apple,有人需要拿苹果告诉你这是一个苹果。类比机器学习,我们有教他认识一个苹果。给它一张苹果的图片,这是完全未知的。我们必须有一个Apple的形象,上面写着'Apple'这个词,然后机器通过学习很多功能来了解Apple照片。“

刘养峰明白了。他把“Apple”的例子告诉了一个小听众,他们都觉得“这件事可以做到”。

自20世纪50年代以来,当美国科学家首次提出“人工智能”概念时,经过60年的技术变革,人工智能逐渐渗透到人类生活中。

手机了解人类语言,车辆学会选择最佳路线,并且可以绕过桌腿捕捉每一片尘埃的扫地机器人进入成千上万的家庭。众所周知的人脸识别技术不仅帮助警方在张学友的演唱会中捕获了许多逃犯,而且还为今年6月失去10年的四个孩子找到了一个家。

刘阳峰并不了解与人工智能有关的技术,但从新闻来看,我觉得人工智能将成为未来科技发展的新趋势。

他们拼凑了10万元,在县里租了30平方米。

一间平方米的单人房从郑州撤回了价值超过1000元的20台二手电脑。然后我们通过微信集团和朋友圈招募了十几名员工。

利用东风的“人工智能”,刘阳峰的名单越来越多,在短短几个月内,公司整整租用了3000平方米,可容纳数百名员工。除嘉县外,我们还在郑州,许昌,平顶山等地设有分公司。

他不再“拒绝来”,一家公司联系他谈论收集项目。内容是让收藏家拍摄地面上的废纸,坚果,发丝,包括猫粪,以培养扫地机器人的视野。刘阳峰拒绝了,“很奇怪,员工不应该每天都要把猫屎贴在肚子上。”

装配线上的教师

现在有500多名员工,其中大部分都像张凯。他们年轻,只有初中或高中教育。他们对计算机,互联网和人工智能知之甚少。

刘养峰招募人才的最重要标准是能够坐下来。不久前,一个小男孩来申请说他已经工作了两年,曾在郑州和苏州待过。刘阳峰直接拒绝了他,“两年可以跑两个城市,表明非常不稳定。”

妇女占大多数雇员,其中大多数是已婚并有子女。

去年5月,刘甘娜看到了朋友圈内招聘电脑操作员的消息。要求很简单:“18至38岁,男女不限,对电脑的理解,雄心勃勃,耐心”,“工资3000至8000,无上限,更多工作”。

刘的第一反应是“欺骗”和“金字塔销售”。在河南中部这个小县城,一个只受过高中教育的年轻女孩,像她一样,只能找到超市营业员,店铺指南或酒店服务员,她的月薪不会超过2000元。直到她转过身来,刘燕娜才解除了她的担忧,成了“网吧”的一员。

当我第一次来的时候,出于好奇,刘艳娜问我周围的同事,为什么框架拉了?没人能回答。大多数人只是低头而不关心他们。直到有一次,领导人在会议期间偶然提到数据主要是“服务人工智能”,她似乎明白了。

8月8日上午,在公司门口,张凯拿了一部手机,正在测试一项新的收集任务。在背光,明亮和正常的光线下,收集的人们表达了快乐和厌恶等表情。当他“惊讶”时,张凯提醒他“眼睛大而大”,“嘴巴张开一点”。

上个月,张凯晋升为监事。他能够在6:30准时下班。现在正好在晚上10点回家。

在为数以千计的数据工作之后,张凯成为了全家最亲密的人。

他的母亲在东莞工厂的装配线上工作,他的父亲在深圳进行装修和地砖。我的弟弟今年19岁。高中毕业前,她去新疆卖手机配件。我的妻子曾经是蓟县一家超市的导购员。去年她生下一个孩子后,她成了家里的家庭主妇。

当我第一次找到工作时,我的家人和朋友会问他这份工作是什么。他的回答是:标签是坐在电脑前拉盒子,收藏是每天拍照的人。其他人,张凯不会多说,家人也不会问。

张凯在长桥镇的一个小村庄长大。每个家庭都种植玉米,小麦和花生。在那些日子里,很少有人知道“电脑”是什么。等中学时,我的同龄人喜欢在网吧玩《梦幻西游》,他不喜欢那个游戏,因为游戏“靠运气,省钱”。他不得不在院子里放一个“纸面包”和一个大理石球。

张凯完成初中后,她和母亲一起去了东莞,然后去了深圳和泉州。他所做的最长的工作就是组装对讲机。四年来,张凯用手指将无数块铁片压入对讲机盒中。这些电池与扬声器,天线和主板一起组成了数千个对讲机,并在全球范围内销售。

苏乐丹和张凯也有类似的经历。 2005年,她带着表弟去广东,在电子厂做品酒,并在宝石工厂传递珠子。每天早上7:30到晚上7:30,她每月休息两天,月薪800多元。

对于张凯,苏乐丹和千极数据的其他普通员工,他们现在收集和标记的数据与通过的珠子和压制电池没有什么不同。它是装配线上的一个组件。

唯一的区别是他们知道珠子如何戴在手镯和项链上,电池和其他部件如何构成对讲机,但他们不知道数据如何被“送入”机器以及机器如何得知。

张凯第一次听到“人工智能”这个词后,他就得到了千机的数据。即使他被提升为主管,他对这项工作的理解只停留在“为人工智能提供预先数据”。

在通往公司的楼梯间,有一些巨大的海报,所有这些都是机器人和电脑,似乎充满了技术。刘养峰还印有“人工智能如何知道苹果”的短语?张凯没仔细看过。

“一切都是人工智能”

装配线上的工人已经成为第一批教授“人工智能”的老师,他们知道苹果,桌子和椅子。在将认知事物的经验集中到图片中后,他们对人工智能变得更加敏锐。知觉。

今年6月,张凯第一次乘坐高铁。他兴高采烈地在高速铁路上向一群朋友发送了一张速度为每小时304公里的照片,并说道:“这件事能以最快的速度运行多少?”

进入高铁站时,张凯拿着身份证和高铁票。在通过需要面部识别的门后,相机扫描了他的脸几秒钟,然后显示“请通过”。他突然想到他曾经用标记来做面部标点符号。它会被应用吗?

两年前,张凯花了8万元买了一辆小型车。旅行时,他经常使用汽车语音系统。现在,他明白语音系统顺利运行的原因是基于大量的语音收集和注释。

当你了解与人工智能相关的新闻时,张凯将打开它。他对“5G时代高科技逃亡者”的视频印象深刻。在视频中,地铁站的监控可以捕获每个行人的面部信息并准确地识别嫌疑人的外观。

偶尔,张凯也有恐惧和恐惧。几天前,他看到有一个品牌的运动鞋可以自动绑鞋带。他无法理解像鞋带这样简单的东西取决于机器。这个人应该怎么做?

“如果技术发展太快,它将消除很多东西。”张凯最担心的是机器将取代流水线上的工人,他们将失业。

2017年,李开复公开表示,“一个人最初执行的工作可以在5秒内对工作中需要考虑和决定的问题作出相应的决定,然后工作量非常大。可以通过人工智能全部或部分替换。“

他预测,在未来10年内,大约90%的翻译,销售,司机,家务等工作将被全部或部分人工智能所取代。 “但仍有很多人具有无法替代的独特品质。此外,由于人和机器有一种新的合作方式,因此会有新的工作类型。“

同年7月,国务院发布了人工智能计划,提出中国应该在2030年成为人工智能创新的核心。工业和信息化部教育考试中心副主任周明曾被告知媒体称,中国人工智能人才缺口超过500万。

张凯觉得像他们这样做数据收集和贴标的工人很难被替换。 “毕竟,机器必须通过我们学习。想象一下,如果机器自己学习,这意味着它们无法控制它们。这太糟糕了。”

刘养峰也想到了这个问题。几天前,在接受电视台采访时,他将人工智能行业与一个人进行了比较,他说:“算法工程师对大脑负责,而我们对四肢负责。”两者都是不可或缺的。公司收集和标记的数据只能通过一组特定的算法处理方式输入机器。该算法是人工智能的核心部分。

毕竟,刘阳峰也担心“我们承担的只是重复性工作”。他认为随着技术的发展,需要10,000张照片数据才能完成研究,也许只有5张照片才能完成,那么,他们的工作量将面临显着的减少。

为了防止这种情况,刘阳峰开始将自己的业务转移到高端和专业。去年,他开展了一项需要案例分析的医疗数据项目。该公司的员工无法做到这一点。他搜索了数十名医学研究生,在网上做兼职。

刘阳峰担心被淘汰。他增加了许多与人工智能有关的学术交流。来自清华大学和北京大学等知名大学的教授和研究生经常更新他们的研究进展或转发研究论文。

刘阳峰的每一条信息都会被阅读,然后转向朋友圈。该小组分发的许多论文都是英文的。刘养峰无法理解他们,所以他用计算机提供的翻译软件逐句翻译。有些文章太专业了。刘养峰只关注摘要和与数据处理有关的摘要。

效果很明显。 “在所有工程师说出它之前,现在我至少可以从专业的角度探讨这些事情,例如数据收集,标签的具体要求等等”。

但是当谈到算法的问题时,刘阳峰没有什么可失去的。有一次,员工辛苦工作了一个星期,完成了一个面部标点项目,每张脸上标有84分,共有张图片。在对接部门被打包并被接受之后,算法工程师说有几个点的位置与算法的要求不匹配。它需要调整,必须重做。刘养峰不得不与员工一起工作一周,并发了一份工资。

在刘阳峰的前世,人工智能是神秘,新颖,遥不可及的。在短短两年内,他发现“一切都可以成为人工智能”。例如,手机中的视频软件,录音的美感功能取决于人工智能,而特殊效果取决于人工智能,推送给用户的内容也取决于人工智能。

与张凯不同,刘阳峰期待未来充满人工智能。在过去的两年里,该公司已经收到了很多无人驾驶项目,并且有无数的路标,交通信号灯和斑马线。看着这些照片,刘阳峰经常想象有一天他可以买一辆无人驾驶汽车,坐在车里,移动他的嘴,告诉系统到目的地,然后回去睡觉,然后汽车将自己送到目的地。

“这一天不会太远。”

记者周小琪实习生梁文学

1

[错误纠正]

负责编辑:

王晓阳