Beijing Spring 欢迎光临 北京之春   快速通道 月刊首页 - 《北京之春》月刊 - 资料文集 - 北春新闻中心 - 订阅与支持 - 首页

 推荐新闻
· 高尔泰:阮铭先生
· 高尔泰:苏绍智先生
· “乌克兰逻辑”可以保卫.
· 胡平:从单极世界到多极.
· 哈佛应该多收富家子弟吗.
· 蔡詠梅:“寧要哈維爾,.
· 许章润 :语言的公民及?
· 美國霸權終結 民主主義?
· 林培瑞:美国的“政治正.
· 胡平 | 米奇尼克:人·?
· 对中国科技的战争如何适.
· 重读李志绥,重估毛泽东.
· 徐賁:“反右” 创伤记?
· 一位流亡拉斯維加斯的中.
· 郑义 | 召魂
· 艾晓明:黑暗时代的星火.
· 胡平:三中全会公报出台
· 了解 “分裂”的美国的?
· 繁华渐逝:腹背受敌的中.
· 程铁军:怀念苏绍智夫妇
· 公民抗争的三大成功要素
· 中國民間歷史運動遠超出.
· 徐友漁:我們不必絕望
· 徐友漁:從牛津大學到北.
· 台灣大選,需要看的幾本.
· 星火不熄:中国地下史学.
热点新闻
<> 反制共軍 我建置7大打擊武器
<> 南非出现新冠变异程度最大毒株
<> 建立道德评议机制 文艺界要大清洗
<> 大午案二审今日宣判
<> 法与澳首次推出2加2联席会议机制
<> 菅义伟动作自救保位引自民党大地震
<> 美国悬赏5百万美元缉拿中国毒贩
<> 獻花市民遭票控「亂拋垃圾」
<> 预料明年港人移民潮续增
<> 紐西蘭永久收藏香港抗爭物品
  图片新闻


写给2025届新生的信触目惊心


IMF下调全球经济增长预期


深圳日籍男童遇袭案 日媒:凶手已伏法


关于教宗方济各你未必知道的五件事


“习近平像黑帮老大一样”


特朗普堅持與習近平直接談判


林佳龍:外交部半數業務費遭凍


贸易战对美国的杀伤力远大于中国


中国学者向松祚:这是国运之争


美国司法系统是否成了北京工具?


中国是如何掌控全球稀土产业的


认定实验室泄漏为新冠病毒真正起源


特朗普释放缓和信号


穿透中国黑暗统治的一束光

新闻首页 > 中国报道

 

未来5年将培养5万名AI数据标注师
日期:8/8/2020 来源:网络 作者:网络

百度山西数据标注基地:未来5年将培养5万名AI数据标注师

澎湃新闻记者 吴雨欣

2020-08-08 16:43 来源:澎湃新闻 


8月7日,澎湃新闻记者探访了百度位于山西省太原市的人工智能基础数据产业基地,该基地是全国范围内人员和产值规模最大的单体数据标注基地,入驻数据标注企业35家,有超过2000名的AI(人工智能)数据标注师,支持无人驾驶、语音识别、人脸识别、地图数据等多种数据标注场景。

按照百度的计划,未来5年,百度还将培养数据采集、标注专业人员5万人。百度(山西)人工智能基础数据产业基地。

百度(山西)人工智能基础数据产业基地。

“七八年前,我们是通过线上众包的方式,让AI数据标注师来做一些比较简单的任务,但随着人工智能的发展,应用场景越来越多,任务难度越来越高,再加上对数据安全、隐私、质量和效率的要求,百度决定建立一个人工智能基础数据产业基地。”百度(山西)人工智能基础数据产业基地负责人尉赤告诉澎湃新闻记者,基地一方面为百度自身的人工智能发展提供服务,另一方面可以向合作伙伴输出基地的数据能力和一整套的解决方案。

据了解,百度在2011年自建了数据采标团队,支持内部人工智能业务的发展。2018年9月,百度与山西省转型综合改革示范区达成合作,共同打造数据标注基地。目前,百度已经帮助山西从全国各地引入35家数据标注企业,通过导入百度自有的数据标注业务,为人员提供业务培训,帮助标注企业实现营业收入过亿元。而百度与山西数据标注基地的合作模式,未来还将拓展到更多省市,提供更多的AI就业岗位。

AI数据标注师,被称为人工智能背后的人。2020年2月,“人工智能训练师”正式成为新职业并纳入国家职业分类目录,数据采集和标注是人工智能训练师的主要任务之一。他们的工作是教会AI认识数据,有了足够多、足够好的数据,AI才能学会像人一样去感知、思考和决策,更好地为人类服务。

在基地一间间的办公室中,每个电脑前都坐着一名AI数据标注师,他们将根据各自分配的任务对图像、语音、视频、文本进行标注。比如,对于戴口罩的人脸图像,数据标注师会对人脸的眉毛、眼镜、颧骨等人脸关键点进行精准的标注,标注的特征点越多,AI就越能精确地识别戴口罩场景下的人脸,让人们在不摘口罩的情况下也能实现精确的体温测量,或是通过人脸闸机。

“要教会AI,首先要把知识转化成它能消化和吸收的‘语言’,你可以将数据想象成AI的燃料,人类对采集回来的原始数据进行加工,标注的过程就可以提取出一些数据信息。比如,在采集大量的人脸数据后,AI数据标注师会对人像进行标注,提取特征,将特征‘喂’给人工智能模型,那么模型算法相当于总结了之前人工标注出的信息,并找出通用规律,那这个人工智能模型就具备了人脑才有的认知和判断能力。”尉赤说。

据悉,AI数据标注师技术门槛并不高,经过一定的培训就能上岗,招工人群范围广泛。在基地,大专以上学历的数据标注师占比超过80%,一些中专或高中学历的人员也可胜任这项工作。

在探访中,基地AI数据标注师李宇龙告诉澎湃新闻记者,他入行做的第一个项目是车道线的标注。“比如,对车辆所行驶的车道两侧的线进行编号,包括识别这条线是实线还是虚线。刚开始不知道这项工作到底运用到什么地方,后来才知道是自动驾驶。”李宇龙说,他所做的2D/3D融合标注可助力自动驾驶模型的训练,帮助车辆实现视觉和雷达的感知,主要应用于自动驾驶场景的训练落地。

另一位AI数据标注师郭梅则向记者介绍,她原本就职于山西的传统矿业单位,一开始每天只能标注两三百张图片,现在提升到每天能完成1300多张,收入高于当地平均收入水平。图片框选是数据标注师的工作之一,它可助力图像识别模型训练,用于框选图片中的识别主体目标,常见于对人脸、人体、障碍物、红绿灯的框选,可应用于智能驾驶、智能安防、智能设备的场景落地。

对于为何要在未来5年培养5万名AI数据标注师,尉赤向澎湃新闻记者表示,数据服务领域与人工智能的发展息息相关。“这是个高速发展的行业,5年培养5万人并不算多,我们的线上众包注册用户有将近2000万人,目前每个月在线上为我们提供服务的人将近5万人。如果按照行业增长速度来看的话,培养5万人还不一定够。”尉赤向澎湃新闻记者介绍。

对于如何保障数据安全,尉赤说:“这也是百度要建设基地的原因,在基地,每个房间都有24小时视频监控,上岗之前进行人脸打卡,数据加密,作业期间若涉及数据敏感项目,会要求数据标注师们将手机放在固定的地方,而线上的数据标注师则是在处理一些敏感性不高的数据。”



相关新闻
騰訊、字節跳動與公安合作
华为承认麒麟芯片成绝唱
內蒙鼠疫首名病人不治
任志强的生死与习近平任意权力的展示
男子蒙冤入狱27年 酷刑逼供令人发指
公安鎮壓民企大午集團致多人受伤
杭州无症状感染者居住单元楼紧急封闭
Copyright ©《北京之春》编辑部 All Rights Reserved
E-Mail:bjs201022@gmail.com webmaster@bjzc.org manager@bjzc.org
地址:BeijingSpring,P.O.Box520709,Flushing,NY11352 USA
电话:001-718-661-9977