工作机会 > 职位概述

数据采集部经理

技术研发部 - 北京工作 - 2016年10月08日

职位职责:

1.根据需求表格分析采集网站和栏目内容并填写业务表格、严格执行规范和流程,并能建议和调优;
2.图形化分析网页结构,提取网页HTML元素的定位路径(即CSS或XPATH)和匹配规则(即正则表达式)并验证路径和规则的正确性;
3.能使用简单的脚步语言和SQL操作数据、文本和文件、数据处理(清洗、规整、标准化、归一化)。特征属性提取并分析;
4.文本分析、自然语言处理等;
5.了解代理上网、验证码、图片识别、人机识别等。

任职要求:

1.具备良好的沟通能力、理解力、服从力和执行力,有较强抗压能力和强烈的责任心,良好的团队合作和组织管理能力;
2.计算机、信息管理相关专业;
3.了解编辑器宏定义、列编辑、百万级数据编辑操作和处理;
4.行业模型抽象能力、数据库表设计;
5.熟悉js、jquery或python、beautiful soup或java jsoup、精通熟悉关系型数据库(如MYSQL)和非关系型数据库(如HBASE)。

发送简历至人力资源
首页我们历程文化技术服务战略动态机会联系
©2018 万库标杆科技有限公司 京ICP证09074716