新書推薦:
《
台北故宫博物院典藏大系·绘画卷(全十册)
》
售價:NT$
47400.0
《
姑苏繁华图
》
售價:NT$
3190.0
《
人的消逝:从原子弹、互联网到人工智能
》
售價:NT$
484.0
《
想象的共同体--民族主义的起源与散布(增订版)
》
售價:NT$
352.0
《
医学图形图像处理基于Python VTK的实现
》
售價:NT$
760.0
《
山家清供:小楷插图珍藏本 谦德国学文库系列
》
售價:NT$
653.0
《
政略与战略论
》
售價:NT$
638.0
《
百年词史-(1900-2000(全二册))
》
售價:NT$
1520.0
|
內容簡介: |
本书主要适用于参加“数据标注”职业技能等级认证的人员,是数据标注领域的实训教材。为了更好地培养数据标注员,将着重对常见的文本、语音和图像标注任务类型进行介绍及训练,辅助从事标注行业的学习者快速地完成系统化学习,进行标注实战工作。 本书对文本的分类标注和实体标注、语音的转写和校对以及图像的2D拉框任务进行逐一讲解和分析,每种标注类型均配有对应的规范、举例分析、习题及解析。同时,本书还针对各类标注配套了多种子任务类型或多个领域的实操练习题,目的是帮助标注学习者增长见识,从而实现系统、完整的标注学习和实战练习。
|
關於作者: |
王会珍,博士,东北大学计算机学院讲师,新加坡南洋理工大学访问学者。2002年7月毕业于东北大学计算机科学与技术专业,获得工学学士学位。同年,推荐本校研究生,从师朱靖波教授,从事自然语言处理方向的研究工作。2004年3月转入硕博连读课程,攻读计算机应用专业的博士学位,从师张斌教授、朱靖波教授,2008年3月获得博士学位。主要研究方向为:机器学习、文本分类、主题检测与追踪、知识图谱、自动问答。2002年起,一直致力于文本分析处理方面的研究与开发工作,曾作为主要研发人员参加国家自然基金课题、国家863计划项目、国家242计划项目的申请及研究。在国内外期刊杂志和学术会议上发表五十多篇学术论文,包括国际计算语言学领域顶级国际学术会议ACL、COLING、IEEE-NLPKE、IJCNLP、ICCPOL、《软件学报》、《中文信息学报》等国内期刊。研究成果曾获得辽宁省科技进步三等奖。
|
目錄:
|
第1章 数据标注概述0011.1 什么是数据标注0021.2 数据标注的行业现状0031.2.1 政策层面0031.2.2 行业需求0041.2.3 行业发展0061.2.4 市场结构0071.3 数据标注的应用场景0091.3.1 智能教育0091.3.2 智慧医疗0111.3.3 智慧司法0131.3.4 智慧金融0141.3.5 智慧出行0161.3.6 智能家居0171.3.7 智慧农业0181.3.8 智能营销0201.3.9 智能安防0211.3.10 智能制造0221.3.11 智慧物流0231.4 常见标注任务类型介绍0251.4.1 文本标注0251.4.2 语音标注0341.4.3 图像标注0371.5 实训习题043第2章 数据标注实训平台0442.1 平台基本功能介绍0442.2 平台支持标注类型及操作页面展示050第3章 文本标注实训0533.1 分类标注0533.1.1 认识分类标注0543.1.2 分类标注实训之相关性标注0563.1.3 相关性标注规范0573.1.4 实训习题0693.2 命名实体标注0723.2.1 认识命名实体及实体标注0723.2.2 命名实体标注实训之通用实体标注0743.2.3 实训习题092第4章 语音标注—语音切割转写0954.1 认识语音切割转写0954.2 语音切割转写实训0964.2.1 语音转写标注规范0964.2.2 项目案例分析1094.3 实训习题111第5章 图像标注—2D拉框1145.1 认识2D拉框1145.2 拉框标注之2D人体拉框标注1165.2.1 2D人体拉框标注规范1165.2.2 项目案例分析1375.3 实训习题138第6章 全流程项目实训1446.1 标注项目的基本操作流程1446.2 全流程标注项目实操步骤详解1476.2.1 进入全流程项目练习页并查看任务要求1486.2.2 原始数据获取1496.2.3 数据处理1506.2.4 项目创建1516.2.5 项目配置1526.2.6 标注实施1566.2.7 标注结果导出1596.3 全流程标注项目案例演示1606.4 实训习题165
|
|