术语提取
利用 AI 自动从项目文件中提取双语术语对,支持筛选、排序、多格式导出和直接创建术语库。
向导流程
术语提取向导共 7 个页面:
| 步骤 | 页面 | 说明 |
|---|---|---|
| 1 | 文件选择 | 勾选参与提取的文件,显示文件名、大小、语言对、字数 |
| 2 | API 配置 | 多选服务器节点(支持负载均衡),微调温度、重试、并发、超时 |
| 3 | 提取选项 | 请求模式、合并方式、摘取范围、排除规则、术语库名称 |
| 4 | 提示词选择 | 选择术语提取专用提示词模板 |
| 5 | 确认设置 | 汇总展示全部配置摘要,确认后自动开始 |
| 6 | 执行提取 | 实时显示进度、术语列表、词频、日志 |
| 7 | 提取结果 | 搜索过滤、词频过滤、导出和保存到术语库 |
自动流程
在确认页点击下一步后,提取自动开始执行。完成后自动跳转到结果页。
提取选项详解
请求与合并
| 选项 | 默认值 | 说明 |
|---|---|---|
| 请求模式 | 并行 | 并行 / 串行 |
| 合并方式 | 按字数 | 按字数 (100-500) / 按句段 (1-10) |
| 字数限制 | 200 | 步进 50 |
| 句段数量 | 5 | 步进 1 |
摘取范围
| 模式 | 说明 |
|---|---|
| 原文和译文(默认) | AI 参考既有译文提取术语,使用已有译法 |
| 仅发送原文 | AI 仅根据原文提取术语并翻译 |
排除选项
| 选项 | 默认值 |
|---|---|
| 未翻译/草稿/已翻译/翻译被否决/翻译被核准/签发被拒绝/已签发 | 均不排除 |
| 已锁定 | 是 |
术语库名称
可指定新建术语库的名称,默认格式为 新建术语库_yyyyMMdd_HHmmss。
结果处理(第 7 页)
术语列表
- 三列:原文术语、译文术语、词频
- 术语按原文去重(大小写不敏感),保留首次出现的译法
- 词频统计在所有源文本中进行子串匹配计数
- 完成后按词频降序排列
- 支持列排序
筛选功能
- 搜索过滤:实时匹配原文或译文术语(大小写不敏感)
- 词频阈值过滤:输入数值后点击确定,删除所有频率 ≤ 阈值的术语
导出格式
| 格式 | 说明 |
|---|---|
| Excel (.xlsx) | 适合人工审阅和编辑 |
| CSV (.csv) | UTF-8 BOM 编码,通用格式 |
| TXT (.txt) | Tab 分隔,UTF-8 BOM 编码 |
| 保存到数据库 | 直接创建术语库并批量插入术语条目 |
导出文件名默认:术语提取_yyyyMMdd_HHmmss.扩展名
最佳实践
建议先将提取结果导出为 Excel 进行人工审阅,移除不需要的术语对,确认译法后再保存到术语库。
进度与日志
- 实时显示已发现术语数、Token 消耗、费用
- 术语列表实时更新(提取过程中按原文排序)
- 自动保存日志(文件前缀
AIHub_TermExtractionLog_) - 完成后播放提示音并自动跳转结果页
- 支持随时取消