• 您的位置:网站首页
  • >
  • 最新刊出
  • >
  • 2025年
  • >
  • 2025年第12期
  • 基于大模型的标准术语语料库构建路径与应用场景

    DOI:10.3969/j.issn.1674-5698.2025.12.019

    作者:方思怡

    关键词:标准术语语料库;大模型;标准数字化;人工智能;术语

    Construction Path and Application Scenarios of Standard Terminology Corpus Based on Large Language Models

    Author:FANG Siyi

    Keywords:standard terminology corpus; large language model; standard digitization; artificial intelligence; term

    摘要:

    【目的】标准术语条目是标准文献内容的重要组成部分,旨在构建标准术语语料库,对标准术语条目进行数据挖掘,为标准数字化和智能化转型提供必要的数据基础。【方法】采用文献分析、自然语言处理等方法,结合标准术语数据的特点与应用需求,总结标准术语语料库的现状与不足。【结果】提出了大模型赋能标准术语语料库建设的通用性构建流程和技术路线,并结合业务需要明确了标准术语语料库的若干典型应用场景。【结论】为标准术语语料库的构建与应用提供技术参考,促进标准数智化数据底座的建设。

    Abstract:

    [Objective] Standard terminology entries are an important component of standard literature content, and a standard terminology corpus can provide necessary data foundation for the digital and intelligent transformation of standards. [Methods] Using literature analysis, natural language processing, and other methods, combined with the characteristics and application requirements of standard terminology data, the paper summarizes the current status and shortcomings of the standard terminology corpus. [Results] A universal construction process and technical route for empowering the construction of a standard terminology corpus with large language models are proposed, and several typical application scenarios of the standard terminology corpus are clarified based on business needs. [Conclusion] The paper provides technical reference for the construction and application of standard terminology corpora, and can promote the construction of a standardized digital data base. 

    引用格式:方思怡.基于大模型的标准术语语料库构建路径与应用场景[J].标准科学,2025(12):138-145.

    基金项目:本文受上海市质量和标准化研究院院立项目《基于大模型的国家标准术语语料库构建及应用研究》(项目编号:YRY202506))资助。

    作者简介:方思怡,硕士,工程师,研究方向为标准数字化、标准知识服务。

    主管单位:

    国家市场监督管理总局

    主办单位:

    中国标准化研究院

    中国标准化协会

    国内刊号:

    CN11-5811/T

    国际刊号:

    ISSN1674-5698

    创刊时间:

    1964年

    出版周期:

    月刊

    指导单位
    合作伙伴