바로가기 메뉴
본문 바로가기
주메뉴 바로가기
从基于AI的KR聊天机器人开发到ChatGPT应用
2024年 03月 21日

AI融合研究小组 ZHANG Hwasup组长, JO Yeonhwa责任,

SONG Sangho先任, LEE Gapheon先任

 

1. 绪论

人工智能(AI)技术的发展正在各个行业带来创新。KR在图纸内信息提取、船体损伤检测、船舶设备故障判断等多种船级社业务中引入人工智能,为提高工作效率和服务质量进行技术开发。最近在人工智能自然语言处理领域取得了创新性的技术进步,并正在进行将其应用于发现前置规则和提高工作效率的研究。

 

2. 自然语言处理人工智能的发展

自然语言处理(NLP,Natural Language Processing)人工智能的创新发展始于2017年6月谷歌发表的题为《Attention Is All You Need》的论文。Attention机制和Transformer深度学习算法在数据中只关注需要集中的地方,2018年将发布只使用Transformer Encoder部分的谷歌BERT模型和仅使用Decoder部分的OpenAI GPT。


在初期BERT的性能比GPT更好,从这一点来看,谷歌翻译器的性能将大幅提高。此后2020年5月出现了性能卓越的GPT3,参数高达1750亿个, 成为热点,KR正式开始研究利用NLP。

3. 自然语言处理人工智能初步研究

NLP研究初期KR尝试开发一些零碎的技术,将用户输入的AIS目的地值标准化为符合UN/LOCODE,并研究了BERT和GPT3等最新NLP是否可以用于KR业务。

 

 

图1.BERT和GPT3中,选择适合KR的NLP模型



图2. 基于BERT的自然语言处理Q&A原型

图1和图2显示了2021年初,了解了BERT和GPT3的特点,确定了哪种NLP模型适合KR并开发并测试了Q&A原型。当时BERT可以配置为支持多国语言、免费的、通过模型下载获得安全保护的封闭结构,而GPT3是专门用于英语的,而且是收费的,不公开的,只能作为API使用,因此相对存在安全风险。因此,我们认为适合KR的自然语言处理模型是BERT,所以下载了BERT Multilingual模型,并进一步学习了名为korQuAD的开放式韩语Q&A DB,并以此模型为基础创建了Q&A原型,看看可以回答多大程度的问题。


在图2中的Q&A原型中,从左边的示例开始,当给出有关木星的Document时,如果问“木星的体积是地球的几倍?”的问题,就会得到“1300倍”的答案。右边的示例是向KR回答压舱舱相关问题的Document,当被问及“是否需要在向压舱舱运输时的船舶压载水管理记录簿上记录?”时,您可以看到回答“3.6-addual operational processe and general remarks[UNK]记录即可。为了应对psco,这是船舶的日志”。此外还进行了多种测试,通过这项研究得出的结果如下三点。


1. 如果有用户提问,可以通过查找与此最相似的Document并在其中查找答案的方式开发人工智能聊天机器人
2. 如果对韩语或造船图主要单词的学习不充分,可能会出现名为[UNK]的不可识别标志作为答案
3.BERT模型特别适用于自然语言理解,如果想要以句子形式生成的答案,需要进一步开发(句子生成逻辑开发、自然语言生成特殊模型GPT应用等)

 

4. 基于人工智能的KR聊天机器人开发
受2021年底金融界在KakaoTalk或网络上用聊天机器人解决简单咨询的启发,开发了基于人工智能的Q&A聊天机器人,仅限于部分检验业务。

 

 

图3. 检验业务Q&A DB(左)、聊天机器人操作程序(右下)

 

对检验业务的常见问题和答案进行了数据库化,并利用NLP的基础技术——将单词矢量化的Word Embedding方式,组成了聊天机器人的动作流程。详细了解其配置后,将准备的问题和答案DB按每个内容矢量化,构建矢量数据库。当用户问“远程检验的程序是什么?”时,基于人工智能的KR聊天机器人服务将以矢量化问题并向用户显示矢量数据库中最相似的答案的方式工作。

 

图4. 基于人工智能的KR聊天机器人服务

 

基于人工智能的KR聊天机器人服务的前端是ReactJS,后端是python,自然语言处理模块是利用Azure Cognitive service开发的。对远程检验、EDD、ISM等多种业务进行了815次问答(截止2024年1月)。

5. ChatGPT的出现和应用
基于人工智能的KR聊天机器人服务测试版发布后的2022年11月30日,ChatGPT推出了对GPT3进行微调,使其更适合对话。ChatGPT一上市就引起了巨大反响,对利用NLP的KR研究方向也产生了很大影响。

 

 

图5. KR聊天机器人(左)、ChatGPT(中)、KR规范和ChatGPT(右)

 

ChatGPT上市后,KR研究了可用于钢质海船入级规范智能搜索的方案。结果如图5所示,应用了提示工程技术以便在通过ChatGPT提问和提供答案时参考KR规范。目前开发的版本是一个原型版本,用于审查其适用性,并正在研究开发其适用性。今后KR除了钢质入级海船规范外,还计划利用国际公约、船舶检验履历管理等多种数据和高度化的NLP技术,持续推进研发,为客户提供优质的技术服务。