바로가기 메뉴
본문 바로가기
주메뉴 바로가기
선박 2행정 엔진의 에너지효율 개선을 위한 딥 러닝 기반의 연료소비율 예측모델 개발에 관한 연구
2024년 05월 03일

대체연료기술연구팀

김정영 검사원, 김상훈 책임, 권진우 선임, 강수민 책임, 김학찬 책임

 

1. 연구 배경

 

국제해사기구(IMO)의 해양환경보호위원회(MEPC) 80차 회의에서는 2050년까지 선박에서 발생하는 GHG 배출을 net zero로 하는 목표가 채택되었으며, 현존선 에너지효율규제를 위해 해양오염방지협약(MARPOL)을 개정하여 2023년부터 선박에너지효율지수(EEXI) 및 탄소 집약도 지수(CII) 제도를 도입하였다.

신조선의 경우 선박에너지효율설계지수(EEDI)를 충족하기 위해 선박의 건조단계에서부터 선박의 제원을 기반으로 계산해 왔으며, 현존선은 EEDI와 동일한 방법으로 계산되는 EEXI 허용값을 충족함과 동시에 매년 운항실적에 따라 계산되는 연간 CII 감축률도 만족해야 한다.

또한, 현존선은 2019년 기준에 대비하여 2023년에서 2026년까지는 매년 2%씩 연간 CII를 개선해야 한다. 이와 같은 에너지효율 규제를 대응하기 위해 조선·해운 산업에서는 현존선에 즉각적으로 적용 가능한 방안과 에너지효율 개선 및 GHG 배출량 저감 기술을 적용할 수 있도록 단기적, 중장기적 대응방안을 모색하고 있다.

4차 산업혁명의 기술적 변화가 조선·해운 산업에서도 요구됨에 따라 운항 관리 차원에서도 인공지능 기반의 디지털화된 선박으로 변화하고 있으며, 최근 온실가스 및 환경오염 물질 배출 규제에 대응하는 방안으로 인공지능 기반의 온실가스 발생량, 질소산화물 배출량 및 초미세먼지 농도 예측 모델 개발에 관한 연구들이 활발히 이루어지고 있다.

이와 같은 연구에서 시계열 데이터를 기반으로 Deep Neural Network(DNN) 및 Long Short-Term Memory(LSTM) 모델을 활용하여 배출량 예측에 관한 가능성을 확인하였다. 그로 인해 인공지능 기반의 온실가스 예측에 관한 연구는 디지털화된 선박의 새로운 개발 방안으로 제시될 수 있으며, 선박 운항 관리 측면에서 다양한 에너지효율 개선 대응방안에 필요한 항목임은 자명하다.

KR에서는 선박 주기 운용차원에서 연료 소비율 개선을 통한 온실가스 배출을 개선할 수 있는 방안으로 소기 냉각수 온도 하향 조정에 따라 연료 소비율에 미치는 영향을 실험적으로 확인하였다. 소기 냉각수 온도가 낮아짐에 따라 연료소비율이 감소하는 것을 확인하였으며, 대기오염물질 배출 또한 감소하는 것으로 확인하였다. 즉, 소기 냉각수 온도가 에너지 효율 개선 및 온실가스 발생량을 저감할 수 있는 인자임을 확인하였다.

하지만 실험 환경의 물리적인 한계로 인해 소기 냉각수 온도를 목표로 설정한 10℃까지 조정할 수 없었다. 이에 본 연구에서는 실험적으로 취득한 데이터를 기반으로 소기 냉각수 변화에 따른 연료소비율 개선 효과를 예측할 수 있는 인공지능 모델을 개발하고, 일부 성과물을 공유하고자 한다.

 

 

2. 예측 알고리즘 구성 및 데이터 전처리

 

예측 알고리즘 모델은 Convolutional Neural Network(CNN), Recurrent Neural Network(RNN), Deep Neural Network(DNN) 등 다양한 기법이 존재하지만, 본 연구에서는 기존 Recurrent Neural Network(RNN) 기법의 기울기 소멸 문제를 개선하고, 취득한 시계열 데이터의 기울기 값의 소실을 최소화하는데 강점을 가지고 있는 LSTM(Long Short-Term Memory) 모델을 사용하였다.

또한, LSTM 모델은 데이터를 훈련하고 예측할 때 모델을 최적화하기 위해 과거 정보를 현재 작업에 연결하기 어려운 장기 의존성 문제를 해소할 수 있다. 본 연구의 데이터 학습과정에서 데이터 처리 시간을 줄이고자 1D CNN과 LSTM을 결합하였으나 예측 오차율이 높아지는 것을 확인하여 LSTM layer만 활용하여 예측 알고리즘 모델을 구성하였다.

LSTM 모델의 이론적인 구성은 그림 1과 같이 나타내었으며, 기본적인 구조는 전체적인 학습을 수행할 수 있도록 구동하는 셀(Cell)과 학습을 통해 어떤 정보를 유지하고 버릴지를 결정하는 게이트(Gate)로 구성되어 있다.

셀은 시퀀스 데이터를 저장하고, 각 게이트는 시그모이드 함수와 하이퍼볼릭 탄젠트 함수 등의 활성화 함수를 사용하고 있다. 입력 게이트(Input gate)는 현재의 정보를 기억하기 위한 게이트이고, 망각게이트(Forget gate)는 과거의 정보를 버릴지 말지를 결정하기 위한 게이트, 출력 게이트(Output gate)는 어떤 값을 출력할지 결정하는 최종적인 게이트이다.

이와 같은 LSTM 모델의 이론적 구성은 수식 (1)~(6)의 구조로 나타내었다. 각 수식은 그림 1에서 나타낸 함수를 신호 형태로 활용하여 데이터가 입력될 때 수학적인 계산으로 최종적인 결정 값을 만드는데 사용하게 된다.

 

 

𝑓𝑡=𝜎(𝑊𝑡∙[ℎ𝑡−1,𝑥𝑡]+𝑏𝑓) (1)

𝑖𝑡=𝜎(𝑊𝑖∙[ℎ𝑡−1,𝑥𝑡]+𝑏𝑖) (2)

𝐶̃𝑡=𝑡𝑎𝑛ℎ(𝑊𝑡∙[ℎ𝑡−1,𝑥𝑡]+𝑏𝑐) (3)

𝐶𝑡=𝑓𝑡 ∗𝐶𝑡−1+𝑖𝑡∗𝐶̃𝑡 (4)

𝑜𝑡=𝜎(𝑊𝑜∙[ℎ𝑡−1,𝑥𝑡]+𝑏0) (5)

ℎ𝑡=𝑜𝑡∗tanh⁡(𝐶𝑡) (6)

그림 1. LSTM 모델 내부 구조

 

예측 모델에 사용한 데이터베이스는 85% 부하 운전 조건에서 냉각수 공급온도를 20℃에서 45℃까지 5℃ 간격으로 증가시켜 취득한 연료소모량 데이터를 활용하였다. 

 

본 연구에서는 실험을 통해 취득한 시계열 데이터를 적극적으로 활용하기 위해 연료소비율 계산에 직접적인 요인이 되는 연료소모량 데이터를 사용하여 예측 모델을 개발하였다. 실험데이터는 1Hz 주기로 샘플링 하였지만 예측 알고리즘 개발을 위해서는 데이터양이 부족할 것으로 판단되어 전처리 단계에서 리샘플링(Resampling) 과정을 수행하여 데이터양 부족 현상을 해결하고자 한다. 

 

하지만 리샘플링 과정은 데이터 및 예측 모델에 대한 신뢰성이 떨어질 수 있으므로 최소한의 양으로 데이터를 생성하는 것이 정확도를 높일 수 있는 방안으로 적용되고 있다. 그로 인해 기존 1Hz의 데이터를 10Hz의 샘플링 레이트를 가지는 데이터로 생성하였으며, 데이터 사이의 결측값은 평균값으로 보간하는 방법을 사용하였다. 또한, 기존 1Hz의 데이터와 전처리 단계에서 생성한 10Hz 데이터는 예측 알고리즘 모델 정확성을 평가하는데 활용하였다.

 

 

3. 예측 모델 구축 및 평가

 

본 연구에서 구축한 예측 알고리즘 모델은 LSTM layer 2개를 활용하여 학습데이터의 훈련과정에서 메모리 기억 능력을 증가시켰으며, 최종적인 예측 결과를 출력해주는 dense layer를 1개로 구성하였다.

모델 최적화는 딥러닝 최적화 기법 중 하나인 아담 옵티마이저(Adam optimizer)를 사용하였으며, 학습율(Learning rate)은 0.001, 학습을 위한 파라미터 업데이트 개수인 배치크기(batch size)는 100개, 데이터셋을 학습하는 횟수 에포크(Epoch)는 30번으로 설정하였다. 

 

데이터 학습을 위해 훈련데이터는 입력데이터의 80%를 사용하였고, 검증데이터는 훈련데이터의 20%를 사용하였으며, 테스트데이터는 입력데이터의 20%를 활용하였다. 대부분의 학습 모델은 적절한 학습을 위한 과대적합(Overfitting)을 대응하도록 드롭 아웃(Drop out)을 설정하여 학습하지만, 본 연구의 예측 모델에서는 오차율이 높아져 예측 정확도가 떨어지는 것으로 확인하여 드롭 아웃은 설정하지 않았다. 표 1은 구축한 모델에 대한 학습 파라미터를 나타내었다. 

 

첫번째 LSTM layer는 학습 신경망을 60개씩 1,024개를 사용하였으며, 그로 인한 파라미터 개수는 4,202,496개이며, 입력 신경망에 대한 마지막 신경망의 출력을 리턴 해주는 리턴 시퀀스(Return_sequences)는 사용(True)값으로 설정하였다. 

 

두번째 LSTM layer 신경망은 1,024개를 사용하여 학습 파라미터의 개수를 늘려 학습량을 증가시켰으며, 리턴 시퀀스는 사용하지 않음(False)으로 적용하여 dense layer에서 최종적인 출력을 할 수 있도록 사용하였다.

 

레이어

출력 형태

파라미터

리턴 시퀀스

LSTM

(None, 60, 1,024)

4,202,496

True

LSTM

(None, 1,024)

8,392,704

False

Dense

(None, 1)

1,025

-

표 1. 예측 모델 파라미터

 

 

예측 모델에 대한 평가는 정확도 값으로 나타내기에는 어렵기에 일반적으로 평균 제곱근 오차(Root Mean Squared Error)값의 오차율로써 알고리즘을 평가하고 있다. 

 

이는 오차 값이 낮을수록 정확도가 높은 것으로 표현할 수 있으며, 그로 인해 본 연구에서 구축한 예측 알고리즘 모델 평가는 평균 제곱근 오차 값으로 나타내었다. 연료소모량 데이터를 활용한 예측 모델 학습 결과는 그림 2와 같이 나타내었다. 

 

1Hz에서는 훈련 평균 제곱근 오차 값이 0.05부터 0.003으로 학습되었고, 검증 평균 제곱근 오차 값은 0.01에서 0.0018로 학습됨을 확인하였다. 10Hz에서는 훈련 평균 제곱근 오차 값이 0.007부터 0으로 수렴하고, 검증 평균 제곱근 오차 값은 대부분 0으로 수렴하는 결과로 학습됨을 확인하였다. 이에 따라 학습 모델은 샘플링 레이트가 높을 때 오차율이 낮은 결과를 나타냄을 확인하였다.

 

그림 2. 학습 데이터를 활용한 LSTM 모델 기반의 학습 결과(좌: 1Hz, 우: 10Hz)

 

 

학습이 완료된 모델은 테스트 데이터를 활용하여 연료소모량 예측 분석을 수행하여 그림 3과 같이 나타내었다. 파란 실선은 실제 실험적으로 취득한 연료소모량 데이터이며 빨간 실선은 연료소모량 데이터를 예측한 결과 값을 나타내며, 이는 시간에 따른 연료소모량 값을 나타낸다. 

 

1Hz에서는 실제 값에 비해 예측 결과가 경향성은 비슷한 결과를 보이지만, 정확도가 떨어짐을 확인하였다. 10Hz에서는 실제 값과 예측 결과의 경향성 및 정확도가 높게 나타남을 확인하였다. 

 

그림 3. 테스트 데이터를 활용한 LSTM 모델 기반의 예측 결과(상: 1Hz, 하: 10Hz)

 

 

4. 결론

 

본 연구에서는 선박 2행정 엔진의 에너지효율 개선을 위한 딥러닝 기반의 연료소모량 예측 알고리즘 모델을 개발하였다. 이를 위해 선박 2행정 엔진의 테스트베드를 활용하여 소기 냉각수 온도에 따른 연료소모량 데이터를 취득하였으며, 샘플링 레이트 변화에 따라 모델 정확도를 평가할 수 있도록 1Hz에서 10Hz까지 리샘플링 하였다. 

 

예측 알고리즘은 딥러닝 기법인 LSTM 모델을 활용하였으며, 평균 제곱근 오차 값으로 학습 평가를 수행하였다. 구축한 모델을 활용하여 훈련데이터를 학습하였을 때, 샘플링 레이트 1Hz보다 10Hz에서 더 낮은 오차율로 학습이 되었으며, 10Hz에서 정확한 예측을 수행됨을 확인하였다. 

 

이는 실제 실험을 통해 취득한 데이터의 샘플링 레이트가 높다면 예측 모델의 정확도를 높일 수 있을 것으로 분석된다. 반면, 샘플링 레이트가 낮은 데이터는 리샘플링 과정을 통해 높은 샘플링 레이트를 가지는 데이터로 생성하여 예측을 수행한다면 정확도를 높일 수 있을 것으로 분석된다. 

 

향후 구축한 예측 알고리즘 모델은 더 높은 정확도를 가지는 모델로 최적화하여 실험적으로 데이터 취득이 불가능하거나 데이터 생성이 필요한 연료소비율 및 온실가스를 포함한 대기오염물질에 대한 예측을 위해 활용할 계획이다.