책소개
AI, 미래의 안전성을 탐구하다
AI가 화학 물질의 개발과 안전성 평가에서 혁신적 변화를 주도하고 있다. AI는 화학 물질의 예측 모델링, 신약 개발, 그리고 산업 내 다양한 응용 분야에서 어떻게 활용되는가? 이 책은 AI가 복잡한 화학 물질 데이터를 분석하고, 더 안전하고 효과적인 화합물 개발을 돕는 과정을 소개한다. 또한 AI 기술을 통해 화학 물질의 유해성을 정확히 예측하는 방법과 실무에서의 실제 활용 사례를 소개하며 AI가 화학 산업에서 신뢰할 수 있는 도구로 자리 잡는 과정을 살펴본다.
AI 도입은 화학 물질의 연구와 개발에 있어 새로운 가능성을 열어주며 안전한 화학 물질 개발을 위한 인공지능 모델의 중요성을 상기한다. 인공지능의 활용을 통해 더 안전한 화학 제품을 개발하고, 이를 통해 화학 산업의 혁신을 이루고자 하는 기업과 연구자들에게 중요한 지침을 담았다. 인공지능을 적극 활용하여 효율적이고 신뢰할 수 있는 화학 물질 개발 환경을 조성하는 방법을 제시하며, 독자들에게 AI 시대에 필요한 지식을 제공한다.
200자평
AI가 화학 물질의 개발과 안전성 평가에 가져온 혁신을 설명한다. AI가 화학 물질의 데이터를 분석하고 안전한 화합물을 개발하는 과정을 소개하며, 실무에서의 활용 사례와 주의사항을 상세히 다룬다. AI를 통해 화학 산업의 미래를 탐구하는 독자들에게 중요한 가이드를 제공한다.
지은이
신현길
안전성평가연구소 예측독성연구본부 선임연구원, 과학기술연합대학원 대학교(UST) 인체 및 환경 독성학 조교수다. 연세대학교에서 생명공학과 박사학위를 받았고, 학위 기간 동안 화학정보학을 연구했다. 사단법인 에이아이프렌즈 이사, 서울과학기술대학교 에너지환경공학과 겸임교수다. 사단법인 에이아이프렌즈학회 이사로 활동하고 있다. AI 독성 예측 연구를 하고 있으며, 개발된 AI 모델들은 웹 프로그램 형태로 배포해서 서비스 운영 중이다. SCI(E) 등재학술지에 20편의 논문을 게재했다.
차례
우리의 삶과 화학 물질
01 화학 물질과 AI의 만남
02 화학 물질 데이터베이스
03 화학 물질 분야 AI 모델 개발
04 화학 물질 분야 AI 모델 검증
05 화학 물질 개발을 위한 AI 활용법
06 화학 물질 분야 AI 활용 사례
07 동물 시험 대체를 위한 AI
08 화학 물질 분야 AI 활용 난제
09 화학 물질을 위한 AI와 지속 가능성
10 화학 물질 분야 AI 전망
책속으로
전문가 시스템을 기반으로 하는 QSAR 모델도 상당수 사용되고 있다. 화학 물질에서 독성을 유발하는 특정 구조 패턴(structural pattern)이 있다는 것을 전문가들이 밝혀내고 정리해 두었는데, 이러한 정보를 바탕으로 독성을 나타낼 수 있는 화학 물질을 찾아내는 방식으로 작동한다. 전문가들이 찾아 놓은 규칙(rule)에 따라서 예측하기 때문에 이를 규칙 기반 모델(rule-based model)이라고도 칭한다. 전문가 시스템이 독성 예측 분야에서 계속 주목받고 활용되는 이유는 예측 결과 해석의 명확성 때문이다. 화학 물질이 독성을 나타내는 명확한 이유를 확인할 수 있기 때문이다.
-01_“화학 물질과 AI의 만남” 중에서
기계 학습 모델을 훈련한 후에는 반드시 검증해야 한다. 검증 데이터에서 좋은 예측력을 보여야 훈련이 제대로 되었다고 평가할 수 있다. 모델의 정확도를 평가하려면 보통은 수집한 데이터를 훈련 데이터(training set), 검증 데이터(validation set), 외부 테스트 데이터(external test set)로 구분한다. 데이터가 어느 정도(1,000개 이상인데 절대적인 기준은 아니다) 있다면 6:2:2 정도 비율로 나눈다(여기서도 제시한 비율은 절대적인 값은 아니다. 훈련 데이터가 부족하면 8:1:1로 나눠도 괜찮다). 훈련 데이터는 모델의 파라미터를 찾아내려고 사용하며, 검증 데이터는 좋은 모델 파라미터를 선정하려고 사용한다. 마지막으로 외부 테스트 데이터를 이용해서 모델의 예측력을 최종 점검한다.
-04_“화학 물질 분야 AI 모델 검증” 중에서
최근 AI 분야에서의 화두는 생성 AI다. 챗GPT도 생성 AI에 속하며, 이미지를 생성하는 달리(DALL-E) 역시 생성 AI다. 달리에서 이미지를 생성하는 딥러닝 모델을 확산(diffusion) 모델이라고 한다. 확산 과정은 물질이 높은 농도에서 낮은 농도로 이동하는 과정인데, 확산 모델에서는 원본 데이터에 조금씩 노이즈(noise)를 추가한 후 다시 노이즈를 점진적으로 제거해서 원본 데이터를 복원하는 과정을 학습한다. 이러한 기술을 화학 물질의 생성에 적용한 연구가 있는데, 신규 스마일스 코드를 만들어 내는 확산 모델을 적용해서 기존에 찾아내지 못했던 새로운 분자 구조를 찾아내는 데에 적용하고 있다. 특히 물질의 3D 구조를 설계하는 데도 활용되고 있는데, 표적 단백질에 약물이 결합하는 부위 내에서 분자 구조를 생성함으로써 효율적으로 신규 약물 구조를 찾아내는 데에 활용된다.
-06_“화학 물질 분야 AI 활용 사례” 중에서
화학 물질이 환경에 미치는 영향이 결국에는 우리의 건강에도 영향을 미치기 때문에 환경 유해성을 예측하는 것은 지속 가능한 화학 물질 개발에도 중요한 요소다. 환경 독성 QSAR 모델들도 미국 환경청이나 이탈리아 마리오 네그리 연구소에서 지속적으로 개발하고 있기 때문에, 이러한 프로그램을 활용하는 것이 화학 물질 개발 전에 환경 유해성을 예측하는 데에 도움이 될 수 있다. 마리오 네그리 연구소에서 발표한 모델 중에는 물벼룩과 물고기에 대한 살생물제의 독성을 예측한 모델이 있는데, 화학 물질의 환경 유해성에 초점을 맞춘 기계 학습 모델의 한 사례로 볼 수 있다.
-09_“화학 물질을 위한 AI와 지속 가능성” 중에서