DFT의 발전 초기, Non-Self-Consistent Kohn-Sham 에너지를 계산하는 과정에서 밀도로써 Hartree-Fock(HF) 밀도를 주는 방식이 연구되었다. 이를 HF-DFT라고 한다. 최근, 일부 경우에는 Self-Consistent DFT와 비교하여 HF-DFT가 더욱 정확한 값을 도출하는 것으로 밝혀졌다. 우리는 DFT 계산이 두 가지 다른 유형의 계산으로 분류될 수 있다는 것을 발견했다.
우선, 오차는 Functional에 의한 Functional Error와 밀도에 의한 Density-Driven Error로 분해할 수 있다. 대부분의 계산에서는 Functional Error가 지배적이며, 이러한 경우에는 Self-Consistent DFT가 더욱 정확한 밀도를 이용하는 Non-Self-Consistent DFT (= Density-Corrected DFT DC-DFT)에 비해 정확한 결과를 도출한다. 이러한 '평범한normal' 계산과 달리, 일부 Density-Driven Error가 Functional Error에 비해 큰 오차를 유발하는 경우가 존재한다. 우리는 이러한 경우를 '비정상abnormal'이라고 분류한다.
HF-DFT는 HF 밀도를 더욱 정확한 밀도로써 이용하는 DC-DFT의 실용적인 버전이며, 작은 HOMO-LUMO 차이가 이러한 '비정상abnormal' 계산의 지표라는 것을 알아냈다. 다시 말해, 이러한 경우 HF-DFT가 더욱 좋은 성능을 발휘한다.
우리는 DFT에서 잘 알려진 문제 사례 중 어떤 것이 비정상적abnormal인 경우인지 결정하고, 이러한 어려운 문제를 해결하기 위해 DC-DFT를 적용하고자 한다.
Machine Learning Interatomic Potential (MLIP)
분자의 움직임과 화학 반응을 모사할 때, 기존의 고전적 힘장은 계산 비용이 저렴하나 복잡한 화학 반응을 제대로 모사하지 못한다. 반면 양자 역학 수준의 AIMD(Ab initio molecular dynamics)는 정확하지만 계산 비용이 천문학적이다. 우리는 이 딜레마를 극복하기 위해 인공지능(AI) 기술을 도입하여, 저비용으로 양자 수준의 정확도를 구현하는 AI 기반 기계 학습 원자 간 포텐셜(MLIP)을 개발한다.
성공적인 화학 AI 모델을 구축하기 위한 핵심은 '학습 데이터(Training Set)의 질과 다양성'에 있다. 진정한 범용 AI를 위해서는 다양한 화학적 조성과 반응 경로를 학습시켜야 하지만, 기존 데이터베이스는 할로젠 등 무거운 원자를 충분히 포함하지 않아 실제 실험 환경을 대변하지 못한다. 또한, 기존의 NMS(Normal Mode Sampling) 기반 구조 탐색은 분자의 평형 상태(Equilibrium structure) 주변만 맴돌 뿐, 화학 반응의 핵심인 전이 상태(Transition state)를 AI에게 제대로 학습시키지 못하는 한계가 존재한다.
우리는 이러한 한계를 근본적으로 해결하기 위해 데이터 중심 AI(Data-Centric AI) 원천 기술을 연구한다. 첫째, 전이 상태를 포함한 다채로운 반응 경로를 탐색하는 RPS(Reaction Pathway Sampling) 기법을 개발하여 AI가 복잡한 화학적 상황을 학습할 수 있는 기반을 마련하였다 (Ref). 둘째, 이를 활용해 다양한 원소와 반응 환경을 포괄하는 대규모 데이터베이스인 'Halo8'을 성공적으로 구축하였다 (Ref).
우리 연구실은 직접 구축한 독보적인 데이터베이스와 샘플링 기술을 바탕으로, 어떠한 복잡한 화학적 상황에서도 작동하는 정밀한 AI 모델을 개발하며 화학 탐색의 패러다임을 혁신하고자 한다.
Theoretical and Computational Chemistry
화학에서 가장 중요한 요소들을 뽑는다면
1. 새로운 물질을 만들어내는 것 - 합성화학
2. 이런 물질들이 가지는 특성을 밝혀내는 것 - 분석화학
3. 이 특성을 띄는 원리를 밝혀내는 것 - 물리화학
등이 있을 것이다.
이론 물리화학은 이 중 화학적, 물리학적 원리에 기초하여 다양한 계(system)의 구조와 물리·화학적 성질 그리고 화학반응 등의 변화를 설명하고자 하는 분야이다.
이론 물리화학의 최근 동향은 계의 성질을 설명, 예측할 수 있는 지식의 창출을 통해서 새로운 물질을 창조하는데 밑바탕을 제시함은 물론, 계의 구조와 움직임을 실제로 모사함으로써 보다 직접적이고 구체적인 지식을 얻고자 하고 있다. 이러한 경향은 빠르고 기억용량이 큰 컴퓨터의 지속적인 발전의 영향에서 기인한다. 컴퓨터의 발전으로 인해 전자 단위에서 계를 기술하는 양자역학과 원자, 분자 등 다수의 입자들의 특성을 집합적으로 설명하는 고전역학과 통계역학의 이론들을 실제로 적용하여 필요한 계산을 이제는 빠르고 정확하게 수행하는 것이 가능하게 되었으며, 이렇게 컴퓨터를 이용하여 물질의 특성을 규명하는 연구 분야를 계산화학 또는 컴퓨터화학(Computational Chemistry)이라고 부른다. 이 분야는 최근에 가장 급속하게 발전하고 있는 분야로서 화학의 모든 분야와 물리학, 천문학, 생물학, 의학, 약학, 그리고 재료과학 등 인접분야에 큰 영향을 끼치면서 그 중요성과 적용 범위가 날로 확대되고 있다.
각 학교, 혹은 연구소의 계산화학 연구실에서는 계산하고자 하는 계의 복잡도에 따라서 적합한 계산 방법들을 취하고 있으며, 본 연구실에서는 크게 아래 분야들을 택하고 있다.
QM: Quantum Mechanics
ML: Machine Learning
MD: Molecular Dynamics
PI: Path Integral