단백질 상호작용(PPI) 예측을 위한 딥러닝 프로젝트입니다. GCN과 다양한 단백질 언어 모델(PLM)을 활용하여 학습 및 예측을 수행합니다.
- 작업 경로 설정: 다운로드 받은 폴더를 반드시 **실행 경로(Current Working Directory)**로 설정해주세요.
- 실행 파일:
prediction.ipynb파일을 실행하여 전체 프로세스를 진행합니다. - 결과 저장: 실행 시
biomedical폴더가 자동으로 생성되며, 모든 중간 데이터와 결과 모델이 해당 폴더에 저장됩니다.
주의사항: 코드 내부 의존성 문제로 인해, 제공된 파일들의 이름을 절대 변경하지 마십시오.
prediction.ipynb 내부에서 다음 변수들을 수정하여 실험 환경을 설정할 수 있습니다.
사용할 임베딩 모델을 선택할 수 있습니다.
ProtBERTProtT5ESM1bESM2
임베딩 벡터의 차원 축소 여부 및 차원 수를 설정합니다.
0: PCA 적용 안 함 (원본 차원 사용)256: 256차원으로 축소512: 512차원으로 축소
ProtBERT와 ProtT5 모델 사용 시 적용 가능합니다.
True: L2 정규화 적용False: 적용 안 함