Link dataset: https://huggingface.co/datasets/Skyler215/KTVIC
| Model ("MetaCLIP size"-"mT5 size") | BLEU-1 | BLEU-4 | CIDEr | METEOR | ROUGE-L |
|---|---|---|---|---|---|
| b16-small | 68.94 | 34.81 | 98.50 | 53.73 | 60.56 |
| l14-large | 69.98 | 36.77 | 103.12 | 55.19 | 62.19 |
| h14-large | 67.59 | 30.07 | 68.55 | 47.93 | 57.15 |
- Tải KTVIC dataset
- Cài đặt Java (nếu muốn evaluate CIDEr)
- Cài đặt pytorch 2.5.1 theo hướng dẫn trên website
- Cài đặt các thư viện cần thiết
pip install -r requirements.txt- Search
EDITtrong fileclip_mt5_large_img_cap.pyvà chỉnh sửa cho phù hợp - Chạy file
python clip_mt5_large_img_cap.pyModel sẽ được evaluate trên tập test của KTVIC dataset sau mỗi epoch và kết quả sẽ được in trên terminal.