Improved Unsupervised DeepFake Detection

[https://docs.google.com/presentation/d/1bYCxNCku8iaogia66flA8zTH6uOEnXrB/edit?usp=sharing&ouid=105290732960658123455&rtpof=true&sd=true]

Improved Unsupervised DeepFake Detection

This repository builds upon the original @bestalllen/Unsupervised_DF_Detection project, addressing its limitations and introducing several enhancements for more effective unsupervised DeepFake detection using deep learning.

Introduction

DeepFake videos pose significant challenges to online media integrity. This project aims to improve the state-of-the-art in unsupervised DeepFake detection by enhancing an existing approach, introducing missing stages, optimizing GPU utilization, improving feature visualization, and boosting classification accuracy through architectural changes.

Original Limitations

The baseline repository had several limitations:

Missing code for stage 3 (binary classifier training)
Inefficient GPU utilization in stage 2
Lack of t-SNE feature visualization
No use of pretrained weights on the backbone model
Required a large number of videos for testing
Used Xception as the backbone

Our Improvements

Key enhancements and fixes:

Stage 3 implementation: Built the missing code for binary classifier training.
GPU optimization: Improved GPU utilization for faster and more efficient training in stage 2.
t-SNE Visualization: Added t-SNE plotting for visualizing feature separability and cluster assignments.
Checkpointing: Implemented checkpoint saving in stage 2 for more robust training.
Clustering assignment: Modified cluster assignment logic for better alignment with the original paper ("Assign Real and Fake to the Clusters").
Architectural changes:
- Swapped Xception backbone for ConvNeXt_base with pretrained weights.
- Replaced Spearman correlation with Euclidean distance for inter-frame correlation.
- Redesigned stage 3 as a binary classifier.
- Added stage 4 for video authentication/testing.

Datasets

Preprocessing includes frame extraction and labelling:

Dataset	Real (R)	Fake (F)
FF++	1000	4000 (DF, NT, F2F, FS)
UADFV	49	49
Celeb-DF	400	800
Celeb-DF-v2	1000	5600

Results

Comparative Results

Training Set	UADFV	CelebDF	CelebDF-v2
FF++ (Baseline)	78	--	70	Baseline
FF++ (Ours)	70.41	78.80	85.88	Ours
CelebDF-v2 (Baseline)	--	--	--	Baseline
CelebDF-v2 (Ours)	89.80	--	--	Ours

Distribution Plots

Left: Original (Spearman correlation)
Right: Our improvement (Euclidean distance, ConvNeXt_base)

t-SNE Feature Visualization

Left: Epoch 0 | Right: Epoch 16

Changelog

Built missing stage 3 for binary classification
Added efficient GPU usage in stage 2
Added t-SNE visualization and checkpointing
Changed clustering assignment as per original paper
Replaced Xception with ConvNeXt_base and pretrained weights
Used Euclidean distance instead of Spearman correlation
Implemented stage 4 for authentication/testing

Getting Started

Clone the repository:

git clone https://github.com/yourusername/Improved_Unsupervised_DF_Detection.git
cd Improved_Unsupervised_DF_Detection

Install requirements:
```
pip install -r requirements.txt
```
Prepare datasets:
Follow the dataset preprocessing instructions in the Datasets section.
Run training pipeline:
Refer to the scripts for each stage. Example for stage 2:
```
python stage2_train.py --config configs/stage2.yaml
```
Visualizations and results:
Check outputs/ for plots and metrics.

References

Contact: For questions or contributions, please open an issue or submit a pull request.

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
efficientnet_pytorch		efficientnet_pytorch
lib		lib
trained_classifier_runs		trained_classifier_runs
trained_classifier_save		trained_classifier_save
README.md		README.md
confusion_matrix_convnext_base_celeb_celeb.png		confusion_matrix_convnext_base_celeb_celeb.png
confusion_matrix_convnext_base_celeb_ff.png		confusion_matrix_convnext_base_celeb_ff.png
confusion_matrix_convnext_base_celeb_uadfv.png		confusion_matrix_convnext_base_celeb_uadfv.png
confusion_matrix_convnext_base_ff_celeb.png		confusion_matrix_convnext_base_ff_celeb.png
confusion_matrix_convnext_base_ff_large_celeb.png		confusion_matrix_convnext_base_ff_large_celeb.png
confusion_matrix_convnext_base_ff_uadfv.png		confusion_matrix_convnext_base_ff_uadfv.png
confusion_matrix_convnext_base_video.png		confusion_matrix_convnext_base_video.png
confusion_matrix_xception_linear.png		confusion_matrix_xception_linear.png
confusion_matrix_xception_video.png		confusion_matrix_xception_video.png
distribution_plot_cosine_similarity_convnext_base.png		distribution_plot_cosine_similarity_convnext_base.png
distribution_plot_euclidean_distance_convnext_base.png		distribution_plot_euclidean_distance_convnext_base.png
distribution_plot_spearman_like_multiplier_6.0_convnext_base.png		distribution_plot_spearman_like_multiplier_6.0_convnext_base.png
loss.py		loss.py
model.py		model.py
requirements.txt		requirements.txt
shape_predictor_68_face_landmarks.dat		shape_predictor_68_face_landmarks.dat
stage1.py		stage1.py
stage2.py		stage2.py
stage3.py		stage3.py
stage4.py		stage4.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Improved Unsupervised DeepFake Detection

Table of Contents

Introduction

Original Limitations

Our Improvements

Datasets

Results

Comparative Results

Distribution Plots

t-SNE Feature Visualization

Changelog

Getting Started

References

About

Uh oh!

Releases

Packages

Contributors 3

Uh oh!

Languages

JohnPrice11/Unsupervised-Deep-Fake-Detection

Folders and files

Latest commit

History

Repository files navigation

Improved Unsupervised DeepFake Detection

Table of Contents

Introduction

Original Limitations

Our Improvements

Datasets

Results

Comparative Results

Distribution Plots

t-SNE Feature Visualization

Changelog

Getting Started

References

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Contributors 3

Uh oh!

Languages

Packages